РЕШЕНИЕ:
1). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Таблица 1
№ набл |
y |
x |
1 |
121 |
72 |
2 |
84 |
52 |
3 |
119 |
73 |
4 |
117 |
74 |
5 |
129 |
76 |
6 |
128 |
79 |
7 |
102 |
54 |
8 |
111 |
68 |
9 |
112 |
73 |
10 |
98 |
64 |
Для вычисления параметров модели следует воспользоваться функцией регрессии в М.Excel:
В полеченных «выводов итогов» видно: что
a = 15.93; b = 1.40
|
Коэффициенты |
Y-пересечение |
15,9269103 |
Переменная X 1 |
1,403986711 |
1. следовательно при объеме капиталовложений = 0, объем выпуска продукции составляет 15,93 млн.руб.
2. следовательно при увеличении объема капиталовложений на 1 млн.руб. объем выпуска продукции увеличиться на 1,40 млн.руб.
2). Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
и т.д.
Таблица 2
ВЫВОД ОСТАТКОВ |
|||||
Наблюдение |
|
Предсказанное,
|
Остатки, |
|
|
1 |
72 |
121 |
117,01 |
3,99 |
15,92 |
2 |
52 |
84 |
88,93 |
-4,93 |
24,30 |
3 |
73 |
119 |
118,42 |
0,58 |
0,34 |
4 |
74 |
117 |
119,82 |
-2,82 |
7,95 |
5 |
76 |
129 |
122,63 |
6,37 |
40,58 |
6 |
79 |
128 |
126,84 |
1,16 |
1,35 |
7 |
54 |
102 |
91,74 |
10,26 |
105,27 |
8 |
68 |
111 |
111,40 |
-0,40 |
0,16 |
9 |
73 |
112 |
118,42 |
-6,42 |
41,22 |
10 |
64 |
98 |
105,78 |
-7,78 |
60,53 |
ИТОГО |
685 |
1121 |
1120,99 |
0 |
297,61 |
Дисперсия остатков равна
Рис. 2
3). Проверить выполнение предпосылок МНК.
Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты.
Оценим адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7—3,7).
Модель является адекватной, если математическое ожидание значений остаточного ряда случайны, независимы и подчинены нормальному закону распределения.[1]
3.1. Проверим независимость (отсутствие автокорреляции) с помощью d – критерия Дарбина – Уотсона по формуле:
Используем данные табл. 3
Таблица 3
Наблюдение |
|
|
||
1 |
3,99 |
15,92 |
- |
- |
2 |
-4,93 |
24,30 |
-8,92 |
79,57 |
3 |
0,58 |
0,34 |
5,51 |
30,36 |
4 |
-2,82 |
7,95 |
-3,4 |
11,56 |
5 |
6,37 |
40,58 |
9,19 |
84,46 |
6 |
1,16 |
1,35 |
-5,21 |
27,14 |
7 |
10,26 |
105,27 |
9,1 |
82,81 |
8 |
-0,40 |
0,16 |
-10,66 |
113,64 |
9 |
-6,42 |
41,22 |
-6,02 |
36,24 |
10 |
-7,78 |
60,53 |
-1,36 |
1,85 |
Сумма |
0 |
297,61 |
|
467,62 |
,
Т.к. расчетное значение d попадает в интервал от d2 до 2 (рис. 4.7). Свойство независимости выполняется. Следовательно, модель по этому критерию адекватна.
Анализ независимости с помощью критерия Дарбина – Уотсона Рис. 3
1) |
|
|
2) |
|
3) |
|
4) |
|
|
|
|
|
|
|
|
|
|
|
|
|
d1 |
d2 |
|
2 |
|
|
4 |
||
свойство не выполняется |
применять другой критерий |
свойство выполняется |
преобразовать dn=4-d |
||||||
0 |
d1 |
d2 |
|
2 |
|
|
4 |
||
|
1,08 |
1,36 |
1,5712 |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|r(1)|<0,36 |
|
|
|
|
|
3.2. Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек. P > [2/3(n-2) – 1, 96 – (16n-29)/90]
Количество поворотных точек равно 6 (рис. 4).
Рис. 4
Неравенство выполняется (6 > 2). Следовательно, свойство случайности выполняется. Модель по этому критерию адекватна.
3.3. Соответствие ряда остатков нормальному закону распределения определим при помощи RS – критерия:
, где
- максимальный уровень ряда остатков,
- минимальный уровень ряда остатков,
- среднеквадратическое отклонение,
,
Расчетное значение попадает в интервал (2,7-3,7), следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
3.4. Проверка равенства нулю математического ожидания уровней ряда остатков.
В нашем случае , поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется.
3.5. Обнаружение гетероскедастичности.
Чтобы оценить нарушение гомоскедастичности по тесту Гольфельда-Квандта, необходимо упорядочить имеющиеся наблюдения по мере возрастания, разделить совокупности на две группы, определить уравнения регрессии (с помощью Excel), определить остаточные суммы квадратов для регрессии, вычислить отношение между ними и сравнить с F- критерием.
х1 |
У1 |
ŷ1 |
ε²1 |
|
х2 |
У2 |
ŷ2 |
ε²2 |
52 |
84 |
95,71 |
137,11 |
|
73 |
119 |
116,23 |
7,67 |
54 |
102 |
97,68 |
18,70 |
|
73 |
112 |
116,23 |
17,90 |
64 |
98 |
107,51 |
90,41 |
|
74 |
117 |
118,62 |
2,61 |
68 |
111 |
111,44 |
0,19 |
|
76 |
129 |
123,38 |
31,53 |
72 |
121 |
115,37 |
31,65 |
|
79 |
128 |
130,54 |
6,44 |
|
|
сумма |
278,06 |
|
|
|
сумма |
66,15 |
Используя надстройки Excel, найдем F – критерий равный 6,389.
Наблюдаемое F = 4,203 меньше критического, что означает, что модель гомоскедастична.
В таблице 4 собраны данные анализа ряда остатков.
Анализ ряда остатков Таблица 4
Проверяемое свойство |
Используемые статистики |
Граница |
Вывод |
||
наименование |
значение |
нижняя |
верхняя |
||
Независимость |
d – критерий Дарбина-Уотсона |
1,36 |
2 |
адекватна |
|
Случайность |
Критерий пиков (поворотных точек) |
6 > 2 |
2 |
адекватна |
|
Нормальность |
RS – критерий |
2,96 |
2,7 |
3,7 |
адекватна |
Среднее = 0 ? |
t – статистика Стьюдента |
0,000 |
-2,179 |
2,179 |
адекватна |
Вывод: модель статистически адекватна |
4). Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента
Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t – критерия (t – статистики) для соответствующих коэффициентов регрессии:
Где
Расчетная таблица
Таблица 5
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
Y-пересечение |
а0 |
15,927 |
15,352 |
1,037 |
Объем капиталовложений, млн. руб.(X) |
а1 |
1,404 |
0,222 |
6,315 |
Сравнивая расчетное значение с табличным значением (при n-2 и степеней свободы 0,05 табличное равно 2,306004). Делаем вывод о том, что фактор а0 следует исключить из модели, так как расчетное значение t меньше табличного (при этом качество модели не ухудшится).
5). Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Коэффициент множественной корреляции (индекс корреляции), возведенный в квадрат (R2), называется коэффициентом детерминации.
Таблица 6
Расчет коэффициента детерминации
Наблюдение |
|
||
1 |
15,92 |
8,9 |
79,21 |
2 |
24,30 |
-28,1 |
789,61 |
3 |
0,34 |
6,9 |
47,61 |
4 |
7,95 |
4,9 |
24,01 |
5 |
40,58 |
16,9 |
285,61 |
6 |
1,35 |
15,9 |
252,81 |
7 |
105,27 |
-10,1 |
102,01 |
8 |
0,16 |
-1,1 |
1,21 |
9 |
41,22 |
-0,1 |
0,01 |
10 |
60,53 |
-14,1 |
198,81 |
Сумма |
297,61 |
0,0 |
1780,9 |
Чем ближе R2 к 1, тем качество модели лучше.
Вариация результата Y (объема выпуска продукции) на 83,29 % объясняется вариацией фактора X (объемом капиталовложений).
Для проверки значимости модели регрессии используется F – критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение больше табличного при заданном уровне значимости, то модель считается значимой.
, где k – количество факторов, включенных в модель.
F > Fтаб. =5, 32 для a = 0, 05; k1 = 1, k2 = 8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб.
Оценим точность модели на основе использования средней относительной ошибки аппроксимации.
Для оценки точности полученной модели будем использовать показатель относительной ошибки аппроксимации, который вычисляется по формуле:
, где
Таблица 7
Расчет относительной ошибки аппроксимации
Наблюдение |
Y |
Предсказанное Y |
|
|
1 |
121 |
117,01 |
3,99 |
0,03 |
2 |
84 |
88,93 |
-4,93 |
0,06 |
3 |
119 |
118,42 |
0,58 |
0,005 |
4 |
117 |
119,82 |
-2,82 |
0,02 |
5 |
129 |
122,63 |
6,37 |
0,05 |
6 |
128 |
126,84 |
1,16 |
0,01 |
7 |
102 |
91,74 |
10,26 |
0,10 |
8 |
111 |
111,40 |
-0,40 |
0,00 |
9 |
112 |
118,42 |
-6,42 |
0,06 |
10 |
98 |
105,78 |
-7,78 |
0,08 |
Сумма |
1121 |
1120,99 |
0 |
0,41 |
В среднем расчетные значения предсказанного у для линейной модели отличаются от фактических значений на 4,13 %.
Если ошибка, вычисленная по формуле, не превосходит 15%, точность модели считается приемлемой.[2]
6). Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.
Прогнозное значение Х = 79*80 % = 63,2
Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии
ожидаемой величины фактора х.
Используя данные таблицы 2, найдем величину отклонения от линии регрессии.
Коэффициент Стьюдента для m = 8 степеней свободы (m = n-2) и уровня значимости равен 3,3554.
Таким образом, прогнозное значение будет находиться между верхней границей, равной 104,6588 + 21,8246 = 126,4834 и нижней границей, равной 104,6588 - 21,8246 = 82,8342.
Эластичность линейной модели равна
На 85,79% изменяется Y (объема выпуска продукции) при изменении фактора X (объемом капиталовложений) на один процент.
Преобразуем график подбора (рис. 1), дополнив его данными прогноза.
Рис. 5
8). Составить уравнения нелинейной регрессии:
· гиперболической;
· степенной;
· показательной.
Привести графики построенных уравнений регрессии.
8.1. Составить уравнения нелинейной регрессии гиперболической.
Уравнение гиперболической функции
Произведем линеаризацию модели путем замены В результате получим линейное уравнение
Рассчитаем его параметры по данным таблицы 8.
Таблица 8
Гиперболическая модель |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Наблюдение |
x |
y |
X |
yX |
X^2 |
|ε/y|*100% |
|||||
1 |
72 |
121 |
0,0139 |
1,6806 |
0,0001929 |
8,9 |
79,21 |
117,551 |
3,449 |
11,899 |
2,851 |
2 |
52 |
84 |
0,0192 |
1,6154 |
0,0003698 |
-28,1 |
789,61 |
87,861 |
-3,861 |
14,911 |
4,597 |
3 |
73 |
119 |
0,0137 |
1,6301 |
0,0001877 |
6,9 |
47,61 |
118,608 |
0,392 |
0,154 |
0,329 |
4 |
74 |
117 |
0,0135 |
1,5811 |
0,0001826 |
4,9 |
24,01 |
119,637 |
-2,637 |
6,953 |
2,254 |
5 |
76 |
129 |
0,0132 |
1,6974 |
0,0001731 |
16,9 |
285,61 |
121,613 |
7,387 |
54,564 |
5,726 |
6 |
79 |
128 |
0,0127 |
1,6203 |
0,0001602 |
15,9 |
252,81 |
124,390 |
3,610 |
13,030 |
2,820 |
7 |
54 |
102 |
0,0185 |
1,8889 |
0,0003429 |
-10,1 |
102,01 |
91,820 |
10,180 |
103,632 |
9,980 |
8 |
68 |
111 |
0,0147 |
1,6324 |
0,0002163 |
-1,1 |
1,21 |
113,010 |
-2,010 |
4,040 |
1,811 |
9 |
73 |
112 |
0,0137 |
1,5342 |
0,0001877 |
-0,1 |
0,01 |
118,608 |
-6,608 |
43,665 |
5,900 |
10 |
64 |
98 |
0,0156 |
1,5313 |
0,0002441 |
-14,1 |
198,81 |
107,902 |
-9,902 |
98,042 |
10,104 |
Сумма |
685 |
1121 |
0,1487 |
16,412 |
0,0022573 |
|
1 780,9 |
1121,0 |
0,00 |
350,888 |
46,373 |
Среднее |
68,5 |
112,1 |
0,01487 |
1,6412 |
0,0002257 |
|
|
|
|
|
4,637 |
Получим следующее уравнение гиперболической модели:
Связь между показателем у и фактором х можно считать достаточно сильной.
Индекс детерминации:
Вариация результата Y (объема выпуска продукции) на 80,30% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F- критерий Фишера:
F > Fтаб. =5, 32 для a = 0, 05; k1 = 1, k2 = 8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб.
Средняя относительная ошибка
В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 4,64%.
Эластичность гиперболической модели равна
На 71,42% изменяется Y (объема выпуска продукции) при изменении фактора X (объемом капиталовложений) на один процент.
Рис. 6
Гиперболическая модель
8.2. Составить уравнения нелинейной регрессии степенной.
Уравнение степенной модели имеет вид:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Таблица 9
Логарифмирование
Наблюдение |
y |
lg(y) |
x |
lg(x) |
1 |
121 |
2,0828 |
72 |
1,8573 |
2 |
84 |
1,9243 |
52 |
1,7160 |
3 |
119 |
2,0755 |
73 |
1,8633 |
4 |
117 |
2,0682 |
74 |
1,8692 |
5 |
129 |
2,1106 |
76 |
1,8808 |
6 |
128 |
2,1072 |
79 |
1,8976 |
7 |
102 |
2,0086 |
54 |
1,7324 |
8 |
111 |
2,0453 |
68 |
1,8325 |
9 |
112 |
2,0492 |
73 |
1,8633 |
10 |
98 |
1,9912 |
64 |
1,8062 |
Сумма |
1121 |
20,4630 |
685 |
18,3187 |
Среднее |
112,1 |
2,0463 |
68,5 |
1,8319 |
Обозначим
Тогда уравнение примет вид: линейное уравнение регрессии.
Рассчитаем его параметры, используя данные таблицы 10.
Таблица 10
|
|
Степенная модель |
|
|||||||
|
|
|
|
|
|
|
||||
Наблюдение |
y |
Y |
x |
X |
Y X |
X^2 |
|ε/y|*100% |
|||
1 |
121 |
2,0828 |
72 |
1,8573 |
3,86842 |
3,4497 |
116,862 |
4,138 |
3,420 |
17,122 |
2 |
84 |
1,9243 |
52 |
1,7160 |
3,30207 |
2,9447 |
88,874 |
-4,874 |
5,802 |
23,754 |
3 |
119 |
2,0755 |
73 |
1,8633 |
3,86741 |
3,4720 |
118,226 |
0,774 |
0,650 |
0,599 |
4 |
117 |
2,0682 |
74 |
1,8692 |
3,86592 |
3,4940 |
119,587 |
-2,587 |
2,211 |
6,694 |
5 |
129 |
2,1106 |
76 |
1,8808 |
3,96963 |
3,5375 |
122,301 |
6,699 |
5,193 |
44,882 |
6 |
128 |
2,1072 |
79 |
1,8976 |
3,99870 |
3,6010 |
126,350 |
1,650 |
1,289 |
2,724 |
7 |
102 |
2,0086 |
54 |
1,7324 |
3,47969 |
3,0012 |
91,741 |
10,259 |
10,058 |
105,250 |
8 |
111 |
2,0453 |
68 |
1,8325 |
3,74807 |
3,3581 |
111,376 |
-0,376 |
0,338 |
0,141 |
9 |
112 |
2,0492 |
73 |
1,8633 |
3,81835 |
3,4720 |
118,226 |
-6,226 |
5,559 |
38,765 |
10 |
98 |
1,9912 |
64 |
1,8062 |
3,59651 |
3,2623 |
105,837 |
-7,837 |
7,997 |
61,425 |
Сумма |
1121 |
20,4630 |
685 |
18,3187 |
37,5148 |
33,5923 |
|
1,621 |
42,52 |
301,355 |
Среднее |
112,1 |
2,0463 |
68,5 |
1,8319 |
3,7515 |
3,3592 |
|
|
|
|
Перейдем к исходным переменным x и y:
Получим уравнение степенной модели регрессии:
Определим индекс корреляции:
Связь между показателем у и фактором х можно считать достаточно сильной.
Коэффициент детерминации равен 0,8308:
Вариация результата Y (объема выпуска продукции) на 83,08% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F- критерий Фишера:
F > Fтаб. =5, 32 для a = 0,05; k1 = 1, k2 = 8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб.
Средняя относительная ошибка
В среднем расчетные значения для степенной модели отличаются от фактических значений на 4,25%.
Эластичность степенной модели равна
На 84,0% изменяется Y (объема выпуска продукции) при изменении фактора X (объемом капиталовложений) на один процент.
Рис. 7
Степенная модель
8.3. Составить уравнения нелинейной регрессии показательной.
Уравнение показательной кривой:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:
Обозначим
Получим линейное уравнение регрессии:
Рассчитаем его параметры, используя данные таблицы 11.
Перейдем к исходным переменным, выполнив потенцирование данного уравнения:
Определим индекс корреляции:
Связь между показателем у и фактором х можно считать сильной.
Коэффициент детерминации равен 0,7708.
Вариация результата Y (объема выпуска продукции) на 77,08% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F- критерий Фишера:
F > Fтаб. =5, 32 для a = 0,05; k1 = 1, k2 = 8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб.
Средняя относительная ошибка
В среднем расчетные значения для показательной модели отличаются от фактических значений на 4,82%.
Рис. 8
Показательная модель
Таблица 11
Показательная модель |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Наблюдение |
y |
У |
x |
Ух |
x^2 |
|ε/y|*100% |
|||||||
1 |
121 |
2,0828 |
72 |
149,96 |
5184 |
0,0365 |
0,0013 |
3,5 |
12,25 |
112,95 |
64,81 |
8,051 |
6,653 |
2 |
84 |
1,9243 |
52 |
100,06 |
2704 |
-0,1220 |
0,0149 |
-16,5 |
272,25 |
87,24 |
10,47 |
-3,236 |
3,852 |
3 |
119 |
2,0755 |
73 |
151,51 |
5329 |
0,0293 |
0,0009 |
4,5 |
20,25 |
114,42 |
21,00 |
4,582 |
3,851 |
4 |
117 |
2,0682 |
74 |
153,05 |
5476 |
0,0219 |
0,0005 |
5,5 |
30,25 |
115,91 |
1,20 |
1,095 |
0,936 |
5 |
129 |
2,1106 |
76 |
160,40 |
5776 |
0,0643 |
0,0041 |
7,5 |
56,25 |
118,94 |
101,24 |
10,062 |
7,800 |
6 |
128 |
2,1072 |
79 |
166,47 |
6241 |
0,0609 |
0,0037 |
10,5 |
110,25 |
123,64 |
19,03 |
4,363 |
3,408 |
7 |
102 |
2,0086 |
54 |
108,46 |
2916 |
-0,0377 |
0,0014 |
-14,5 |
210,25 |
89,52 |
155,78 |
12,481 |
12,237 |
8 |
111 |
2,0453 |
68 |
139,08 |
4624 |
-0,0010 |
0,0000 |
-0,5 |
0,25 |
107,26 |
13,97 |
3,738 |
3,368 |
9 |
112 |
2,0492 |
73 |
149,59 |
5329 |
0,0029 |
0,0000 |
4,5 |
20,25 |
114,42 |
5,85 |
-2,418 |
2,159 |
10 |
98 |
1,9912 |
64 |
127,44 |
4096 |
-0,0551 |
0,0030 |
-4,5 |
20,25 |
101,86 |
14,91 |
-3,861 |
3,940 |
Сумма |
1121 |
20,4630 |
685 |
1406,04 |
47 675 |
|
0,0299 |
|
752,50 |
|
408,26 |
34,857 |
48,20 |
Среднее |
112,1 |
2,0463 |
68,5 |
140,604 |
4 767,5 |
|
|
|
|
|
40,826 |
|
4,82 |
Для выбора лучшей модели построим сводную таблицу результатов (табл. 12).
Таблица 12
параметры/модель |
Коэффициент детерминации R^2 |
F - критерий Фишера |
Индекс корреляции рxy |
Средняя относительная ошибка |
|
Линейная |
0,8329 |
39,88 |
0,9126 |
4,13 |
|
Гиперболическая |
0,8030 |
32,61 |
0,8961 |
4,64 |
|
Степенная |
0,8308 |
39,29 |
0,9115 |
4,25 |
|
Показательная |
0,7708 |
26,9 |
0,8779 |
4,82 |
Все модели имеют примерно одинаковые характеристики, но большее значение F – критерия Фишера и большее значение коэффициента R2 имеет линейная модель. Её можно взять в качестве лучшей для построения прогноза.
[1] Орлова И.В. Экономико-математическое моделирование. Практическое пособие по решению задач - М.: ВЗФЭИ. Вузовский учебник, 2004.
[2] Копр по ЭММ, http://62.117.66.200/repository/{1962E801-3231-4BB1-BE75-6D0AF7088CFB}/main3.htm