ВАРИАНТ 4
Задача 1
По предприятиям легкой промышленности региона получена информация (табл.1), характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (Х, млн. руб.).
Таблица 1
X |
36 |
28 |
43 |
52 |
51 |
54 |
25 |
37 |
51 |
29 |
Y |
104 |
77 |
117 |
137 |
143 |
144 |
82 |
101 |
132 |
77 |
Требуется:
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
3. Проверить выполнение предпосылок МНК.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (a = 0,05).
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (a = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
6. Осуществить прогнозирование среднего значения показателя Y при уровне значимости a =0,1, если прогнозное значение фактора Х составит 80% от его максимального значения.
7. Представить графически: фактические и модельные значения Y, точки прогноза.
8. Составить уравнение нелинейной регрессии:
· гиперболической;
· степенной;
· показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение.
1. Уравнение линейной регрессии имеет вид: .
Значения параметров a и b линейной модели определим, используя данные таблицы 2.
Таблица 2
№ п/п |
x |
y |
y*x |
x*x |
yi - yср |
(yi - yср)2 |
xi - xср |
(xi - xср)2 |
ŷ=а+b*xi |
1 |
36 |
104 |
3744 |
1296 |
-7,40 |
54,76 |
-4,6 |
21,16 |
100,36 |
2 |
28 |
77 |
2156 |
784 |
-34,40 |
1183,36 |
-12,6 |
158,76 |
81,16 |
3 |
43 |
117 |
5031 |
1849 |
5,60 |
31,36 |
2,4 |
5,76 |
117,16 |
4 |
52 |
137 |
7124 |
2704 |
25,60 |
655,36 |
11,4 |
129,96 |
138,76 |
5 |
51 |
143 |
7293 |
2601 |
31,60 |
998,56 |
10,4 |
108,16 |
136,36 |
6 |
54 |
144 |
7776 |
2916 |
32,60 |
1062,76 |
13,4 |
179,56 |
143,56 |
7 |
25 |
82 |
2050 |
625 |
-29,40 |
864,36 |
-15,6 |
243,36 |
73,96 |
8 |
37 |
101 |
3737 |
1369 |
-10,40 |
108,16 |
-3,6 |
12,96 |
102,76 |
9 |
51 |
132 |
6732 |
2601 |
20,60 |
424,36 |
10,4 |
108,16 |
136,36 |
10 |
29 |
77 |
2233 |
841 |
-34,40 |
1183,36 |
-11,6 |
134,56 |
83,56 |
Сумма |
406 |
1114 |
47876 |
17586 |
0,00 |
6566,40 |
0,00 |
1102,40 |
|
Среднее |
40,6 |
111,4 |
4787,6 |
1758,6 |
|
|
|
|
Уравнение линейной регрессии имеет вид: ŷ = 13,96 + 2,4´ х
Интерпретировать можно лишь знак при параметре а. В этой задаче, а>0, следовательно, относительное изменение результата происходит медленнее, чем изменение фактора. Иными словами, вариация результата меньше вариации фактора – коэффициент вариации по фактору х выше коэффициента вариации для результата у: Vx >Vy.
2. Значения остатков еi рассчитаны в таблице 3. Остаток еi – расхождение между фактическим и спрогнозированным значениями величины у. Квадратный корень из этой величины называется стандартной ошибкой оценки.
Таблица 3
ei = yi - ŷ |
|ei/yi|*100% |
ei2 |
ei-ei-1 |
(ei-ei-1)2 |
ei*ei-1 |
3,64 |
3,50 |
13,25 |
- |
- |
- |
-4,16 |
5,40 |
17,31 |
-7,8 |
60,84 |
-15,1424 |
-0,16 |
0,14 |
0,03 |
4 |
16 |
0,6656 |
-1,76 |
1,28 |
3,10 |
-1,6 |
2,56 |
0,2816 |
6,64 |
4,64 |
44,09 |
8,4 |
70,56 |
-11,6864 |
0,44 |
0,31 |
0,19 |
-6,2 |
38,44 |
2,9216 |
8,04 |
9,80 |
64,64 |
7,6 |
57,76 |
3,5376 |
-1,76 |
1,74 |
3,10 |
-9,8 |
96,04 |
-14,1504 |
-4,36 |
3,30 |
19,01 |
-2,6 |
6,76 |
7,6736 |
-6,56 |
8,52 |
43,03 |
-2,2 |
4,84 |
28,6016 |
0,00 |
38,64 |
207,74 |
353,80 |
2,70 |
|
3,86 |
Остаточная сумма квадратов отклонений
Стандартная ошибка оценки Se = 5,1
Рис.1. График остатков
3. Независимость остатков проверяется с помощью критерия Дарбина – Уотсона.
Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.
Значение статистики dw найдено по промежуточным данным в таблице 3. Оценки, полученные по критерию, являются не точными, а интервальными. Верхние (d2) и нижние (d1) критические значения для уровня значимости a=0,05, k = 1, n=10 берем из таблицы d1=1,08 и d2=1,36. Перед сравнением с табличными значениями dw критерий следует преобразовать по формуле dw'= 4 – dw = 4- 1,703= 2,3. Таким образом, получается, что dw>2, что свидетельствует о наличии отрицательной корреляции.
Установив наличие автокорреляции остатков, переходят к улучшению модели. В частности, можно воспользоваться первым коэффициентом автокорреляции.
Для принятия решения о наличии или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным значением для 5%-ного уровня значимости. r(1)табл. =0,36> 0,013, следовательно, гипотеза об отсутствии автокорреляции может быть принята.
4. Значимость коэффициентов уравнения регрессии оценим с использованием t-критерия Стьюдента.
Значения t-критерия вычислим по формулам для соответствующих коэффициентов регрессии.
Коэффициент Стьюдента t для m = n- 2 = 8 степеней свободы и уровня значимости a=0,05 равен 2,3060.
Так как t – расчетное с (n – 2) степенями свободы в обоих случаях превышает t – табличное при заданном уровне значимости, то оба коэффициента регрессии считаются значимыми.
5. Рассчитаем коэффициент детерминации:
.
Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
Чем ближе R2 к 1, тем лучше качество модели.
Таким образом, вариация результата Y (объема выпуска продукции) на 96,84% объясняется вариацией фактора X (объемом капиталовложений). Качество модели очень хорошее, линейная модель хорошо аппроксимирует исходные данные, и ею можно воспользоваться для прогноза значений результативного признака.
Для проверки значимости модели регрессии используется F-критерий Фишера:
F>Fтабл= 5,32 для a=0,05, k1 =m =1, k2 = n-m-1 = n-2 =8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F>Fтабл..
Определим среднюю относительную ошибку аппроксимации:
В среднем значение ŷ для степенной модели отличаются от фактических значений на 3,864%. Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Так как ошибка аппроксимации данной модели меньше 7%, то это свидетельствует о хорошем качестве модели.
6. Пусть хпрогн= 0,8*хmax = 0,8*54= 43,2, сделаем прогноз для среднего значения показателя Y при уровни значимости a=0,1.
Стандартную ошибку предсказываемого по линии регрессии значения найдем по формуле:
;
.
Дана формула характеризует ошибку положения линии регрессии. Величина стандартной ошибки предсказываемого среднего значения у при заданном значении хпрогн достигает минимума при хпрогн = х, и возрастает по мере того, как «удаляется» от х в любом направлении.
Для прогнозируемого значения ŷх 95%-ные доверительные интервалы при заданном хпрогн определяются выражением , т.е. или ±43,11, при значении коэффициента Стьюдента ta=25,968 для m=8 степеней свободы и уровня значимости 0,1.
Прогнозное значение составит упрогн = 13,96 +2,4 ∙ 43,2 = 117,64, которое представляет собой точечный прогноз.
Прогноз линии регрессии в интервале составит:
117,64 - 43,11 £ £ 117,64+43,11 т.е.
74,53 £ £ 160,75.
7. Построим график фактических, модельных значений Y, точек прогноза.
Для линейной модели регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии (обозначим ее U):
Коэффициент Стьюдента ta для m=8 степеней свободы (m=n-1) и уровня значимости 0,1 равен 1,8595. Тогда:
Таким образом, прогнозное значение = 117,64 будет находиться между верхней границей, равной 117,64+9,974 = 127,6, и нижней границей, равной 117,64-9,974 = 107,7. График исходных данных и результаты моделирования приведены на рис. 2.
Рис.2. График модели парной регрессии зависимости объема выпуска продукции от объема капиталовложения.
8. Составим уравнение нелинейной регрессии:
а)Построение гиперболической функции.
Уравнение гиперболической функции: ŷ = a+b/x
Произведем линеаризацию модели путем замены Х = 1/х.
В результате получим линейное уравнение: ŷ = a+b ∙Х
Рассчитаем его параметры по данным таблицы 4:
Таблица 4
№ п/п |
x |
y |
Х |
уХ |
Х2 |
у-уср |
(у-уср)2 |
ŷ=a+b*Xi |
ei = yi - ŷ |
(y-ŷ)2 |
|ei/yi|*100% |
1 |
36 |
104 |
0,0278 |
2,8889 |
0,0008 |
-7,4 |
54,76 |
107,26 |
-3,2645 |
10,6567 |
3,1389 |
2 |
28 |
77 |
0,0357 |
2,7500 |
0,0013 |
-34,4 |
1183,36 |
81,12 |
-4,1224 |
16,9945 |
5,3538 |
3 |
43 |
117 |
0,0233 |
2,7209 |
0,0005 |
5,6 |
31,36 |
122,16 |
-5,1593 |
26,6188 |
4,4097 |
4 |
52 |
137 |
0,0192 |
2,6346 |
0,0004 |
25,6 |
655,36 |
135,42 |
1,5826 |
2,5046 |
1,1552 |
5 |
51 |
143 |
0,0196 |
2,8039 |
0,0004 |
31,6 |
998,56 |
134,18 |
8,8246 |
77,8739 |
6,1711 |
6 |
54 |
144 |
0,0185 |
2,6667 |
0,0003 |
32,6 |
1062,76 |
137,76 |
6,2365 |
38,8939 |
4,3309 |
7 |
25 |
82 |
0,0400 |
3,2800 |
0,0016 |
-29,4 |
864,36 |
67,01 |
14,9943 |
224,8277 |
18,2857 |
8 |
37 |
101 |
0,0270 |
2,7297 |
0,0007 |
-10,4 |
108,16 |
109,74 |
-8,7374 |
76,3415 |
8,6509 |
9 |
51 |
132 |
0,0196 |
2,5882 |
0,0004 |
20,6 |
424,36 |
134,18 |
-2,1754 |
4,7323 |
1,6480 |
10 |
29 |
77 |
0,0345 |
2,6552 |
0,0012 |
-34,4 |
1183,36 |
85,18 |
-8,1790 |
66,8954 |
10,6220 |
Сумма |
406 |
1114 |
0,2652 |
27,7182 |
0,0076 |
6566,4 |
1114 |
0,0000 |
546,3394 |
63,7661 |
|
Среднее |
40,6 |
111,4 |
0,0265 |
2,7718 |
0,0008 |
6,3766 |
Получим следующее уравнение гиперболической модели:
ŷ= 198,76-3293,9/х.
На рис. 3 представлен график гиперболической функции.
Рис.3. График гиперболической функции
б)Построение степенной функции.
Уравнение степенной модели имеет вид: ŷ = a+xb.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg ŷ = lg a +b lg x.
Таблица 5
№ п/п |
Факт Y(t) |
lg (Y) |
Переменная Х(t) |
lg(x) |
1 |
104 |
2,0170 |
36 |
1,5563 |
2 |
77 |
1,8865 |
28 |
1,4472 |
3 |
117 |
2,0682 |
43 |
1,6335 |
4 |
137 |
2,1367 |
52 |
1,7160 |
5 |
143 |
2,1553 |
51 |
1,7076 |
6 |
144 |
2,1584 |
54 |
1,7324 |
7 |
82 |
1,9138 |
25 |
1,3979 |
8 |
101 |
2,0043 |
37 |
1,5682 |
9 |
132 |
2,1206 |
51 |
1,7076 |
10 |
77 |
1,8865 |
29 |
1,4624 |
Сумма |
1114 |
20,3473 |
406 |
15,9290 |
Среднее |
111,4 |
2,0347 |
40,6 |
1,5929 |
Обозначим Y= lg ŷ, X= lg x, А= lg а. Тогда уравнение примет вид Y= A+ bX – линейное уравнение регрессии.
Рассчитаем его параметры, используя данные табл. 6.
Таблица 6
№ п/п |
y |
Y |
x |
X |
YX |
X2 |
ŷ=10A ´ xb= =4,661´ x 0,8577 |
ei = yi - ŷ |
|ei/yi|*100% |
ei2 |
1 |
104 |
2,0170 |
36 |
1,5563 |
3,1391 |
2,4221 |
100,773 |
3,23 |
3,10 |
10,41 |
2 |
77 |
1,8865 |
28 |
1,4472 |
2,7301 |
2,0943 |
81,233 |
-4,23 |
5,50 |
17,92 |
3 |
117 |
2,0682 |
43 |
1,6335 |
3,3783 |
2,6682 |
117,363 |
-0,36 |
0,31 |
0,13 |
4 |
137 |
2,1367 |
52 |
1,7160 |
3,6666 |
2,9447 |
138,141 |
-1,14 |
0,83 |
1,30 |
5 |
143 |
2,1553 |
51 |
1,7076 |
3,6804 |
2,9158 |
135,859 |
7,14 |
4,99 |
50,99 |
6 |
144 |
2,1584 |
54 |
1,7324 |
3,7391 |
3,0012 |
142,686 |
1,31 |
0,91 |
1,73 |
7 |
82 |
1,9138 |
25 |
1,3979 |
2,6754 |
1,9542 |
73,708 |
8,29 |
10,11 |
68,75 |
8 |
101 |
2,0043 |
37 |
1,5682 |
3,1432 |
2,4593 |
103,170 |
-2,17 |
2,15 |
4,71 |
9 |
132 |
2,1206 |
51 |
1,7076 |
3,6210 |
2,9158 |
135,859 |
-3,86 |
2,92 |
14,89 |
10 |
77 |
1,8865 |
29 |
1,4624 |
2,7588 |
2,1386 |
83,715 |
-6,71 |
8,72 |
45,09 |
Сумма |
1114 |
20,3473 |
406 |
15,9290 |
32,5320 |
25,5141 |
|
1,49 |
39,55 |
215,92 |
Среднее |
111,4 |
2,0347 |
40,6 |
1,5929 |
3,2532 |
2,5514 |
|
|
3,96 |
21,59 |
Уравнение регрессии будет иметь вид: Y= 0,6685+0,8577 ´ Х.
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
ŷ = 100,6685 ´ х0,8577.
Получим уравнение степенной модели регрессии:
ŷ = 4,6611´ х0,8577.
На рис. 4 представлен график степенной функции.
Рис.4. график степенной функции
в)Построение показательной функции.
Уравнение показательной кривой: ŷ =а ∙ bх.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: lg ŷ = lg a + lg x ∙ b.
Обозначим Y= lg ŷ, B= lg b, A= lg a.
Получим линейное уравнение регрессии: Y = A+B∙x.
Рассчитаем его параметры, используя данные табл. 7.
Уравнение будет иметь вид: Y= 1,6402 – 0,0097х
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
ŷ =101,6402´(100,0097)х = 43,68´ 1,023х.
Таблица 7
№ п/п |
y |
Y |
x |
Yx |
x2 |
Y-Yср |
(Y-Yср)2 |
x-xср |
(x-xср)2 |
ŷ=10A´(10B)x= =43,68´1,023x |
ei = yi - ŷ |
ei2 |
|ei/yi|*100% |
1 |
104 |
2,017 |
36 |
72,613 |
1296 |
-0,018 |
0,0003 |
-4,6 |
21,16 |
99,039 |
4,961 |
24,6133 |
4,7704 |
2 |
77 |
1,886 |
28 |
52,822 |
784 |
-0,148 |
0,0220 |
-12,6 |
158,76 |
82,566 |
-5,566 |
30,9785 |
7,2284 |
3 |
117 |
2,068 |
43 |
88,932 |
1849 |
0,033 |
0,0011 |
2,4 |
5,76 |
116,127 |
0,873 |
0,7613 |
0,7458 |
4 |
137 |
2,137 |
52 |
111,109 |
2704 |
0,102 |
0,0104 |
11,4 |
129,96 |
142,500 |
-5,500 |
30,2526 |
4,0148 |
5 |
143 |
2,155 |
51 |
109,922 |
2601 |
0,121 |
0,0145 |
10,4 |
108,16 |
139,296 |
3,704 |
13,7165 |
2,5899 |
6 |
144 |
2,158 |
54 |
116,552 |
2916 |
0,124 |
0,0153 |
13,4 |
179,56 |
149,131 |
-5,131 |
26,3234 |
3,5629 |
7 |
82 |
1,914 |
25 |
47,845 |
625 |
-0,121 |
0,0146 |
-15,6 |
243,36 |
77,121 |
4,879 |
23,8032 |
5,9498 |
8 |
101 |
2,004 |
37 |
74,160 |
1369 |
-0,030 |
0,0009 |
-3,6 |
12,96 |
101,317 |
-0,317 |
0,1003 |
0,3136 |
9 |
132 |
2,121 |
51 |
108,149 |
2601 |
0,086 |
0,0074 |
10,4 |
108,16 |
139,296 |
-7,296 |
53,2377 |
5,5276 |
10 |
77 |
1,886 |
29 |
54,708 |
841 |
-0,148 |
0,0220 |
-11,6 |
134,56 |
84,465 |
-7,465 |
55,7240 |
9,6946 |
Сумма |
1114 |
20,347 |
406 |
836,813 |
17586 |
|
0,1085 |
|
1102,4 |
|
-16,859 |
259,5109 |
44,3977 |
Среднее |
111,4 |
2,035 |
40,6 |
83,681 |
1758,6 |
|
|
|
110,24 |
|
|
|
4,4398 |
Рис.5. График показательной функции
9. Значения коэффициента детерминации и средней относительной ошибки аппроксимации для рассмотренных моделей находим из расчетных значений таблиц 4, 6, 7. Для выбора лучшей модели построим сводную таблицу результатов.
Модель |
параметры |
|
Коэффициент детерминации
|
Средняя относительная ошибка
|
|
Гиперболическая |
0,917 |
6,38 |
Степенная |
0,967 |
3,96 |
Показательная |
0,961 |
4,44 |
Коэффициент детерминации показывает, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе R к 1, тем лучше качество модели. Значит, по этому параметру лучшей моделью является степенная (R2 = 0,967).
Средняя относительная ошибка аппроксимации показывает, на сколько в среднем расчетные значения ŷ для модели отличаются от фактических значений. Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Значит, по этому параметру лучшей моделью является степенная (Ēотн = 3,96).
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1. Афанасьев В.Н. Эконометрика: Учебник / В. Н. Афанасьев, М. М. Юзбашев, Т. И. Гуляева; Под ред. В.Н.Афанасьева. - М.: Финансы и статистика, 2005. - 256с.
2. Балдин К.В. Эконометрика: Учебное пособие / К. В. Балдин, О. Ф. Быстров, М. М. Соколов. - 2-е изд.; перераб. и доп. - М.: ЮНИТИ, 2004. - 254с.
3. Кремер Н.Ш. Эконометрика: Учебник / Н. Ш. Кремер, Б. А. Путко; [ВЗФЭИ]; Под ред. Н.Ш.Кремера. - М.: ЮНИТИ, 2002. - 311с.
4. Магнус Я.Р. Эконометрика. Начальный курс: Учебник / Я. Р. Магнус, П. К. Катышев, А. А. Пересецкий. - 6-е изд.; перераб. и доп. - М.: Дело, 2004. - 576с.
5. Тихомиров Н.П. Эконометрика: Учебник / Н. П. Тихомиров, Е. Ю. Дорохина. - М.: Экзамен, 2003. - 512с.
6. Эконометрика: Учебник / Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2001. - 344с.