ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КОНТРОЛЬНАЯ РАБОТА
студента 3 курса
по дисциплине «Эконометрика»
Вариант № 22
Задание I.
Номер |
Номер наблюдения, t |
||||||||
показателя |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
42: Y(t) |
65 |
67 |
63 |
60 |
56 |
63 |
57 |
53 |
51 |
Требуется:
1) определить наличие тренда Y(t);
2) построить линейную модель Y(t) = a0 + a1 * t, параметры которой оценить с помощью МНК;
3) оценить адекватность построенных моделей на основе исследования:
а) случайности остаточной компоненты по критерию пиков;
б) независимости уровней ряда остатков по d-критерию (в качестве критических использовать уровни d1 = 1,08 и d2 = 1,36 ) или по первому коэффициенту корреляции, критический уровень которого r(1) = 0,36;
в) нормальности распределения остаточной компоненты по R/S-критерию с критическими уровнями 2,7 – 3,7;
4) для оценки точности использовать среднеквадратическое отклонение и среднюю по модулю относительную ошибку;
5) построить точечный и интервальный прогнозы на два шага вперед (для вероятности Р = 70% использовать коэффициент t a,n = 1,11).
Решение:
1) Наличие тренда
Визуальный анализ графика динамики ряда показывает наличие убывающей тенденции (пунктир). Вывод: возможно существование линейного тренда (тенденции среднего текущего значения).
Для проверки этого предположения воспользуемся методом Фостера-Стьюарта:
а) построим ряды дополнительных переменных сравнения
Ut = 1, если текущее значение Yt больше всех предыдущих членов ряда; иначе Ut = 0
Lt = 1, если текущее значение Yt меньше всех предыдущих членов ряда; иначе Lt = 0
а также: St = Ut + Lt и Dt = Ut - Lt
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
Yt |
65 |
67 |
63 |
60 |
56 |
53 |
57 |
53 |
51 |
сумма |
Ut |
— |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
уровней |
Lt |
— |
0 |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
S, D |
St |
— |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
6 |
Dt |
— |
1 |
-1 |
-1 |
-1 |
-1 |
0 |
0 |
-1 |
-4 |
б) вычислим значения t-статистик Стьюдента для величин S и D
t S = | S - m | / s1
t D = | D | / s2
где m , s1 и s2 – табличные значения для соответственно математического ожидания величины S и среднеквадратических отклонений для величин S и D.
Принимая m = 3,858; s1 = 1,288 и s2 = 1,964 (из курса лекций) получим t S = 1,663 и t D = 2,037
в) сравним полученные значения с табличным значением t-критерия Стьюдента
Принимая табличное значение критерия Стьюдента t (1-a)=0,9 k=8 = 1,8595 получим
t D = 2,037 >1,8595 - тренд есть;
t S = 1,663 < 1,8595 - тенденция в дисперсии отсутствует (т.е. дисперсия остатков гомоскедастична, следовательно, выполняется предпосылка для использования традиционного метода наименьших квадратов).
2) Линейная модель тренда
Так как модель Y(t) = a0 + a1 * t линейна относительно параметров a0 и a1 , то для их оценки применим метод наименьших квадратов (традиционный):
a0 = yср – a1 * tср
a1 = ånt=1 ( Yt - yср ) * ( t - tср ) / ånt=1 ( t - tср ) 2
yср = ( ånt=1 Yt ) / n
tср = ( ånt=1 t ) / n
где: yср, tср – средние значения;
Yt, t – текущие значения;
n – длина (количество уровней) ряда.
ånt=1 – операция суммирования значений уровней с номером t в диапазоне от 1 до n.
Результаты промежуточных расчетов приведены в таблице 1.
Таблица 1
t |
Yt |
t - tср |
( t – tср )2 |
Yt -Yср |
(t - tср)*( Yt -Yср) |
1 |
65 |
-4 |
16 |
6.67 |
-26.67 |
2 |
67 |
-3 |
9 |
8.67 |
-26.00 |
3 |
63 |
-2 |
4 |
4.67 |
-9.33 |
4 |
60 |
-1 |
1 |
1.67 |
-1.67 |
5 |
56 |
0 |
0 |
-2.33 |
0.00 |
6 |
53 |
1 |
1 |
-5.33 |
-5.33 |
7 |
57 |
2 |
4 |
-1.33 |
-2.67 |
8 |
53 |
3 |
9 |
-5.33 |
-16.00 |
9 |
51 |
4 |
16 |
-7.33 |
-29.33 |
5 |
58.33 |
|
60 |
|
-117.00 |
tср |
Yср |
|
сумма |
|
сумма |
Тогда
a1 = -117 / 60 = -1,95 a0 = 58,33 – (-1,95) * 5 = 68,08
Таким образом, искомая линейная модель имеет вид:
<Y(t)> = 68,08 – 1,95 * t
где: <Y(t)> - расчетное значение признака Y.
3) Оценка адекватности построенной модели.
Для оценки адекватности построенной модели исследуем ряд остатков отклонений расчетных значений <Y(t)> от фактических Yt (здесь и далее расчеты сведены в таблицу 2):
et = Yt – <Y(t)>
Таблица 2
t |
Y(t) |
<Y(t)> |
et |
точка поворота |
et 2 |
et - et-1 |
( et - et-1 ) 2 |
1 |
65 |
66.13 |
-1.13 |
- |
1.28 |
- |
- |
2 |
67 |
64.18 |
2.82 |
1 |
7.93 |
3.95 |
15.60 |
3 |
63 |
62.23 |
0.77 |
0 |
0.59 |
-2.05 |
4.20 |
4 |
60 |
60.28 |
-0.28 |
0 |
0.08 |
-1.05 |
1.10 |
5 |
56 |
58.33 |
-2.33 |
0 |
5.44 |
-2.05 |
4.20 |
6 |
53 |
56.38 |
-3.38 |
1 |
11.45 |
-1.05 |
1.10 |
7 |
57 |
54.43 |
2.57 |
1 |
6.59 |
5.95 |
35.40 |
8 |
53 |
52.48 |
0.52 |
0 |
0.27 |
-2.05 |
4.20 |
9 |
51 |
50.53 |
0.47 |
- |
0.22 |
-0.05 |
0.00 |
|
|
|
0.00 |
3 |
33.85 |
|
65.82 |
|
|
|
eср |
всего |
сумма |
|
сумма |
а) случайность остаточной компоненты по критерию пиков
Определим количество поворотных точек (т.е. таких точек, значение уровня в которой одновременно больше соседних с ним или, наоборот, одновременно меньше предыдущего и последующего за ним уровня).
Обозначения: 1 – точка поворота; 0 – в противном случае.
Критическое число поворотных точек определяется по формуле:
ркр = 2/3 * ( n – 2) – 1,96 * SQR[(16 * n – 29) / 90],
где: SQR[ ] – операция извлечение квадратного корня.
Подставив значение n = 9, получим ркр = 2,4511. Так как суммарное количество поворотных точек больше критического значения, то гипотеза о случайности остаточной компоненты принимается.
б) независимость уровней ряда остатков друг от друга по d-критерию
Значение d-критерия Дарбина-Уотсона (на отсутствие автокорреляции между уровнями или, другими словами, зависимости последующих значений от предыдущих) определяется по формуле:
d = ånt=2 ( et - et-1 ) 2 / ånt=1 et 2
Из таблицы 2:
d = 65,82 / 33,85 = 1,94
Вычисленное значение d = 1,94 попадает в интервал d2 = 1,36 < d < 2, следовательно, гипотеза о независимости уровней ряда остатков друг от друга принимается.
Так как с помощью d-критерия Дарбина-Уотсона получено вполне определенно суждение, то нет необходимости в применении дополнительного критерия адекватности модели по первому коэффициенту корреляции.
в) нормальность распределения остаточной компоненты по R/S-критерию
Значение R/S-критерия определяется по формуле:
R/S = ( emax – emin ) / Se
Se = SQR[ ånt=1 ( et - eср ) 2 / ( n – 1 ) ]
eср = ( ånt=1 et ) / n
где: emax и emin – максимальный и минимальный уровни ряда остатков;
eср – среднее значение ряда остатков;
Se - среднеквадратическое отклонение;
n – длина (количество уровней) ряда.
Значения из таблицы 2: emax = 2,82 emin = -3,38
Так как eср = 0, то ånt=1 ( et - eср ) 2 = ånt=1 et 2 = 33,85
Тогда
R/S = (2,82 – (-3,38)) / SQR[ 33,85 / (9-1)] = 3,014
Так как значение R/S-критерия попадает в интервал между критическими уровнями 2,7 и 3,7 – то гипотеза о нормальном распределении ряда остатков принимается.
Общие выводы: поскольку все три критерия выполняются, а также среднее значение ряда остатков равно нулю (следовательно, расчетное значение t-критерия Стьюдента
t расч = | eср | * SQR[ n ] / Se = 0 ,
т.е. критерий Стьюдента tрасч < tтабл выполняется), то
– линейная трендовая модель является адекватной фактическому ряду динамики;
– модель может быть использована для построения прогнозных оценок.
4) Оценка точности модели.
Стандартная ошибка оценки (или среднеквадратическое отклонение от линии тренда) определяется по формуле
S<Y(t)> = SQR[ ånt=1 ( Yt - <Y(t)> ) 2 / ( n – m ) ]
где: m – число параметров модели ( в данном случае m=2 ).
Так как et = Yt – <Y(t)>, то из таблицы 2 видно, что ånt=1 ( Yt - <Y(t)> ) 2 = 33,85
Тогда
S<Y(t)> = SQR[33,85 / ( 9 – 2 )] = 2,199
Средняя относительная ошибка аппроксимации (по модулю) определяется по формуле
Еотн = ( ånt=1 | et / Yt | ) / n * 100%
Промежуточные расчетные данные приведены в таблице 3.
Таблица 3
t |
Yt |
<Y(t)> |
et |
et / Yt |
| et / Yt | |
1 |
65 |
66,13 |
-1,13 |
-0,017 |
0,017 |
2 |
67 |
64,18 |
2,82 |
0,042 |
0,042 |
3 |
63 |
62,23 |
0,77 |
0,012 |
0,012 |
4 |
60 |
60,28 |
-0,28 |
-0,005 |
0,005 |
5 |
56 |
58,33 |
-0,33 |
-0,042 |
0,042 |
6 |
53 |
56,38 |
-3,38 |
-0,064 |
0,064 |
7 |
57 |
54,43 |
2,57 |
0,045 |
0,045 |
8 |
53 |
52,48 |
0,52 |
0,01 |
0,01 |
9 |
51 |
50,53 |
0,47 |
0,009 |
0,009 |
|
|
|
|
|
0,246 |
|
|
|
|
|
сумма |
Окончательно: Еотн = 0,246 / 9 * 100% = 2,73%
Так как Еотн < 5%, то модель считается точной.
5) Точечный и интервальный прогнозы.
Для периода упреждения на k = 2 шага вперед значение tпрогноз = n + k = 9 + 2 = 11. Подставив полученное значение t в линейную модель, получим точечный прогноз
<Y(t=11)> = 68,08 – 1,95 * 11 = 46,63
Интервальный прогноз рассчитывается с помощью доверительных интервалов по формуле
<Y(tпрогноз)> ± t a,n * Sпрогноз
где для линейной модели
Sпрогноз= S<Y(t)> * SQR[ (1 + 1 / n + (n+k- tср)2) / ånt=1 ( t - tср ) 2]
В таблице 1 рассчитано tср =5 и ånt=1 ( t - tср ) 2 = 60, а из предыдущего раздела S<Y(t)> = 2,199.
Тогда
Sпрогноз= 2,199 * SQR[ (1 + 1 / 9 + (9+2-5)2) / 60 ] = 1,7294 » 1,73
Так как по условию ta,n = 1,11 интервальный прогноз на 2 шага вперед имеет следующий вид:
46,63 ± 1,92 (при уровне доверительной вероятности P = 0,7)
Задание II.
Номер |
Номер наблюдения, t |
||||||||
показателя |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
42: Y(t) |
65 |
67 |
63 |
60 |
56 |
53 |
57 |
53 |
51 |
43: X1(t) |
29 |
33 |
32 |
36 |
38 |
41 |
44 |
42 |
46 |
44: X2(t) |
35 |
40 |
44 |
50 |
53 |
57 |
56 |
60 |
62 |
Требуется:
1) построить матрицу коэффициентов парной корреляции Y(t) с X1(t) и X2(t) и выбрать фактор, наиболее тесно связанный с зависимой переменной Y(t);
2) построить линейную однопараметрическую модель регрессии Y(t) = a0 + a1 * Х(t);
3) оценить качество построенной модели, исследовав ее адекватность и точность;
4) для модели регрессии рассчитать коэффициент эластичности и b-коэффициент;
5) построить точечный и интервальный прогнозы на два шага вперед по модели регрессии (для вероятности Р = 70% использовать коэффициент n = 1,11). Прогнозные оценки фактора X(t) на два шага вперед получить на основе среднего прироста от фактически достигнутого уровня).
Решение:
1) Матрица коэффициентов парной корреляции.
Выборочный парный линейный коэффициент корреляции рассчитывается по формуле
ry,x = ånt=1 ( Yt - yср ) * (Xt - xср ) / SQR[ ånt=1 ( Yt - yср ) 2 * ånt=1 (Xt - xср ) 2 ]
Промежуточные результаты расчетов для коэффициента ry,x1 приведены в таблице 4
Таблица 4
t |
Y(t) |
X1(t) |
Y(t) - yср |
X1(t) - x1cр |
(Yt - yср)2 |
(X1t - x1cр) 2 |
(Y(t) - yср)*( X1t - x1cр) |
1 |
65 |
29 |
6,67 |
-8,89 |
44,44 |
79,01 |
-59,23 |
2 |
67 |
33 |
8,67 |
-4,89 |
75,11 |
23,90 |
-42,31 |
3 |
63 |
32 |
4,67 |
-5,89 |
21,78 |
34,68 |
-27,46 |
4 |
60 |
36 |
1,67 |
-1,89 |
2,78 |
3,57 |
-3,14 |
5 |
56 |
38 |
-2,33 |
0,11 |
5,44 |
0,01 |
-0,28 |
6 |
53 |
41 |
-5,33 |
3,11 |
28,44 |
9,68 |
-16,63 |
7 |
57 |
44 |
-1,33 |
6,11 |
1,78 |
37,35 |
-8,14 |
8 |
53 |
42 |
-5,33 |
4,11 |
28,44 |
16,90 |
-21,96 |
9 |
51 |
46 |
-7,33 |
8,11 |
53,78 |
65,79 |
-59,52 |
|
58,33 |
37,89 |
|
|
262,00 |
270,89 |
-238,67 |
|
yср |
x1cр |
|
|
сумма |
сумма |
сумма |
Тогда
ry,x1 = -238,67 / SQR[ 262,00 *270,89] = -238,67 / 266,41= -0,9
Промежуточные результаты расчетов для коэффициента ry,x2 приведены в таблице 5
Таблица 5
t |
Y(t) |
X2(t) |
Y(t) - yср |
X2(t) – x2cр |
(Yt - yср)2 |
(X2t - x2cр) 2 |
(Y(t) - yср)*( X2t - x2cр) |
1 |
65 |
35 |
6,67 |
-15,78 |
44,44 |
248,94 |
-105,2 |
2 |
67 |
40 |
8,67 |
-10,78 |
75,11 |
116,16 |
-93,41 |
3 |
63 |
44 |
4,67 |
-6,78 |
21,78 |
45,94 |
-31,63 |
4 |
60 |
50 |
1,67 |
-0,78 |
2,78 |
0,60 |
-1,296 |
5 |
56 |
53 |
-2,33 |
2,22 |
5,44 |
4,94 |
-5,185 |
6 |
53 |
57 |
-5,33 |
6,22 |
28,44 |
38,72 |
-33,19 |
7 |
57 |
56 |
-1,33 |
5,22 |
1,78 |
27,27 |
-6,963 |
8 |
53 |
60 |
-5,33 |
9,22 |
28,44 |
85,05 |
-49,19 |
9 |
51 |
62 |
-7,33 |
11,22 |
53,78 |
125,94 |
-82,3 |
|
58,33 |
50,78 |
|
|
262,00 |
693,56 |
-408,33 |
|
yср |
x2cр |
|
|
сумма |
сумма |
сумма |
Тогда
ry,x2 = -408,33 / SQR[ 262,00 * 693,56 ] = -408,33 / 426,28 = -0,96
Для построения полной матрицы коэффициентов парной корреляции необходимо вычислить коэффициент rx1,x2 (таблица 6)
Таблица 6
t |
X1(t) |
X2(t) |
X1(t) – x1cр |
X2(t) – x2cр |
(X1t - x1cр) 2 |
(X2t - x2cр) 2 |
(X1t - x1cр)*(X2t - x2cр) |
1 |
29 |
15 |
-8,89 |
-15,78 |
79,01 |
248,94 |
140,13 |
2 |
33 |
20 |
-4,89 |
-10,78 |
23,90 |
116,16 |
52,61 |
3 |
32 |
24 |
-5,89 |
-6,78 |
34,68 |
45,94 |
39,87 |
4 |
36 |
30 |
-1,89 |
-0,78 |
3,57 |
0,60 |
1,466 |
5 |
38 |
33 |
0,11 |
2,22 |
0,01 |
4,94 |
0,266 |
6 |
41 |
37 |
3,11 |
6,22 |
9,68 |
38,72 |
19,416 |
7 |
44 |
36 |
6,11 |
5,22 |
37,35 |
27,27 |
31,95 |
8 |
42 |
40 |
4,11 |
9,22 |
16,90 |
85,05 |
37,99 |
9 |
46 |
42 |
8,11 |
11,22 |
65,79 |
125,94 |
91,11 |
|
37,89 |
50,78 |
|
|
270,89 |
693,56 |
414,80 |
|
x1cр |
x2cр |
|
|
сумма |
сумма |
сумма |
Тогда
rx1,x2 = 414,78 / SQR[270,89* 693,56 ] = 414,78 /433,45 =0,9569 » 0,96
И матрица коэффициентов парной корреляции, построенная по вычисленным значениям, имеет вид:
1 |
ry,x1 = -0,9 |
ry,x2 = -0,96 |
rx1,y = -0,9 |
1 |
rx1,x2 = 0,96 |
rx2,y = -0,96 |
rx2,x1 = 0,96 |
1 |
Вывод: среди двух факторов X1(t) и X2(t) наиболее тесно связанным с зависимой переменной Y(t) является фактор X1(t), так как в абсолютном выражении коэффициент ry,x1 наиболее близок к 1. Отрицательное значение коэффициента корреляции означает обратную (разнонаправленную) линейную связь между Y(t) и X1(t).
2) Линейная однопараметрическая (однофакторная) модель регрессии.
Так как модель Y(t) = a0 + a1 * X(t) линейна относительно параметров a0 и a1 , то для их оценки применим метод наименьших квадратов (традиционный):
a0 = yср – a1 * xср
a1 = ånt=1 ( Yt - yср ) * ( Xt - xср ) / ånt=1 (Xt - xср ) 2
yср = ( ånt=1 Yt ) / n
xср = ( ånt=1 Xt ) / n
где: yср, xср – средние значения переменных;
Yt, Xt – текущие значения переменных в момент наблюдения t;
n – длина (количество уровней) ряда наблюдений;
ånt=1 – операция суммирования значений уровней с номером t в диапазоне от 1 до n.
Промежуточные результаты расчетов для зависимой переменной Y(t) и фактора X1(t), приведены в таблице 7
Таблица 7
t |
Y(t) |
Yt - yср |
X1(t) |
X1t - x1ср |
(Yt - yср)*(X1t - x1ср) |
(X1t - x1ср) 2 |
1 |
65 |
6,67 |
29 |
-8,89 |
-59,23 |
79,01 |
2 |
67 |
8,67 |
33 |
-4,89 |
-42,31 |
23,90 |
3 |
63 |
4,67 |
32 |
-5,89 |
-27,46 |
34,68 |
4 |
60 |
1,67 |
36 |
-1,89 |
-3,14 |
3,57 |
5 |
56 |
-2,33 |
38 |
0,11 |
-0,28 |
0,01 |
6 |
53 |
-5,33 |
41 |
3,11 |
-16,63 |
9,68 |
7 |
57 |
-1,33 |
44 |
6,11 |
-8,14 |
37,35 |
8 |
53 |
-5,33 |
42 |
4,11 |
-21,96 |
16,90 |
9 |
51 |
-7,33 |
46 |
8,11 |
-59,52 |
65,79 |
|
58,33 |
|
37,89 |
|
-238,67 |
270,89 |
|
yср |
|
x1ср |
|
сумма |
сумма |
Тогда
a1 = -238,67 / 270,89= -0,88 a0 = 58,33 – (-0,881) * 37,89 = 91,72
Таким образом, искомая линейная модель имеет вид:
<Y(t)> =91,72– 0,881 * X1(t)
где: <Y(t)> - расчетное значение зависимой переменной Y.
3) Оценка адекватности и точности линейной однофакторной модели регрессии.
Для оценки адекватности и точности линейной однофакторной модели регрессии необходимо убедиться в следующем:
- в адекватности вида уравнения модели;
- в статистической значимости модели регрессии в целом (F-критерий Фишера);
- в статистической значимости коэффициентов уравнения регрессии и коэффициента корреляции;
- в точности модели (в качестве меры точности используют оценки значений ошибок).
3.1. Оценка адекватности уравнения модели
Уравнение модели является адекватным, если:
- математическое ожидание значений остаточного ряда равно или близко нулю (t-критерий Стьюдента);
- значения остаточного ряда случайны (критерий пиков);
- значения остаточного ряда независимы (d-критерий Дарбина-Уотсона);
- значения остаточного ряда подчинены нормальному закону (R/S-критерий).
а) t-критерий Стьюдента:
Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки статистической нулевой гипотезы Н0 : | eср | = 0. С этой целью строится t-статистика
t = | eср | * SQR[ n ] / Se
Se = SQR[ n * ånt=1 et2 – ( ånt=1 et ) 2 / ( n * ( n – 1 )) ]
где: eср – среднеарифметическое значение уровней ряда остатков
et – текущие значения уровней ряда остатков;
n – длина (количество уровней) ряда;
ånt=1 – операция суммирования значений уровней с номером t в диапазоне от 1 до n;
SQR[ ] – операция извлечения квадратного корня.
Если рассчитанное значение t < tтабл , то гипотеза Н0 принимается.
Промежуточные результаты расчетов, проведенных для t-критерия Стьюдента, а также остальных критериев адекватности (рассчитанных в порядке аналогичном описанному в Задании I), приведены в таблице 8
Таблица 8
t |
Y(t) |
X1(t) |
<Y(t)> |
et |
точка поворота |
et2 |
et - et-1 |
(et - et-1 )2 |
et * et-1 |
et - eср |
(et - eср )2 |
1 |
65 |
29 |
65,34 |
-0,34 |
- |
0,12 |
- |
- |
- |
-0,48 |
0,23 |
2 |
67 |
33 |
62,18 |
4,82 |
1 |
23,23 |
5,16 |
26,63 |
-1,64 |
4,68 |
21,90 |
3 |
63 |
32 |
62,97 |
0,03 |
1 |
0,00 |
-4,97 |
22,94 |
0,14 |
-0,11 |
0,01 |
4 |
60 |
36 |
59,81 |
0,19 |
1 |
0,04 |
0,16 |
0,03 |
0,01 |
0,05 |
0.00 |
5 |
56 |
38 |
58,23 |
-2,23 |
0 |
4,97 |
-2,42 |
5,86 |
-0,42 |
-2,37 |
5,62 |
6 |
53 |
41 |
55,86 |
-2,86 |
1 |
8,18 |
-0,63 |
0,4 |
6,38 |
-3 |
9 |
7 |
57 |
44 |
53,49 |
3,51 |
1 |
12,32 |
6,37 |
40,58 |
-10,04 |
3,37 |
11,36 |
8 |
53 |
42 |
55,07 |
-2,07 |
1 |
4,28 |
-5,58 |
31,14 |
-7,27 |
-2,21 |
4,88 |
9 |
51 |
46 |
51,91 |
-0,91 |
- |
0,83 |
1,16 |
1,35 |
1,88 |
-1,05 |
1,10 |
|
|
|
|
0.14 |
6 |
53,97 |
|
128,93 |
-10,9 |
|
54,1 |
|
|
|
|
eср |
всего |
сумма |
|
сумма |
сумма |
|
сумма |
Se = SQR[ 9 * 53,97 – ( 0,14 ) 2 / ( 9 * ( 9 – 1 )) ] = SQR[485,73 – 0,0196/ 72] = 22,04
t = | 0,14 | * SQR[ 9 ] / 22,04 = 0,0191
Так как рассчитанное значение t близко к нулю и меньше табличного, например tтабл (1-a)=0,9 m=7 = 1, 8946, то гипотеза о равенстве нулю математического ожидания значений остаточного ряда принимается.
б) критерий пиков:
ркр = 2/3 * ( n – 2) – 1,96 * SQR[(16 * n – 29) / 90]
Подставив значение n = 9, получим ркр = 2,4511. Так как суммарное количество поворотных точек больше критического значения, то гипотеза о случайности остаточной компоненты принимается.
в) d-критерий Дарбина-Уотсона:
d = ånt=2 ( et - et-1 ) 2 / ånt=1 et 2 = 128,93/ 53,97 = 2,39
Так как 2 < d < 4, вычисляем
d` = 4 - d = 1,61
Вычисленное значение d` = 1,61 попадает в зону определенности и модель считается адекватной процессу по данному критерию.
г) R/S-критерий:
R/S = ( emax – emin ) / Se
Se = SQR[ ånt=1 ( et - eср ) 2 / ( n – 1 ) ]
eср = ( ånt=1 et ) / n
Подставив значения из таблицы 8: emax = 4,82 emin = -2,86 eср = 0,14 для n = 9 получим
Se = SQR[ 54,1 / 8 ] = 6,7625 » 2,60
R/S = (4,82 – (-2,86)) / 2,60 = 2,95
Так как значение R/S-критерия попадает в интервал между критическими уровнями 2,7 и 3,7 – то гипотеза о нормальном распределении ряда остатков принимается.
3.2. Статистическая значимость модели регрессии в целом (F-критерий Фишера)
F-критерий (F-отношение) Фишера применяется для установления истинности статистической гипотезы о том, что фактор регрессии X(t) действительно влияет на зависимую переменную Y(t) или, точнее, действительно ли часть дисперсии зависимой переменной Y(t) объясняется влиянием фактора X(t). F-отношение Фишера рассчитывается по формуле
R2 / k
F = ------------------------------------
( 1 – R2 ) / ( n – k – 1 )
где: R2 – коэффициент детерминации;
k – число параметров при переменных, включенных в модель;
n – длина (количество уровней) ряда.
Используя введенные ранее обозначения, коэффициент детерминации можно записать в виде
R2 = ånt=1 ( <Y(t)> – yср ) 2 / ånt=1 ( уt – yср ) 2
однако, для однофакторной модели значение R совпадает с ry,x1 , рассчитанном в первом пункте задания. Тогда, подставив значения R2 = r2y,x1 = (-0,9) 2 = 0,81 при k = 1 (линейная однофакторная модель) и n = 9, получим
F = 0,81 / [ ( 1 – 0,81) / ( 9 – 1 –1 ) ] = 0,81 / 0,027 = 30
Табличное значение критерия Фишера при a = 0,05 и при степенях свободы k1 = k = 1 и k2 = n – k – 1 = 7
Fтабл = 5,59
Так как расчетное значение F > Fтабл , то модель считается значимой, при этом коэффициент детерминации R2 показывает долю вариации результативного признака под воздействием изучаемого фактора, т.е. в данном случае ~81% вариации зависимой переменной Y учтено в модели и обусловлено влиянием включенного фактора X1(t).
3.3. Статистическая значимость коэффициентов регрессии и корреляции
Оценка значимости коэффициентов регрессии и корреляции проводится с помощью t-критерия Стьюдента путем сопоставления значений коэффициентов с величиной случайной ошибки m
t a1 = a1 / m a1 t a0 = a0 / m a0 t r = r / m r
где
ånt=1 ( Yt –<Y(t)> ) 2 / ( n – 2 )
m a1 = SQR [ ---------------------------------------------- ]
ånt=1 ( Xt – xср ) 2
ånt=1 ( Yt –<Y(t)> ) 2 * ånt=1 Xt 2
m a0 = SQR [ ---------------------------------------- ]
( n – 2 ) * n * ånt=1 ( Xt – xср ) 2
1 – r xy 2
m r = SQR [ ----------------------- ]
n – 2
Промежуточные результаты вычислений приведены в таблице 9
Таблица 9
t |
Yt |
Xt |
<Y(t)> |
Yt - <Y(t)> |
(Yt - <Y(t)>) 2 |
Xt - xср |
(Xt – xср) 2 |
Xt 2 |
1 |
65 |
29 |
65,34 |
-0,34 |
0,12 |
-8,89 |
79,01 |
841 |
2 |
67 |
33 |
62,18 |
4,82 |
23,23 |
-4,89 |
23,90 |
1089 |
3 |
63 |
32 |
62,97 |
0,03 |
0,00 |
-5,89 |
34,68 |
1024 |
4 |
60 |
36 |
59,81 |
0,19 |
0,04 |
-1,89 |
3,57 |
1296 |
5 |
56 |
38 |
58,23 |
-2,23 |
4,97 |
0,11 |
0,01 |
1444 |
6 |
53 |
41 |
55,86 |
-2,86 |
8,18 |
3,11 |
9,68 |
1681 |
7 |
57 |
44 |
53,49 |
3,51 |
12,32 |
6,11 |
37,35 |
1936 |
8 |
53 |
42 |
55,07 |
2,07 |
4,28 |
4,11 |
16,90 |
1764 |
9 |
51 |
46 |
51,91 |
-0,91 |
0,83 |
8,11 |
65,79 |
2116 |
|
|
37,89 |
|
|
53,97 |
|
270,89 |
13191 |
|
|
xср |
|
|
сумма |
|
сумма |
сумма |
Тогда при n = 9
m a1 = SQR[53,97/ ( 9 – 2 ) /270,89] = 0,17
m a0 = SQR[53,97/ ( 9 – 2 ) * 13191/ 9 /270,89] = 6,46
m r = SQR[ ( 1 – 0,81 ) / ( 9 – 2 ) ] = 0,16
и значения t-статистик (по модулю)
t a1 = 0,881 / 0,17 = 5,18
t a0 = 91,72 / 6,46=14,2
t r = 0,9 / 0,16 = 5,63
Табличное значение t-критерия Стьюдента при a = 0,1 и числе степеней свободы n – 2 = 7 составит 1,8946. Так как все фактические значения t-статистик превышают табличное значение, то коэффициенты регрессии и корреляции статистически значимы.
3.4. Оценка точности модели
В качестве меры точности модели регрессии применяют несмещенную оценку дисперсии остаточной компоненты, т. е. части дисперсии фактического явления, “не объясненную” включенными в модель факторами. Стандартная ошибка оценки определяется по формуле
S<Y(t)> = SQR[ ånt=1 ( Yt - <Y(t)> ) 2 / ( n – k – 1 ) ]
где: k – количество факторов, включенных в модель ( в данном случае k=1 );
n – количество уровней ряда.
Из таблицы 9 видно, что ånt=1 ( Yt - <Y(t)> ) 2 = 53,97
Тогда
S<Y(t)> = SQR[53,97 / ( 9 – 2 )] = 2,78
Средняя относительная ошибка аппроксимации (по модулю), т.е. среднее отклонение расчетных значений от фактических, определяется по формуле
Еотн = ( ånt=1 | ( Yt - <Y(t)> ) / Yt | ) / n * 100%
Промежуточные расчетные данные приведены в таблице 10.
Таблица 10
t |
Yt |
Xt |
<Y(t)> |
Yt - <Y(t)> |
(Yt - <Y(t)>) / Yt |
| (Yt - <Y(t)>) / Yt | |
1 |
65 |
29 |
65,34 |
-0,34 |
-0,005 |
0,005 |
2 |
67 |
33 |
62,18 |
4,82 |
0,078 |
0,078 |
3 |
63 |
32 |
62,97 |
0,03 |
0,00 |
0,00 |
4 |
60 |
36 |
59,81 |
0,19 |
0,003 |
0,003 |
5 |
56 |
38 |
58,23 |
-2,23 |
-0,038 |
0,038 |
6 |
53 |
41 |
55,86 |
-2,86 |
-0,051 |
0,051 |
7 |
57 |
44 |
53,49 |
3,51 |
0,066 |
0,066 |
8 |
53 |
42 |
55,07 |
2,07 |
0,038 |
0,038 |
9 |
51 |
46 |
51,91 |
-0,91 |
-0,018 |
0,018 |
|
|
|
|
|
|
0,297 |
|
|
|
|
|
|
сумма |
Окончательно: Еотн = 0,297 / 9 * 100% = 3,3%
Так как Еотн < 5%, то модель считается точной.
4) Коэффициент эластичности и b-коэффициент.
Коэффициент эластичности (т.е. коэффициент, показывающий на сколько процентов изменится результат, если фактор изменится на 1%) в общем виде определяется как
x
Э = ƒ΄(x) * ------
y
где: ƒ΄(x) – первая производная функции y = ƒ(x).
Так как для линейной функции коэффициент эластичности зависит от значения фактора Х, то воспользуемся формулой среднего коэффициента эластичности
x ср
Э ср = а1 * ---------------------
а0 + а1 * х ср
Подставив вычисленные ранее значения, получим
Э ср = -0,881* 37,89/ (91,72– 0,881 *37,89) = - 0,27 %
Стандартизованный b-коэффициент линейной регрессии определяется из общего уравнения множественной регрессии в стандартизованном масштабе
t y = b 1 * t x1 + b 2 * t x2 + … + b N * t xN
где: t y = ( y - y ср ) / s y , t Xj = ( x j - x j ср ) / s Xj - стандартизованные переменные;
b j - стандартизованные коэффициенты регрессии, определяемые из системы уравнений
r y x1 = b 1 + b 2 * r x2 x1 + … + b N * r xN x1
r y x2 = b 1 * r x2 x1 + b 2 + … + b N * r xN x1
………………………………………………………….
r y xN = b 1 * r xN x1 + b 2 * r xN x2 + … + b N
где: r y Xj – парные коэффициенты корреляции.
Для однопараметрической (однофакторной) линейной модели регрессии система уравнений сводится к тождеству
r y x1 = b 1
отсюда значение b-коэффициента линейной однофакторной регрессии: b 1 = -0,9.
2-й способ:
из сопоставления систем уравнений множественной регрессии (для метода наименьших квадратов) в нормальной линейной и стандартизованной формах также известно, что связь между коэффициентами b i и коэффициентами множественной регрессии b i выражается соотношением
b i = b i * s x / s y
где: s - среднеквадратическое отклонение.
Для линейной однопараметрической регрессии коэффициент b 1 совпадает с коэффициентом а 1 линии регрессии.
Эмпирическое среднеквадратическое отклонение вычисляется по формуле
S z = SQR[ ånt=1 ( z t – z cp ) 2 / ( n – 1 ) ]
где: n – длина эмпирического ряда.
Тогда, используя данные из таблицы 4
ånt=1 ( X 1t – x cp ) 2 = 270,89и ånt=1 ( z t – z cp ) 2 = 262,00
для n = 9 получим
S x = SQR[270,89/ 8 ] = 5,82
S y = SQR[ 262,00 / 8 ] = 5,72
b 1 = а 1 * S x / S y = -0,881 * 5,82/ 5,72 = -0,895»-0,9
5) Точечный и интервальный прогнозы.
Прогнозируемое точечное значение переменной Y(t) для периода упреждения на k = 2 шага вперед получается при подстановке в уравнение регрессии ожидаемой величины фактора X1(t) при tпрогноз = n + k , т.е.
<Y(t= tпрогноз)> =91,72– 0,881* X1(t= tпрогноз)
Получим прогнозные оценки фактора X1(t) на основе величины его среднего абсолютного прироста (САП)
САП = [ X1(t=n) – X1(t=1) ] / ( n – 1 )
X1 прогноз (t=n+k) = X1(t=n) + k * САП
Подставив соответствующие значения, получим
САП = ( 46 – 29) / 8 = 2,125
Тогда прогнозные значения фактора X1(t)
X1 прогноз(10) = X1(9) + 1 * САП = 46 + 2,125 = 48,125
X1 прогноз(11) = X1(9) + 2 * САП = 46 + 4,25 = 50,25
И прогнозные значения зависимой переменной
<Y(10)> = 91,72– 0,881 * 48,125 = 49,32
<Y(11)> = 91,72– 0,881 * 50,25 = 47,45
Интервальный прогноз рассчитывается с помощью доверительных интервалов по формуле
<Y(tпрогноз)> ± U(k)
где: U(k) – средняя стандартная ошибка прогноза
( x прогноз (n+k) – x ср ) 2
U(k) = S<Y(t)> * t a * SQR[ 1 + 1/n + ----------------------------- ]
ånt=1 ( x t – x ср ) 2
S<Y(t)> - стандартная ошибка оценки;
t a – табличное значение критерия Стьюдента для числа степеней свободы ( n – 2 ).
Подставив известные (по условию задачи) значения n = 9 и t 0,7 = 1,11 ; а также вычисленные ранее значения S<Y(t)> = 2,78 (пункт 3.4) ; x1ср = 37,88 и ånt=1 (X1t - x1ср) 2 = 270,89(таблица 4), получим
U(1) = 2,78* 1,11 * SQR[ 1 + 1/9 + (48,125 – 37,89) 2 /270,89] = 3,76
U(2) = 2,78* 1,11 * SQR[ 1 + 1/9 + (50,25 –37,89) 2 /270,89] = 3,98
Результаты прогнозных оценок по линейной однофакторной модели регрессии представлены в таблице 11
Таблица 11
t |
шаг k |
прогноз <Y(tпрогноз )> |
нижняя граница |
верхняя граница |
10 |
1 |
49,32 |
45,56 |
53,08 |
11 |
2 |
47,45 |
43,47 |
51,43 |
Рис.1Б. График линейной модели тренда с результатами прогнозирования
Рис.2 График линейной однофакторной модели регрессии с результатами прогнозирования