Номер

Номер наблюдения, t

показателя

1

2

3

4

5

6

7

8

9

Y(t)

28

24

26

29

33

31

28

33

35

X1(t)

32

34

41

38

42

48

50

52

55

X2(t)

90

88

84

86

82

80

81

78

76

Требуется:

1) построить матрицу коэффициентов парной корреляции Y(t) с X1(t) и X2(t) и выбрать фактор, наиболее тесно связанный с зависимой переменной Y(t);

2) построить линейную однопараметрическую модель регрессии Y(t) = a0 + a1 * Х(t);

3) оценить качество построенной модели, исследовав ее адекватность и точность;

4) для модели регрессии рассчитать коэффициент эластичности и b-коэффициент;

5) построить точечный и интервальный прогнозы на два шага вперед по модели регрессии (для вероятности Р = 70% использовать коэффициент n = 1,05). Прогнозные оценки фактора X(t) на два шага вперед получить на основе среднего прироста от фактически достигнутого уровня).

Решение:


1) Матрица коэффициентов парной корреляции.

         Выборочный парный линейный коэффициент корреляции рассчитывается по формуле

ry,x = ånt=1 ( Yt - yср ) * (Xt - xср ) / SQR[ ånt=1 ( Yt - yср ) 2 * ånt=1 (Xt - xср ) 2 ]

Промежуточные результаты расчетов для коэффициента ry,x1 приведены в таблице

Таблица    

t

Y(t)

X1(t)

Y(t) - yср

X1(t) - x1cр

(Yt - yср)2

(X1t - x1cр) 2

(Y(t) - yср)*( X1t - x1cр)

1

28

32

-1,6

-11,5

2.56

132,25

18.4

2

24

34

-5,6

-9,5

31.36

90,25

53.2

3

26

41

-3.6

-2,5

12.96

6,25

9

4

29

38

-0.6

-5,5

0.36

30,25

3.3

5

33

42

3.4

-1,5

11,56

2,25

-5,1

6

31

48

1.4

4,5

1.96

20,25

6,3

7

28

50

-1.6

6,5

2.56

42.25

-16.64

8

33

52

3.4

8,5

11.56

72,25

28.9

9

35

55

5.4

11,5

29.16

132,25

-52,9


29,6

43.5



117,36

528,25

44,46


yср

x1cр



сумма

сумма

сумма

Тогда

ry,x1 = 44,46 / SQR[ 117,36 *528,25] = 44,46 / 248,99= 0,18

Промежуточные результаты расчетов для коэффициента ry,x2 приведены в таблице

Таблица    

t

Y(t)

X2(t)

Y(t) - yср

X2(t) – x2cр

(Yt - yср)2

(X2t - x2cр) 2

(Y(t) - yср)*( X2t - x2cр)

1

28

90

-1.6

7.3

2.56

53.29

-11,68

2

24

88

-5.6

5.3

31,36

28,09

-29,68

3

26

84

-3.6

1.3

12.96

1,69

-4,68

4

29

86

-0.6

3.3

0.36

10,89

-1,98

5

33

82

3.4

-0.7

11.56

0,49

-2,38

6

31

80

1.4

-2.7

1.96

7,29

-3,78

7

28

81

-1.6

-1.7

2.56

2,89

2,72

8

33

78

-3.4

-4.7

11.56

22.09

15,98

9

35

76

5.4

-6.7

29.16

44,89

-36,18


29.6

82,7



117,36

171,61

-70,98


yср

x2cр



сумма

сумма

сумма

Тогда

ry,x2 = -70,98 / SQR[ 117,36 * 171,61 ] = -70,98 / 141,92 = -0,5

 Для построения полной матрицы коэффициентов парной корреляции необходимо вычислить коэффициент rx1,x2 (таблица )

Таблица    

t

X1(t)

X2(t)

X1(t) – x1cр

X2(t) – x2cр

(X1t - x1cр) 2

(X2t - x2cр) 2

(X1t - x1cр)*(X2t - x2cр)

1

32

90

-11.5

7.3

132.25

53.29

83,95

2

34

88

-9.5

    5.3

90,25

28.09

-50,35

3

41

84

-2,5

1.3

6,25

1.69

-3,25

4

38

86

-5,5

3.3

30,25

10.89

-18,15

5

42

82

-1,5

-0.7

2.25

0,49

1,07

6

48

80

4,5

-2.7

20.25

7.29

-12,15

7

50

91

6,5

-1.7

42.25

2.89

-11.05

8

52

78

8,5

-4.7

72.25

22.09

-39,95

9

55

76

11,5

-6.7

132.25

44.89

77,05


43.5

82.7



528,25

171.61

27,17


x1cр

x2cр



сумма

сумма

сумма









Тогда

rx1,x2 = 27,17 / SQR[528,25* 171,61 ] = 27,17 /301,09 =0,09

И матрица коэффициентов парной корреляции, построенная по вычисленным значениям, имеет вид:

1

ry,x1 = 0.18

ry,x2 = -0,5

rx1,y = 0,18

1

rx1,x2 = 0,09

rx2,y = -0,5

rx2,x1 = 0,09

1

         Вывод: среди двух факторов X1(t) и X2(t) наиболее тесно связанным с зависимой переменной Y(t) является фактор X2(t), так как в абсолютном выражении коэффициент ry,x1 наиболее близок к 1. Отрицательное значение коэффициента корреляции означает обратную (разнонаправленную) линейную связь между Y(t) и X2(t).



2) Линейная однопараметрическая (однофакторная) модель регрессии.

         Так как модель Y(t) = a0 + a1 * X(t) линейна относительно параметров a0 и a1 , то для их оценки применим метод наименьших квадратов (традиционный):

a0 = yср – a1 * xср

a1 = ånt=1 ( Yt - yср ) * ( Xt - xср ) / ånt=1 (Xt - xср ) 2

yср = ( ånt=1 Yt ) / n

xср = ( ånt=1 Xt ) / n

где:   yср, xср – средние значения переменных;

         Yt, Xt – текущие значения переменных в момент наблюдения t;

         n – длина (количество уровней) ряда наблюдений;

         ånt=1 – операция суммирования значений уровней с номером t в диапазоне от 1 до n.

Промежуточные результаты расчетов для зависимой переменной Y(t) и фактора X1(t), приведены в таблице

Таблица

t

Y(t)

Yt - yср

X1(t)

X1t - x1ср

(Yt - yср)*(X1t - x1ср)

(X1t - x1ср) 2

1

28

-1,6

32

-11,5

18,4

132.25

2

24

-5.6

34

-9,5

53,2

90,25

3

26

-3,6

41

-2,5

9

6.25

4

29

-0,6

38

-5,5

3,3

30,25

5

33

3,4

42

-1,5

-5,1

2,25

6

31

1,4

48

4,5

10,8

20,25

7

28

-1,6

50

6,5

-10,4

42,25

8

33

3,4

52

8.5

28,9

72,25

9

35

5,4

55

11,5

62.1

132,25


29,6


  43.5


170,2

528.25


yср


x1ср


сумма

сумма

Тогда

a1 = 170,2 / 528.25= 0,32                a0 = 29,6 – 0,32 * 43.5 = 15,68

Таким образом, искомая линейная модель имеет вид:

<Y(t)> =15,68– 0,32 * X1(t)

где: <Y(t)> - расчетное значение зависимой переменной Y.



3) Оценка адекватности и точности линейной однофакторной модели регрессии.

         Для оценки адекватности и точности линейной однофакторной модели регрессии необходимо убедиться в следующем:

- в адекватности вида уравнения модели;

- в статистической значимости модели регрессии в целом (F-критерий Фишера);

- в статистической значимости коэффициентов уравнения регрессии и коэффициента корреляции;

- в точности модели (в качестве меры точности используют оценки значений ошибок).


         3.1. Оценка адекватности уравнения модели

         Уравнение модели является адекватным, если:

- математическое ожидание значений остаточного ряда равно или близко нулю (t-критерий Стьюдента);

- значения остаточного ряда случайны (критерий пиков);

- значения остаточного ряда независимы (d-критерий Дарбина-Уотсона);

- значения остаточного ряда подчинены нормальному закону (R/S-критерий).

а) t-критерий Стьюдента:

         Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки статистической нулевой гипотезы Н0 : | eср | = 0. С этой целью строится t-статистика

t = | eср | * SQR[ n ] / Se

Se = SQR[ n * ånt=1 et2 – ( ånt=1 et ) 2 / ( n * ( n – 1 )) ]

где:   eср – среднеарифметическое значение уровней ряда остатков

         et – текущие значения уровней ряда остатков;

         n – длина (количество уровней) ряда;

         ånt=1 – операция суммирования значений уровней с номером t в диапазоне от 1 до n;

         SQR[ ] – операция извлечения квадратного корня.

Если рассчитанное значение t < tтабл , то гипотеза Н0 принимается.

         Промежуточные результаты расчетов, проведенных для t-критерия Стьюдента, а также остальных критериев адекватности (рассчитанных в порядке аналогичном описанному в Задании I), приведены в таблице

Таблица

t

Y(t)

X1(t)

<Y(t)>

et


et2

et - et-1

(et - et-1 )2

et * et-1

et - eср

(et - eср )2

1

 28

32

25,92

2,08


4,33

-

-

-

1,52

2,31

2

24

34

26,56

-2.56


6,55

-4,64

21,53

-5,32

-3.12

9,73

3

26

41

23,88

2.12


4,49

4,68

21,90

-5,43

1,56

2,43

4

29

38

27,84

1,16


1,35

-0,96

0,92

2,46

0,6

0.36

5

33

42

29,12

3.88


15,05

2,72

7,40

4,50

3,32

11,02

6

31

48

31,04

-0.04


0,00

-3.92

15,37

-0.15

-0,6

0,36

7

28

50

31,68

-3.68


13,54

-3.64

13,25

0,15

-4,24

17,98

8

33

52

 32,32

0,68


0,46

4,36

19,01

-2,50

-0,12

0,01

9

35

55

33,28

1,72


2,96

1,04

1,08

1,17

1,16

1,35





0.56


   48,73


128,93

-5,02


45,55





eср

всего

сумма


сумма

сумма


сумма


Se = SQR[ 9 * 48,73 – ( 0,56 ) 2 / ( 9 * ( 9 – 1 )) ] = SQR[438,57 – 0,3136/ 72] = 20,94

t = | 0,56 | * SQR[ 9 ] / 20,94 = 0,08

Так как рассчитанное значение t близко к нулю и меньше табличного, например tтабл (1-a)=0,9 m=7 = 1, 8946, то гипотеза о равенстве нулю математического ожидания значений остаточного ряда принимается.


б) критерий пиков:

ркр = 2/3 * ( n – 2) – 1,96 * SQR[(16 * n – 29) / 90]

         Подставив значение n = 9, получим ркр = 2,4511. Так как суммарное количество поворотных точек больше критического значения, то гипотеза о случайности остаточной компоненты принимается.


в) d-критерий Дарбина-Уотсона:

d = ånt=2 ( et - et-1 ) 2 / ånt=1 et 2 = 128,93/ 48,73 = 2,65

Так как 2 < d < 4, вычисляем

d` = 4 - d = 1,35

          Вычисленное значение d` = 1,35 попадает в зону определенности и модель считается адекватной процессу по данному критерию.

г) R/S-критерий:

R/S = ( emax – emin ) / Se

Se = SQR[ ånt=1 ( et - eср ) 2 / ( n – 1 ) ]

eср = ( ånt=1 et ) / n

Подставив значения из таблицы 8:         emax = 3,88 emin = -3,68 eср = 0,56 для n = 9 получим

Se = SQR[ 128,93 / 8 ] = 4,0145 » 4,01

R/S = (3.88 – (-3,68)) / 4,01 = 1,88

Так как значение R/S-критерия попадает в интервал между критическими уровнями 1,7 и 3,7 – то гипотеза о нормальном распределении ряда остатков принимается.


         3.2. Статистическая значимость модели регрессии в целом (F-критерий Фишера)

         F-критерий (F-отношение) Фишера применяется для установления истинности статистической гипотезы о том, что фактор регрессии X(t) действительно влияет на зависимую переменную Y(t) или, точнее, действительно ли часть дисперсии зависимой переменной Y(t) объясняется влиянием фактора X(t). F-отношение Фишера рассчитывается по формуле

R2 / k

F = ------------------------------------      

( 1 – R2 ) / ( n – k – 1 )

где:   R2 – коэффициент детерминации;

         k – число параметров при переменных, включенных в модель;

         n – длина (количество уровней) ряда.

Используя введенные ранее обозначения, коэффициент детерминации можно записать в виде

R2 = ånt=1 ( <Y(t)> – yср ) 2 / ånt=1 ( уt – yср ) 2

однако, для однофакторной модели значение R совпадает с ry,x1 , рассчитанном в первом пункте задания. Тогда, подставив значения R2 = r2y,x1 = (0,18) 2 = 0,03 при k = 1 (линейная однофакторная модель) и n = 9, получим

F = 0,03 / [ ( 1 – 0,03) / ( 9 – 1 –1 ) ] = 0,03 / 0,14 = 0,21

Табличное значение критерия Фишера при a = 0,05 и при степенях свободы k1 =k=1 и k2 = n – k – 1 = 7

Fтабл = 5,59

Так как расчетное значение F > Fтабл , то модель считается значимой, при этом коэффициент детерминации R2 показывает долю вариации результативного признака под воздействием изучаемого фактора, т.е. в данном случае ~81% вариации зависимой переменной Y учтено в модели и обусловлено влиянием включенного фактора X1(t).


         3.3. Статистическая значимость коэффициентов регрессии и корреляции

         Оценка значимости коэффициентов регрессии и корреляции проводится с помощью t-критерия Стьюдента путем сопоставления значений коэффициентов с величиной случайной ошибки m

t a1 = a1 / m a1                             t a0 = a0 / m a0                             t r = r / m r

где

ånt=1 ( Yt –<Y(t)> ) 2 / ( n – 2 )

m a1 = SQR [ ---------------------------------------------- ]

ånt=1 ( Xt – xср ) 2


ånt=1 ( Yt –<Y(t)> ) 2 * ånt=1 Xt 2

m a0 = SQR [ ---------------------------------------- ]   

( n – 2 ) * n * ånt=1 ( Xt – xср ) 2


1 – r xy 2

m r = SQR [ ----------------------- ]      

n – 2



Промежуточные результаты вычислений приведены в таблице

Таблица

t

Yt

Xt

<Y(t)>

Yt - <Y(t)>

(Yt - <Y(t)>) 2

Xt - xср

(Xt – xср) 2

Xt 2

1

28

32

25.92

2.08

4,33

-11.5

132.25

1024

2

24

34

26.56

-2.56

6.56

-9,5

90.25

1156

3

26

41

23.88

2.12

4,49

-2,5

6.25

1681

4

29

38

27,84

1.16

1.35

-5,5

30.25

1444

5

33

42

29,12

3,88

15.05

-1,5

2,25

1764

6

31

48

31.04

-0,04

0.00

4,5

20,25

2304

7

28

50

31.68

-3.68

13.54

6,5

42.25

2500

8

33

52

32.32

0,68

0,46

8,5

72.25

2704

9

35

55

33.28

1,72

2,96

11,5

132,25

3025



43.5



48,73


528,25

17602



xср



сумма


сумма

сумма

Тогда при n = 9

m a1 = SQR[48,73/ ( 9 – 2 ) /528,25] = 0,12

m a0 = SQR[48,73/ ( 9 – 2 ) * 17602/ 9 /528,25] = 5,08

m r = SQR[ ( 1 – 0,03 ) / ( 9 – 2 ) ] = 0,1

и значения t-статистик (по модулю)

t a1 = 0,32 / 0,12 = 2,67

t a0 = 15,68/ 5,08=3.09

t r = 0,18 / 0,1 = 1,8

Табличное значение t-критерия Стьюдента при a = 0,1 и числе степеней свободы n – 2 = 7 составит 1,8946. Так как все фактические значения t-статистик превышают табличное значение, то коэффициенты регрессии и корреляции статистически значимы.


         3.4. Оценка точности модели

         В качестве меры точности модели регрессии применяют несмещенную оценку дисперсии остаточной компоненты, т. е. части дисперсии фактического явления, “не объясненную” включенными в модель факторами. Стандартная ошибка оценки определяется по формуле

S<Y(t)> = SQR[ ånt=1 ( Yt - <Y(t)> ) 2 / ( n – k – 1 ) ]

где:   k – количество факторов, включенных в модель ( в данном случае k=1 );

         n – количество уровней ряда.

Из таблицы  видно, что ånt=1 ( Yt - <Y(t)> ) 2 = 48,73

Тогда

S<Y(t)> = SQR[48,73 / ( 9 – 2 )] = 6,96.

         Средняя относительная ошибка аппроксимации (по модулю), т.е. среднее отклонение расчетных значений от фактических, определяется по формуле

Еотн = ( ånt=1 | ( Yt - <Y(t)> ) / Yt | ) / n * 100%

Промежуточные расчетные данные приведены в таблице 10.

Таблица 10

t

Yt

Xt

<Y(t)>

Yt - <Y(t)>

(Yt - <Y(t)>) / Yt

| (Yt - <Y(t)>) / Yt |

1

28

32

25,92

2.08

0,074

0,074

2

24

34

26,56

-2.56

-0,107

0,107

3

26

41

23,88

2,12

0,081

0,081

4

29

38

27,84

1.16

0,04

0,04

5

33

42

29,12

3,88

0,12

0,12

6

31

48

31.04

-0.04

-0,001

0,001

7

28

50

31,68

-3.68

-0,013

0,013

8

33

52

32.32

0.68

0,02

0,02

9

35

55

33.28

1,72

0,03

0,03







0,486







сумма

Окончательно:    Еотн = 0,486 / 9 * 100% = 5,4%

Так как Еотн < 7%, то модель считается точной.



4) Коэффициент эластичности и b-коэффициент.

         Коэффициент эластичности (т.е. коэффициент, показывающий на сколько процентов изменится результат, если фактор изменится на 1%) в общем виде определяется как

                x

Э = ƒ΄(x) * ------

                y

где:   ƒ΄(x) – первая производная функции y = ƒ(x).

Так как для линейной функции коэффициент эластичности зависит от значения фактора Х, то воспользуемся формулой среднего коэффициента эластичности

               x ср

Э ср = а1 * ---------------------

             а0 + а1 * х ср

Подставив вычисленные ранее значения, получим

Э ср = 0,32* 43.5/ (15,68+0,32 *43.5) =  0,47 %


         Стандартизованный b-коэффициент линейной регрессии определяется из общего уравнения множественной регрессии в стандартизованном масштабе

t y = b 1 * t x1 + b 2 * t x2 + … + b N * t xN

где:   t y = ( y - y ср ) / s y ,       t Xj = ( x j - x j ср ) / s Xj - стандартизованные переменные;

         b j - стандартизованные коэффициенты регрессии, определяемые из системы уравнений

r y x1 = b 1              + b 2 * r x2 x1 + … + b N * r xN x1

r y x2 = b 1 * r x2 x1   + b 2                   + … + b N * r xN x1

                            ………………………………………………………….

r y xN = b 1 * r xN x1 + b 2 * r xN x2               + … + b N

где:   r y Xj – парные коэффициенты корреляции.

         Для однопараметрической (однофакторной) линейной модели регрессии система уравнений сводится к тождеству

r y x1 = b 1

отсюда значение b-коэффициента линейной однофакторной регрессии:     b 1 = 0,18.

          



5) Точечный и интервальный прогнозы.

         Прогнозируемое точечное значение переменной Y(t) для периода упреждения на k = 2 шага вперед получается при подстановке в уравнение регрессии ожидаемой величины фактора X1(t) при tпрогноз = n + k .


Получим прогнозные оценки фактора X1(t) на основе величины его среднего абсолютного прироста (САП)

САП = [ X1(t=n) – X1(t=1) ] / ( n – 1 )

X1 прогноз (t=n+k) = X1(t=n) + k * САП

Подставив соответствующие значения, получим

САП = ( 55 – 32) / 8 = 2,875

Тогда прогнозные значения фактора X1(t)

X1 прогноз(10) = X1(9) + 1 * САП = 55 + 2,875 = 57,875

X1 прогноз(11) = X1(9) + 2 * САП = 55 + 5.75 = 60,75

И прогнозные значения зависимой переменной

<Y(10)> = 15.68+0,32 * 57.875 = 34.2

<Y(11)> = 15.68+ 0,32 * 60.75 = 35.12

Интервальный прогноз рассчитывается с помощью доверительных интервалов по формуле

<Y(tпрогноз)> ± U(k)

где:   U(k) – средняя стандартная ошибка прогноза

                                                                    ( x прогноз (n+k) – x ср ) 2

                   U(k) = S<Y(t)> * t a * SQR[ 1 + 1/n + ----------------------------- ]

                                                                        ånt=1 ( x t – x ср ) 2

         S<Y(t)> - стандартная ошибка оценки;

         t a – табличное значение критерия Стьюдента для числа степеней свободы ( n – 2 ).

Подставив известные (по условию задачи) значения n = 9 и t 0,7 = 1,05 ; а также вычисленные ранее значения S<Y(t)> = 6.96 (пункт 3.4) ; x1ср = 43.5 и ånt=1 (X1t - x1ср) 2 = 528.25(таблица 4), получим

U(1) = 6.96* 1,05 * SQR[ 1 + 1/9 + (34.2 – 43.5) 2 /528.25] = 8,26

U(2) = 6.96* 1,05 * SQR[ 1 + 1/9 + (35.12 –43.5) 2 /528.25] = 8.11

Результаты прогнозных оценок по линейной однофакторной модели регрессии представлены в таблице



Таблица

t

шаг k

прогноз <Y(tпрогноз )>

нижняя граница

верхняя граница

10

1

34,2

25.94

42.46

11

2

35.12

27.01

43.23