Задача 1.

1.1 Выяснить,  существует ли связь между потреблением дизельного топлива (y) и объёмом валовой продукции (). (Для этого построить поле рассеяния. На основе его визуального анализа выдвинуть гипотезу о виде статистической зависимости y от ). Найти точечные оценки неизвестных параметров модели. Выяснить, существует ли связь между потреблением дизельного топлива (y) и объёмом капитальных вложений (). Найти оценки неизвестных параметров модели.

Решение.

Годы


Валовая продукция промышленности

( млрд. р.)

Объём капитальных вложений

( млрд. р.)

Объём потребления дизельного топлива

(y млн. т.)

1985

5,6

3,5

2,7

1986

3,7

3,3

2,4

1987

3,3

3,2

2,4

1988

3,5

3,1

2,6

1989

3,7

3,2

2,9

1990

3,9

3,5

3,1

1991

4

3,7

3,5

1992

4,4

4,1

3,3

1993

4,8

4,4

3,7

1994

5

4,5

4

1995

5,3

4,3

3,8

1996

4,9

4,2

3,1

1997

5,1

4,7

4

1998

5,3

4,5

4,4

1999

5,3

4,5

4,2

2000

5,2

4,8

4



Используя таблицу, строим поля рассеяния.


На основе анализа поля рассеяния (см. рис. 1.) выдвигаем гипотезу о том, что зависимость потребления дизельного топлива (y) от объёмов продукции () описывается линейной моделью вида:

где  и  -неизвестные постоянные коэффициенты, а u – отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, между y и   зависимость описывается моделью:

Задача состоит в получении уравнения регрессии:

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов(МНК)):

       

и с помощью таблицы:


y







1

5,6

3,5

2,7

31,36

12,25

15,12

9,45

19,6

7,29

2

3,7

3,3

2,4

13,69

10,89

8,88

7,92

12,21

5,76

3

3,3

3,2

2,4

10,89

10,24

7,92

7,68

10,56

5,76

4

3,5

3,1

2,6

12,25

9,61

9,1

8,06

10,85

6,76

5

3,7

3,2

2,9

13,69

10,24

10,73

9,28

11,84

8,41

6

3,9

3,5

3,1

15,21

12,25

12,09

10,85

13,65

9,61

7

4

3,7

3,5

16

13,69

14

12,95

14,8

12,25

8

4,4

4,1

3,3

19,36

16,81

14,52

13,53

18,04

10,89

9

4,8

4,4

3,7

23,04

19,36

17,76

16,28

21,12

13,69

10

5

4,5

4

25

20,25

20

18

22,5

16

11

5,3

4,3

3,8

28,09

18,49

20,14

16,34

22,79

14,44

12

4,9

4,2

3,1

24,01

17,64

15,19

13,02

20,58

9,61

13

5,1

4,7

4

26,01

22,09

20,4

18,8

23,97

16

14

5,3

4,5

4,4

28,09

20,25

23,32

19,8

23,85

19,36

15

5,3

4,5

4,2

28,09

20,25

22,26

18,9

23,85

17,64

16

5,2

4,8

4

27,04

23,04

20,8

19,2

24,96

16

сумма

73

63,5

54,1

341,82

257,35

252,23

220,06

295,17

189,47


n=16,

Следовательно,

Таким образом,

Аналогично находятся оценки коэффициентов модели

 а именно,


1.2. По найденным в п. 1.1. уравнениям регрессии построить доверительные интервалы потребления дизельного топлива, соответствующие вероятности 0,9  при следующих значениях независимой переменной: Построить доверительную полосу для уравнения регрессии. Изобразить на графике поля рассеяния, прямые регрессии и доверительные полосы.


 Решение.


Доверительные интервалы среднего потребления дизельного топлива для уравнения парной линейной регрессии  находятся по формуле

где  соответственно верхняя и нижняя границы доверительного интервала; значение независимой переменной  для которого определяется доверительный интервал, квантиль распределения Стьюдента, доверительная вероятность, (n-2) – число степеней свободы;


Рассмотрим уравнение  Пусть  тогда

Используя вспомогательную таблицу:

i

1

4,0208

2,7262

2,2331

2

2,8495

0,2021

-0,8625

3

2,6030

0,0412

-1,2625

4

2,7262

0,0159

-1,0625

5

2,8495

0,0025

-0,8625

6

2,9728

0,0162

-0,6625

7

3,0345

0,2167

-0,5625

8

3,2811

0,0004

-0,1625

9

3,5277

0,0297

0,2375

10

3,6510

0,1218

0,4375

11

3,8359

0,0013

0,7375

12

3,5893

0,2394

0,3375

13

3,7126

0,0826

0,5375

14

3,8359

0,3182

0,7375

15

3,8359

0,1326

0,7375

16

3,7743

0,0510

0,6375

сумма

 

4,1978

 

cумма квадратов


12,6677


Получим  и заполним таблицу:


3,300

2,603

0,238

2,184

3,021

4,563

3,381

0,137

3,140

3,622

5,600

4,021

0,210

3,651

4,391


График уравнения регрессии, и доверительные интервалы и доверительная полоса приведены на рис.

Аналогично находятся доверительные интервалы для уравнения  Используя вспомогательную таблицу:

I

1

2,9111

0,0446

-0,4688

2

2,7105

0,0964

-0,6688

3

2,6102

0,0442

-0,7688

4

2,5099

0,0081

-0,8688

5

2,6102

0,0840

-0,7688

6

2,9111

0,0357

-0,4688

7

3,1117

0,1508

-0,2688

8

3,5129

0,0453

0,1313

9

3,8138

0,0130

0,4313

10

3,9141

0,0074

0,5313

11

3,7135

0,0075

0,3313

12

3,6132

0,2634

0,2313

13

4,1147

0,0132

0,7313

14

3,9141

0,2361

0,5313

15

3,9141

0,0817

0,5313

16

4,2150

0,0462

0,8313

сумма

 

1,1775

 

cумма квадратов


5,334

Получим  и заполним таблицу:


3,100

2,510

0,131

2,279

2,741

3,969

3,381

0,073

3,254

3,509

4,800

4,215

0,127

3,991

4,439


График уравнения регрессии, и доверительные интервалы и доверительная полоса приведены на рис.

Задача 2.

2.1. Найти все коэффициенты парной корреляции, проверить их значимость и проанализировать тесноту линейной связи между всеми парами переменных.

Решение.

Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим 0,713. Так как

3,8 >1,761, то  существенно отличается от 0 и существует сильная линейная положительная связь между y и .


Аналогично проверим неравенство для  0,906:

8,01>1,761, значит, также существенно отличается от 0 и существует сильная линейная положительная связь между y и. .


 Для 0,798:

4,95>1,761, значит,  существенно отличается от 0 и существует сильная линейная положительная связь между и .


2.2. Найти по методу наименьших квадратов оценки коэффициентов линейной регрессионной модели

Решение.

Уравнение регрессии ищем в виде:

Обозначения

тогда

Вектор  находится по формуле:

В нашем случае

Тогда .

Таким образом,


2.3. Найти коэффициенты множественной корреляции и детерминации.


Решение.


Коэффициент R множественной корреляции определяется по формуле:


Воспользуемся вспомогательной таблицей:


i

1

2,8782

-0,6813

-0,1782

2

2,7143

-0,9813

-0,3143

3

2,6205

-0,9813

-0,2205

4

2,5136

-0,7813

0,0864

5

2,6118

-0,4813

0,2882

6

2,9151

-0,2813

0,1849

7

3,1179

0,1188

0,3821

8

3,5193

-0,0813

-0,2193

9

3,8182

0,3188

-0,1182

10

3,9164

0,6188

0,0836

11

3,7049

0,4188

0,0951

12

3,6110

-0,2813

-0,5110

13

4,1193

0,6188

-0,1193

14

3,9099

1,0188

0,4901

15

3,9099

0,8188

0,2901

16

4,2196

0,6188

-0,2196

Сумма квадратов


6,0803

1,1442

Тогда R=0,906.

Коэффициент множественной детерминации  равен квадрату коэффициента множественной корреляции, то есть  =0,82.

 

2.4. В 2005г. планируется увеличение объёма валовой продукции на 1 млрд. р. по сравнению с 2000г., а объём капитальных вложений – на 0,3 млрд. р. Дать точечный и интервальный прогноз среднего потребления дизельного топлива в 2005г. при уровне доверия 0,9. (Считая, что объёмы валовой продукции и капитальных вложений в 2005г. будут равны запланированным).

Решение.

Для =6,2; = 5,1 получаем точечный прогноз: = 4,505.

Для нахождения интервального прогноза вычислим значения всех параметров, входящих в формулу:  , где ,  - соответственно верхняя и нижняя границы доверительного интервала, - вектор независимых переменных, для которого определяется интервал, =1,78 - квантиль распределения Стьюдента, - доверительная вероятность, n – количество наблюдений, (n-3)- число степеней свободы,

=0,375;    =1,1442/13=0,088;    S =0,297;    =0,182;

И тогда *= 4,829; = 4,182.


2.5. На основе полученных в задачах 1, 2 статистических характеристик  провести содержательный экономический анализ зависимости потребления дизельного топлива от объёмов валовой продукции  сельского хозяйства и капитальных вложений.

Решение.

На основании проведённых расчётов и полученных статистических характеристик можно сделать определённые выводы относительно взаимосвязей между исследуемыми экономическими показателями.

Так как 0,713 и проверка значимости показала его существенное отличие от 0, то есть основания утверждать, что между y и  существует достаточно тесная положительная линейная зависимость, которая может быть отражена с помощью найденного уравнения регрессии. Коэффициент = 0,5686  в данном случае не имеет  экономического смысла. Коэффициент =0,6165 характеризует размер прироста потребления дизельного топлива, обусловленного приростом объёма валового выпуска продукции сельского хозяйства на единицу.

Значение  0,906 свидетельствует о тесной линейной связи между y и :  Коэффициент b = 1,003 в уравнении показывает, какого прироста потребления дизельного топлива следует ожидать при увеличении объема капитальных вложений на единицу.

Коэффициент = -0,022  в уравнении    показывает, что при росте валового выпуска продукции промышленности на 1 млрд. р. и неизменном объёме капитальных  вложений следует ожидать уменьшения потребления  дизельного топлива на 0,022 млн. тонн. Коэффициент  = 1,025 показывает, что при увеличении объёма капитальных вложений на 1 млрд. р.  и неизменном объеме валовой продукции промышленности следует ожидать увеличения потребления дизельного топлива на 1,025 млн. тонн.


Задача 3.

3.1. Построить ломанную кривую изменения потребления дизельного топлива во времени. Выдвинуть гипотезу о виде зависимости объёма потребления дизельного топлива от времени. Записать трендовую модель, отражающую изменение потребления дизельного топлива во времени. Оценить неизвестные параметры модели методом наименьших квадратов.

Решение.

На основании визуального наблюдения ломанной кривой, отражающей характер изменения по годам объема потребления дизельного топлива, выдвигаем гипотезу о линейном тренде. Следовательно, трендовая модель, отражающая изменение потребления дизельного топлива, запишется в виде

 

где - неизвестные параметры, u-случайное отклонение.

Коэффициенты регрессионного уравнения тренда  находятся по методу наименьших квадратов и равны:

Воспользуемся вспомогательной таблицей:


t

y

ty

1

1

2,7

2,7

2,451

0,249

2

2

2,4

4,8

2,575

-0,175

3

3

2,4

7,2

2,699

-0,299

4

4

2,6

10,4

2,823

-0,223

5

5

2,9

14,5

2,947

-0,047

6

6

3,1

18,6

3,071

0,029

7

7

3,5

24,5

3,195

0,305

8

8

3,3

26,4

3,319

-0,019

9

9

3,7

33,3

3,443

0,257

10

10

4

40

3,567

0,433

11

11

3,8

41,8

3,691

0,109

12

12

3,1

37,2

3,815

-0,715

13

13

4

52

3,939

0,061

14

14

4,4

61,6

4,063

0,337

15

15

4,2

63

4,187

0,013

16

16

4

64

4,311

-0,311

cумма

136

54,1

502

54,100

 

сумма квадратов

1496




1,3190


И получим  =2,328;  = 0,124. Следовательно, уравнение регрессии будет иметь вид


3.2. Для найденного уравнения регрессии построить доверительную полосу при уровне доверия 0,9. Нарисовать её на графике вместе с линией регрессии.

 Решение.

Доверительный интервал для линейного тренда  находится по формуле:

где

В нашем случае:

*  = 8,5; = 0,094; S = 0,307.




Результат запишем в виде таблицы:

год

t

1985

1

2,4515

0,1128

2,2528

2,6502

1992

8

3,3193

0,2135

2,9433

3,6952

2000

16

4,3110

0,3412

3,7103

4,9118


На рисунке. изображены график тренда, доверительные интервалы (для t=1,8,16), и доверительная полоса .

3.3. По линейному уравнению тренда найти точечный и интервальный прогнозы среднего потребления дизельного топлива в 2005. и 2007г. (доверительную вероятность принять равной 0,9). Изобразить на графике точечный и интервальный прогноз.

Решение.

 Тогда = 4,9309; = 5,1788. Аналогично пункту 3.2 решение запишем в виде таблицы:

годы

t

2005

21

4,9309

0,4227

4,1866

5,6752

2007

23

5,1788

0,4554

4,3768

5,9809


На рисунке изображены графики линейного тренда, точечные прогнозы  (обозначены точками на прямой) и доверительные интервалы прогноза потребления дизельного топлива в 2005, 2007гг.

Задача 4.

4.2. Для уравнений регрессии:

проверить наличие или отсутствие автокорреляции, используя критерий Дарбина-Уотсона и уровне значимости .

Решение.

Критерий Дарбина-Уотсона имеет вид:

где - отклонения от линии регрессии, i=1,..n.

Для регрессионной модели :

Используя таблицу:


1

-0,1782


2

-0,3143

-0,1362

3

-0,2205

0,09385

4

0,0864

0,30686

5

0,2882

0,20182

6

0,1849

-0,1032

7

0,3821

0,19713

8

-0,2193

-0,6014

9

-0,1182

0,10111

10

0,0836

0,20182

11

0,0951

0,01155

12

-0,5110

-0,6062

13

-0,1193

0,39173

14

0,4901

0,60938

15

0,2901

-0,2

16

-0,2196

-0,5097

сумм кв

1,1442

1,81658



Посчитаем d=1,588.

У нас n=16, m=2, , следовательно, условие 0,98=>d>=1,54 не выполняется, значит, автокорреляция присутствует.  


Для  используя таблицу:


I

0,249


2

-0,175

-0,42397

3

-0,299

-0,12397

4

-0,223

0,076029

5

-0,047

0,176029

6

0,029

0,076029

7

0,305

0,276029

8

-0,019

-0,32397

9

0,257

0,276029

10

0,433

0,176029

11

0,109

-0,32397

12

-0,715

-0,82397

13

0,061

0,776029

14

0,337

0,276029

15

0,013

-0,32397

16

-0,311

-0,32397

сумма квадратов

1,3190

2,198207


Посчитаем d=1,666. У нас n=16, m=1, ,  следовательно, условие

1,1=<d<=1,37 не выполняется, значит, автокорреляция присутствует.


Для сначала найдём коэффициенты:

* =3; =0,114.

Тогда уравнение регрессии имеет вид:



1

-0,386

 

2

-0,072

0,314

3

0,1419

0,214

4

0,3559

0,214

5

0,3699

0,014

6

0,1838

-0,186

7

0,0978

-0,086

8

-0,188

-0,286

9

-0,374

-0,186

10

-0,36

0,014

11

-0,046

0,314

12

0,1676

0,214

13

-0,218

-0,386

14

0,0956

0,314

15

0,2096

0,114

16

0,0235

-0,186

сумм кв

0,918

0,7885


Тогда d=0,859. У нас n=16, m=1, , следовательно, условие 1,1=<d<=1,37 не выполняется, значит, автокорреляция присутствует.




4.2. Для уравнения проверить наличие или отсутствие мультиколлинеарности.

Решение.

Используя пункт 2.1, получаем 0,798 – достаточно близок к 1, значит, имеет место мультиколлинеарность.

 

 

 

ЛИТЕРАТУРА


1.                 Эконометрика /Под ред. Елисеевой – М.: Финансы и статистика, 2001.

2.                 Практикум по эконометрике /Под ред. Елисеевой – М.: Финансы и статистика, 2001.

3.                 Бородич С.А. Эконометрика. – Минск: Новое знание, 2001.

4.                 Четыркин Е.М. Статистические  методы прогнозирования. – М.: Статистика, 1975.

5.                 Доугерти К. Введение в эконометрику - М.: ИНФРА-М, 1999.