Задача 1.

1.1 Выяснить,  существует ли связь между потреблением дизельного топлива (y) и объёмом валовой продукции (). (Для этого построить поле рассеяния. На основе его визуального анализа выдвинуть гипотезу о виде статистической зависимости y от ). Найти точечные оценки неизвестных параметров модели. Выяснить, существует ли связь между потреблением дизельного топлива (y) и объёмом капитальных вложений (). Найти оценки неизвестных параметров модели.

Годы


Валовая продукция промышленности

( млрд. р.)

Объём капитальных вложений

( млрд. р.)

Объём потребления дизельного топлива

(y млн. т.)

1985

7.1

4.9

1.6

1986

6.9

4.8

1.5

1987

6.8

4.7

1.5

1988

6.8

4.6

1.5

1989

7

4.7

1.6

1990

7.1

4.9

1.6

1991

7.2

5.1

1.7

1992

7.5

5.4

1.7

1993

7.7

5.7

1.7

1994

7.8

5.8

1.8

1995

7.8

5.6

1.8

1996

7.7

5.5

1.6

1997

7.9

5.9

1.8

1998

8

5.8

1.9

1999

8

5.8

1.8

2000

7.9

6

1.8


Решение: По исходным данным построим поля рассеяния переменной у в зависимости от  и , нанесем линии тренда и эллипсы рассеяния

Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость потребления дизельного топлива (y) от объёмов продукции () описывается линейной моделью вида:

где  и  - неизвестные постоянные коэффициенты, а e – случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, между y и   зависимость описывается моделью:

Найдем уравнения линейной регрессии

 и

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):

      .

        .

Найдет сначала коэффициенты первого уравнения. Вычисления поясним с помощью таблицы:

 

y

1

7.1

4.9

1.6

50.41

24.01

11.36

7.84

34.79

2.56

2

6.9

4.8

1.5

47.61

23.04

10.35

7.2

33.12

2.25

3

6.8

4.7

1.5

46.24

22.09

10.2

7.05

31.96

2.25

4

6.8

4.6

1.5

46.24

21.16

10.2

6.9

31.28

2.25

5

7

4.7

1.6

49

22.09

11.2

7.52

32.9

2.56

6

7.1

4.9

1.6

50.41

24.01

11.36

7.84

34.79

2.56

7

7.2

5.1

1.7

51.84

26.01

12.24

8.67

36.72

2.89

8

7.5

5.4

1.7

56.25

29.16

12.75

9.18

40.5

2.89

9

7.7

5.7

1.7

59.29

32.49

13.09

9.69

43.89

2.89

10

7.8

5.8

1.8

60.84

33.64

14.04

10.44

45.24

3.24

11

7.8

5.6

1.8

60.84

31.36

14.04

10.08

43.68

3.24

12

7.7

5.5

1.6

59.29

30.25

12.32

8.8

42.35

2.56

13

7.9

5.9

1.8

62.41

34.81

14.22

10.62

46.61

3.24

14

8

5.8

1.9

64

33.64

15.2

11.02

46.4

3.61

15

8

5.8

1.8

64

33.64

14.4

10.44

46.4

3.24

16

7.9

6

1.8

62.41

36

14.22

10.8

47.4

3.24

сумма

119.2

85.2

26.9

891.08

457.4

201.19

144.09

638.03

45.47

Средние

7.45

5.325

1.68125



 

 

 



n=16,

  

  

  

 

Тогда  

    

Таким образом,

.

Правильность вычисления коэффициентов этого уравнения подтверждается данными графика

Аналогично находятся оценки коэффициентов модели

 а именно,

1.2. По найденным в п. 1.1. уравнениям регрессии построить доверительные интервалы потребления дизельного топлива, соответствующие вероятности 0,9 при следующих значениях независимой переменной: Построить доверительную полосу для уравнения регрессии. Изобразить на графике поля рассеяния, прямые регрессии и доверительные полосы.

 Решение.

Доверительные интервалы среднего потребления дизельного топлива для уравнения парной линейной регрессии  находятся по формуле

где  соответственно верхняя и нижняя границы доверительного интервала; значение независимой переменной  для которого определяется доверительный интервал, квантиль распределения Стьюдента, доверительная вероятность, (n-2) – число степеней свободы;

,

Сначала рассмотрим уравнение . По условию задачи  число степеней свободы 16 тогда, по таблице распределения Стьюдента находим t0.90 = 1.76. 

Поясним вычисления с помощью таблицы:


i

 

1

1,28322

0,00693

-0,7125

 

2

1,17108

0,02927

-1,0125

 

3

0,98418

0,00025

-1,5125

 

4

1,1337

0,00114

-1,1125

 

5

1,24584

0,00293

-0,8125

 

6

1,28322

0,01364

-0,7125

 

7

1,35798

0,05857

-0,5125

 

8

1,54488

0,00201

-0,0125

 

9

1,73178

0,00101

0,4875

 

10

1,80654

0,00873

0,6875

 

11

1,99344

0,03742

1,1875

 

12

1,73178

0,11008

0,4875

 

13

1,84392

0,00314

0,7875

 

14

1,91868

0,03288

0,9875

 

15

1,91868

0,00661

0,9875

 

16

1,84392

0,00314

0,7875

 

сумма

 

0,31776

 

 

cумма квадратов

 

 12,0375



Получим  и заполним таблицу:



4,1

 0,984

  0,076

0,851

1,117

5,61

1,549

0,038

1,483

1,615

6,8

1,993

0,064

1,881

2,105


График уравнения регрессии, и доверительные интервалы и доверительная полоса приведены на рисунке.


Таким же образом находим доверительные интервалы для уравнения . Используя вспомогательную таблицу:

I

1

1.5842

0.0003

-0.4250

2

1.5613

0.0038

-0.5250

3

1.5385

0.0015

-0.6250

4

1.5156

0.0002

-0.7250

5

1.5385

0.0038

-0.6250

6

1.5842

0.0003

-0.4250

7

1.6299

0.0049

-0.2250

8

1.6984

0.0000

0.0750

9

1.7669

0.0045

0.3750

10

1.7898

0.0001

0.4750

11

1.7441

0.0031

0.2750

12

1.7212

0.0147

0.1750

13

1.8126

0.0002

0.5750

14

1.7898

0.0122

0.4750

15

1.7898

0.0001

0.4750

16

1.8354

0.0013

0.6750

сумма

0.0508 


График уравнения регрессии, и доверительные интервалы и доверительная полоса приведены на следующем рисунке

Задача 2

2.1. Найти все коэффициенты парной корреляции, проверить их значимость и проанализировать тесноту линейной связи между всеми парами переменных.

Решение.

Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим 0,9108.

Так как 

8,6>1,761, то  существенно отличается от 0 и существует сильная линейная положительная связь между y и .

Аналогично проверим неравенство для  0,8901:

8,486>1,761, значит, также существенно отличается от 0 и существует сильная линейная положительная связь между y и .

Для 0,9796; 11,51>1,761, значит,  существенно отличается от 0 и существует сильная линейная положительная связь между и .


2.2. Найти по методу наименьших квадратов оценки коэффициентов линейной регрессионной модели

Решение.

Уравнение регрессии ищем в виде:

Обозначения

тогда

Вектор  находится по формуле:

В нашем случае 

248,92.

Тогда

Таким образом,


2.3. Найти коэффициенты множественной корреляции и детерминации.

Решение.

Коэффициент R множественной корреляции определяется по формуле:


Воспользуемся вспомогательной таблицей:

i

1

0,06

-0,35

2

0,15

-0,55

3

0,025

-0,55

4

-0,02

-0,45

5

-0,135

-0,25

6

-0,14

-0,15

7

-0,25

0,05

8

0,05

-0,05

9

0,05

0,15

10

-0,085

0,35

11

0,065

0,25

12

0,275

-0,15

13

-0,015

0,35

14

-0,225

0,55

15

-0,125

0,45

16

0,01

0,35

0,2825

5,8775

Тогда R=0,976.

Коэффициент множественной детерминации  равен квадрату коэффициента множественной корреляции, то есть  =0,952.

 

2.4. В 2005г. планируется увеличение объёма валовой продукции на 1 млрд. р. по сравнению с 2000г., а объём капитальных вложений – на 0,3 млрд. р. Дать точечный и интервальный прогноз среднего потребления дизельного топлива в 2005г. при уровне доверия 0,9. (Считая, что объёмы валовой продукции и капитальных вложений в 2005г. будут равны запланированным).

Решение.

Для =9,5; =8,2 получаем точечный прогноз: =2,185.

Для нахождения интервального прогноза вычислим значения всех параметров, входящих в формулу:  , где ,  - соответственно верхняя и нижняя границы доверительного интервала, - вектор независимых переменных, для которого определяется интервал, - квантиль распределения Стьюдента, - доверительная вероятность, n – количество наблюдений, (n-3)- число степеней свободы,

=0,329;    =0,0217;    S=0,147;    =0,0843;

И тогда *=2,334; =2,036.


2.5. На основе полученных в задачах 1, 2 статистических характеристик  провести содержательный экономический анализ зависимости потребления дизельного топлива от объёмов валовой продукции  сельского хозяйства и капитальных вложений.

Решение.

На основании проведённых расчётов и полученных статистических характеристик можно сделать определённые выводы относительно взаимосвязей между исследуемыми экономическими показателями.

Так как 0,8901 и проверка значимости показала его существенное отличие от 0, то есть основания утверждать, что между y и  существует достаточно тесная положительная линейная зависимость, которая может быть отражена с помощью найденного уравнения регрессии . Коэффициент = – 0,2425  в данном случае не имеет  экономического смысла. Коэффициент =0,2528 характеризует размер прироста потребления дизельного топлива, обусловленного приростом объёма валового выпуска продукции сельского хозяйства на единицу.

Значение 0,8901 свидетельствует о достаточно тесной линейной связи между y и  ()  Коэффициент b=0,4648 в уравнении показывает, какого прироста потребления дизельного топлива следует ожидать при увеличении объема капитальных вложений на единицу.

Коэффициент =0,31  в уравнении   показывает, что при росте валового выпуска продукции сельского хозяйства на 1 млрд. р. и неизменном объёме капитальных  вложений следует ожидать увеличения потребления  дизельного топлива на 0,31 млн. тонн. Коэффициент =0,29 показывает, что при увеличении объёма капитальных вложений на 1 млрд. р.  и неизменном объеме валовой продукции сельского хозяйства следует ожидать увеличения потребления дизельного топлива на 0,29 млн. тонн.


Задача 3

3.1. Построить ломанную кривую изменения потребления дизельного топлива во времени. Выдвинуть гипотезу о виде зависимости объёма потребления дизельного топлива от времени. Записать трендовую модель, отражающую изменение потребления дизельного топлива во времени. Оценить неизвестные параметры модели методом наименьших квадратов.

Решение.

           На основании визуального наблюдения ломанной кривой, отражающей характер изменения по годам объема потребления дизельного топлива, выдвигаем гипотезу о линейном тренде. Следовательно, трендовая модель, отражающая изменение потребления дизельного топлива, запишется в виде

 

где - неизвестные параметры, -случайное отклонение.

Коэффициенты регрессионного уравнения тренда  находятся по методу наименьших квадратов и равны:

Воспользуемся вспомогательной таблицей:


t

y

ty

1

1

2,9

2,9

2,637

0,263

2

2

2,6

5,2

2,744

-0,144

3

3

2,6

7,8

2,851

-0,251

4

4

2,7

10,8

2,958

-0,258

5

5

3

15

3,065

-0,065

6

6

3,2

19,2

3,172

0,0028

7

7

3,5

24,5

3,279

0,221

8

8

3,4

27,2

3,386

0,014

9

9

3,7

33,3

3,493

0,207

10

10

4

40

3,6

0,4

11

11

3,8

41,8

3,707

0,093

12

12

3,2

38,4

3,814

-0,614

13

13

4

52

3,921

0,079

14

14

4,3

60,2

4,028

0,272

15

15

4,1

61,5

4,135

-0,035

16

16

4

64

4,242

-0,242

cумма

136


503,8

55,032

-0,0572

сумма квадратов

1496






И получим  =1,49;  = 0,0.225. Следовательно, уравнение регрессии будет иметь вид:


3.2. Для найденного уравнения регрессии построить доверительную полосу при уровне доверия 0,9. Нарисовать её на графике вместе с линией регрессии.

 Решение.

Доверительный интервал для линейного тренда  находится по формуле:  где

Воспользуемся вспомогательной таблицей


1

-7,5

0,164

2

-6,5

-0,1045

3

-5,5

-0,173

4

-4,5

-0,1415

5

-3,5

-0,01

6

-2,5

0,0215

7

-1,5

0,153

8

-0,5

-0,0155

9

0,5

0,116

10

1,5

0,2475

11

2,5

0,079

12

3,5

-0,3895

13

4,5

0,042

14

5,5

0,1735

15

6,5

0,005

16

7,5

-0,1635

сумма квадратов

340

0,40327


В нашем случае:

*  =8,5; = 0,029; S=0,17;

Результат запишем в виде таблицы:


год

t




1985

1

1,036

0,06

0,93

1,142

1992

8

1,516

0,048

1,431

1,6

2000

16

2,064

0,105

1,879

2,248


На рисунке. изображены график тренда, доверительные интервалы (для t=1,8,16), и доверительная полоса.



3.3. По линейному уравнению тренда найти точечный и интервальный прогнозы среднего потребления дизельного топлива в 2005 и 2007г. (доверительную вероятность принять равной 0,9). Изобразить на графике точечный и интервальный прогноз.

Решение.

 Тогда =2,406;=2,543. Аналогично пункту 3.2 решение запишем в виде таблицы:

годы

t

2005

21

2,406

0,148

2,146

2,666

2007

23

2,543

0,166

2,251

2,835


На рисунке 5 изображены графики линейного тренда  точечные прогнозы (обозначены точками на прямой) и доверительные интервалы прогноза потребления дизельного топлива в 2005, 2007 гг.



Задача 4

4.2. Для уравнений регрессии:

Проверить наличие или отсутствие автокорреляции, используя критерий Дарбина-Уотсона и уровне значимости .

Решение.

Критерий Дарбина-Уотсона имеет вид:

где - отклонения от линии регрессии, i=1,..n.

Для регрессионной модели :

Используя таблицу:


I

1

0,06

-

2

0,15

0,09

3

0,025

-0,125

4

-0,02

-0,045

5

-0,135

-0,115

6

-0,14

-0,005

7

-0,25

-0,11

8

0,05

0,3

9

0,05

2,22E-16

10

-0,085

-0,135

11

0,065

0,15

12

0,275

0,21

13

-0,015

-0,29

14

-0,225

-0,21

15

-0,125

0,1

16

0,01

0,135

сумм квадратов

0,2825

0,3824


Посчитаем d=1,354.

У нас n=16, m=2, , следовательно, d<=1,54, значит, делается вывод о наличии автокорреляции остатков.  

Для  Используя таблицу:


1

0,164


2

-0,1045

-0,2685

3

-0,173

-0,0685

4

-0,1415

0,0315

5

-0,01

0,1315

6

0,0215

0,0315

7

0,153

0,1315

8

-0,0155

-0,1685

9

0,116

0,1315

10

0,2475

0,1315

11

0,079

-0,1685

12

-0,3895

-0,4685

13

0,042

0,4315

14

0,1735

0,1315

15

0,005

-0,1685

16

-0,1635

-0,1685

сумм кв

0,403266

0,684484


Посчитаем d=1,697. У нас n=16, m=2, , следовательно,4->d>=1,37, значит, автокорреляция отсутствует.  


Для сначала найдём коэффициенты: 

*=1,4725; =0,1224.

Тогда уравнение регрессии имеет вид:


1

-0,4051


2

-0,0827

0,3224

3

0,1397

0,2224

4

0,3621

0,2224

5

0,3845

0,0224

6

0,2069

-0,1776

7

0,1293

-0,0776

8

-0,1483

-0,2776

9

-0,4259

-0,2776

10

-0,4035

0,0224

11

-0,0811

0,3224

12

0,2413

0,3224

13

-0,2363

-0,4776

14

0,0861

0,3224

15

0,2085

0,1224

16

0,0309

-0,1776

сумм кв

1,067621

0,982006


Тогда d=0,92. У нас n=16, m=1, , следовательно, d<=1,1, значит, автокорреляция положительна.

4.2. Для уравнения проверить наличие или отсутствие мультиколлинеарности.

Решение.

Используя пункт 2.1, получаем 0,9796 – достаточно близок к 1, значит, имеет место мультиколлинеарность.