Содержание

Исходные данные. 3

1.   Корреляционный анализ. 4

1.1. Построить матрицу парных коэффициентов корреляции. 4

1.2. Проверить значимость парных коэффициентов корреляции. (Уровень значимости выбирается самостоятельно) 5

1.3. Для любого значимого коэффициента построить доверительный интервал. 6

1.4.    Рассчитать множественный коэффициент корреляции. Проверить его значимость. 6

2.   Регрессионный анализ. 8

2.1.    Получить оценку предложенной множественной регрессионной модели, используя методы матричной алгебры. 8

2.2.    Проверить значимость каждого коэффициента регрессии. 9

2.3. Определить доверительный интервал для значимых коэффициентов регрессии. 10

3.   Дисперсионный анализ. 11

3.1. Получить оценку коэффициента детерминации. 11

Коэффициент детерминации находим по формуле:.......................... 11

3.2.    Проверить его значимость. 11

4. Проверка модели на присутствие гетероскедастичности и автокорреляции. 11

4.1.    Используя тест Дарбина – Уотсона, проверить модель на наличие автокорреляции в «остатках». 11

4.2. Используя тест ранговой корреляции Спирмена или тест Голдфелда – Квандта, проверить полученную модель на присутствие гетероскедастичности. 13

Список литературы.. 15


Исходные данные


Имеются данные о прибыли, производительности труда и рентабельности предприятия за 1985 – 2000 год.

Годы


Прибыль

( млрд. р.)

Производительность

труда

( тонны/час )

Рентабельность

(y %)

1985

4,8

3

2

1986

3,5

2,9

1,8

1987

3,1

2,8

1,8

1988

3,3

2,7

1,9

1989

3,5

2,8

2,1

1990

3,7

3

2,2

1991

3,8

3,3

2,5

1992

4,2

3,6

2,4

1993

4,6

3,9

2,6

1994

4,7

4,1

2,8

1995

5,1

3,8

2,7

1996

4,7

3,7

2,2

1997

4,8

4,2

2,8

1998

5

4,1

3,1

1999

5

4,1

2,9

2000

4,9

4,3

2,8


1.    Корреляционный анализ


1.1. Построить матрицу парных коэффициентов корреляции.

Решение.

Коэффициент парной корреляции находится по формуле:

Для расчета коэффициента корреляции используем таблицу:





1

4,8

3

23,04

9

14,4

2

3,5

2,9

12,25

8,41

10,15

3

3,1

2,8

9,61

7,84

8,68

4

3,3

2,7

10,89

7,29

8,91

5

3,5

2,8

12,25

7,84

9,8

6

3,7

3

13,69

9

11,1

7

3,8

3,3

14,44

10,89

12,54

8

4,2

3,6

17,64

12,96

15,12

9

4,6

3,9

21,16

15,21

17,94

10

4,7

4,1

22,09

16,81

19,27

11

5,1

3,8

26,01

14,44

19,38

12

4,7

3,7

22,09

13,69

17,39

13

4,8

4,2

23,04

17,64

20,16

14

5

4,1

25

16,81

20,5

15

5

4,1

25

16,81

20,5

16

4,9

4,3

24,01

18,49

21,07

сумма

68,7

56,3

302,21

203,13

246,91


Получаем:

Аналогично считаются парные коэффициенты корреляции и.

Можно найти матрицу парных коэффициентов корреляции используя средства редактора EXCEL:

 

Столбец 1

Столбец 2

Столбец 3

Столбец 1

1

0,85814

0,79195

Столбец 2

0,85814

1

0,918495

Столбец 3

0,79195

0,918495

1


1.2. Проверить значимость парных коэффициентов корреляции. (Уровень значимости выбирается самостоятельно)

Решение.

Проверяем значимость коэффициента корреляции 0,792 при уровне значимости . Так как

4,85 >1,761, то  существенно отличается от 0, значим и существует сильная линейная положительная связь между y и .


Аналогично проверим неравенство для  0,918:

8,69>1,761, значит, также существенно отличается от 0, значим и существует сильная линейная положительная связь между y и. .


 Для 0,858:

6,25>1,761, значит,  существенно отличается от 0, значим и существует сильная линейная положительная связь между и .


1.3. Для любого значимого коэффициента построить доверительный интервал.

Решение.



1.1  Рассчитать частный коэффициент корреляции (любой). Проверить его значимость.

Решение. Частный кэффициент корреляции находим по формуле:

 

Получаем

1.4.         Рассчитать множественный коэффициент корреляции. Проверить его значимость.

Решение.

Для нахождения уравнения регрессии  используем средства редактора EXCEL:

ВЫВОД ИТОГОВ









Регрессионная статистика




Множественный R

0,918524




R-квадрат

0,843686




Нормированный R-квадрат

0,819638




Стандартная ошибка

0,178757




Наблюдения

16









Дисперсионный анализ



 

df

SS

MS

F

Регрессия

2

2,242096

1,121048

35,08298

Остаток

13

0,415404

0,031954


Итого

15

2,6575

 

 






 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

0,056192

0,297166

0,189094

0,85294

Переменная X 1

0,008643

0,129491

0,066747

0,947799

Переменная X 2

0,659097

0,155328

4,243261

0,000959

Таким образом,  

Коэффициент R множественной корреляции определяется по формуле:

Воспользуемся вспомогательной таблицей:


i

1

2,0750

-0,4125

-0,0750

2

1,9978

-0,6125

-0,1978

3

1,9285

-0,6125

-0,1285

4

1,8643

-0,5125

0,0357

5

1,9319

-0,3125

0,1681

6

2,0655

-0,2125

0,1345

7

2,2641

0,0875

0,2359

8

2,4652

-0,0125

-0,0652

9

2,6664

0,1875

-0,0664

10

2,7991

0,3875

0,0009

11

2,6048

0,2875

0,0952

12

2,5355

-0,2125

-0,3355

13

2,8659

0,3875

-0,0659

14

2,8017

0,6875

0,2983

15

2,8017

0,4875

0,0983

16

2,9327

0,3875

-0,1327

Сумма квадратов


2,4873

0,4098


Тогда R=0,9185.

Так как

8,375 >1,771, то R существенно отличается от 0 и существует сильная связь между y и , .

Вывод по разделу 1.

Проведенные исследования показали, что между переменными существует сильная связь. Так как парные коэффициенты корреляции положительны, то с ростом прибыли и производительности труда происходит рост  рентабельности.


2.      Регрессионный анализ.


2.1.         Получить оценку предложенной множественной регрессионной модели, используя методы матричной алгебры.

Решение.

Уравнение регрессии ищем в виде:

.

Обозначения

тогда

Вектор  находится по формуле:

Используем таблицу:


y







1

4,8

3

2

23,04

9

9,6

6

14,4

4

2

3,5

2,9

1,8

12,25

8,41

6,3

5,22

10,15

3,24

3

3,1

2,8

1,8

9,61

7,84

5,58

5,04

8,68

3,24

4

3,3

2,7

1,9

10,89

7,29

6,27

5,13

8,91

3,61

5

3,5

2,8

2,1

12,25

7,84

7,35

5,88

9,8

4,41

6

3,7

3

2,2

13,69

9

8,14

6,6

11,1

4,84

7

3,8

3,3

2,5

14,44

10,89

9,5

8,25

12,54

6,25

8

4,2

3,6

2,4

17,64

12,96

10,08

8,64

15,12

5,76

9

4,6

3,9

2,6

21,16

15,21

11,96

10,14

17,94

6,76

10

4,7

4,1

2,8

22,09

16,81

13,16

11,48

19,27

7,84

11

5,1

3,8

2,7

26,01

14,44

13,77

10,26

19,38

7,29

12

4,7

3,7

2,2

22,09

13,69

10,34

8,14

17,39

4,84

13

4,8

4,2

2,8

23,04

17,64

13,44

11,76

20,16

7,84

14

5

4,1

3,1

25

16,81

15,5

12,71

20,5

9,61

15

5

4,1

2,9

25

16,81

14,5

11,89

20,5

8,41

16

4,9

4,3

2,8

24,01

18,49

13,72

12,04

21,07

7,84

сумма

68,7

56,3

38,6

302,21

203,13

169,21

139,18

246,91

95,78


Получаем:

Тогда .

Таким образом,


2.2.         Проверить значимость каждого коэффициента регрессии.

Решение.

Для проверить значимости  коэффициента регрессии bj проверяем выполнение неравенства  , где , .


Для b0=0,0562:

  , .

Так как , то коэффициент b0=0,0562 не является значимым.


Для b1=0,0086:

  , .

Так как , то коэффициент b1=0,0086 не является значимым.


Для b2=0,6591:

  , .

Так как , то коэффициент b2=0,6591 является значимым.

 

2.3. Определить доверительный интервал для значимых коэффициентов регрессии.

Решение.

Строим доверительный интервал для коэффициента b2=0,6591.

Вывод по разделу 2.

Зависимость рентабельности от прибыли и производительности труда описывается уравнением

Значимым  в этом уравнении является только коэффициент при х2 , который с вероятностью 0,9 принадлежит интервалу (0,386; 0,932).

3.      Дисперсионный анализ


3.1. Получить оценку коэффициента детерминации.

Решение.

Коэффициент детерминации находим по формуле:

Получаем .


3.2.         Проверить его значимость.

Решение. Для проверки значимости коэффициента детерминации используем F-статистику:

Следовательно, коэффициент детерминации статистически значим.


Вывод по разделу 3.

Близость к 1 и значимость коэффициента детерминации говорят о том, что  полученное уравнения множественной регрессии достаточно точно отражает зависимость рентабельности от прибыли и производительности труда.


4. Проверка модели на присутствие гетероскедастичности и автокорреляции


4.1.         Используя тест Дарбина – Уотсона, проверить модель на наличие автокорреляции в «остатках».

Решение.

Критерий Дарбина-Уотсона имеет вид:

где - отклонения от линии регрессии, i=1,..n.

Для регрессионной модели :

Используя таблицу:


1

-0,0750


2

-0,1978

-0,1229

3

-0,1285

0,06937

4

0,0357

0,16418

5

0,1681

0,13236

6

0,1345

-0,0335

7

0,2359

0,10141

8

-0,0652

-0,3012

9

-0,0664

-0,0012

10

0,0009

0,06732

11

0,0952

0,09427

12

-0,3355

-0,4306

13

-0,0659

0,26959

14

0,2983

0,36418

15

0,0983

-0,2

16

-0,1327

-0,231

сумм кв

0,4098

0,66401


Посчитаем d=1,6204.

У нас n=16, m=2, , следовательно, условие 0,98=>d>=1,54 не выполняется, значит, автокорреляция присутствует.   


4.2. Используя тест ранговой корреляции Спирмена или тест Голдфелда – Квандта, проверить полученную модель на присутствие гетероскедастичности.

Решение.

Проверим полученную модель на присутствие гетероскедастичности для каждой переменной, используя тест ранговой корреляции Спирмена.

Ранжируем значения х1i  и ei и найдем коэффициент ранговой корреляции.

i

х1i

Ранг  х1i

ei

Ранг ei

di

di2

1

4,8

11

-0,075

5

6

36

2

3,5

3

-0,1978

2

1

1

3

3,1

1

-0,1285

4

-3

9

4

3,3

2

0,0357

10

-8

64

5

3,5

4

0,1681

14

-10

100

6

3,7

5

0,1345

13

-8

64

7

3,8

6

0,2359

15

-9

81

8

4,2

7

-0,0652

8

-1

1

9

4,6

8

-0,0664

6

2

4

10

4,7

9

0,0009

9

0

0

11

5,1

16

0,0952

11

5

25

12

4,7

10

-0,3355

1

9

81

13

4,8

12

-0,0659

7

5

25

14

5

14

0,2983

16

-2

4

15

5

15

0,0983

12

3

9

16

4,9

13

-0,1327

3

10

100

сумма






604


Коэффициент ранговой корреляции:

.

Так как , то гетероскедастичность для переменной х1 отсутствует.


Ранжируем значения х2i  и ei и найдем коэффициент ранговой корреляции.

i

х1i

Ранг  х1i

ei

Ранг ei

di

di2

1

3

5

-0,075

5

0

0

2

2,9

4

-0,1978

2

2

4

3

2,8

2

-0,1285

4

-2

4

4

2,7

1

0,0357

10

-9

81

5

2,8

3

0,1681

14

-11

121

6

3

6

0,1345

13

-7

49

7

3,3

7

0,2359

15

-8

64

8

3,6

8

-0,0652

8

0

0

9

3,9

11

-0,0664

6

5

25

10

4,1

12

0,0009

9

3

9

11

3,8

10

0,0952

11

-1

1

12

3,7

9

-0,3355

1

8

64

13

4,2

15

-0,0659

7

8

64

14

4,1

13

0,2983

16

-3

9

15

4,1

14

0,0983

12

2

4

16

4,3

16

-0,1327

3

13

169

сумма






668


Коэффициент ранговой корреляции:

.

Так как , то гетероскедастичность для переменной х2   отсутствует.

Вывод по разделу 4.

Присутствие автокорреляции говорит о том, что выводы по t- и F-статистикам, определяющим значимость коэффициентов регрессии и коэффициента детерминации, возможно, будут неверными. Однако отсутствие гетероскедастичности дает надежду на правильность полученных заключений.




Список литературы


1. Теория статистики: Учебник/ Под ред. проф. Р.А. Шмойловой. – М.: Финансы и статистика, 1996. – 464 с.

2. Социальная статистика: Учебник/ Под ред. чл.-кор. РАН И.И. Елисеевой. – М.: Финансы и статистика, 2003. – 480 с.

3.  Сидоренко Е.В. Методы математической обработки в психологии. - СПб.: СПбГУ, 2000. – 367 с.

4. Общая теория статистики: Учебник/ под ред. чл.-корр. РАН И.И. Елисеевой. – М.: Финансы и статистика, 1999. – 484 с.

5. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник/ под ред. О.Э. Башиной, А.А. Спирина.- М.: Финансы и статистика, 1999. – 440 с.