Зависимость часового заработка одного рабочего от общего стажа работы после окончания учебы путем построения уравнения парной линейной регрессии

Контрольная работа по эконометрике

7 вариант

Исходные данные

Имеются данные о часовом заработке 1 рабочего Y и общем стаже работы после окончания учебы Х .

X

Y

1

22,4

53,4

2

8,9

8

3

13,3

15+№=22

4

18,3

29,5

5

13,8

32

6

11,7

14,7

7

19,5

13

8

15,2

11,3

9

14,4

18

10

22

11,8

11

16,4

35-№=28

12

18,9

16

13

16,1

29,5

14

13,3

23,1

15

17,3

55

Задание

Исследовать зависимость часового заработка одного рабочего от общего стажа работы после окончания учебы путем построения уравнения парной линейной регрессии

.

Предварительный анализ данных

  1. Вычислите и проанализируйте описательные статистики(выборочные средние,медиану, моду, среднее квадратичное отклонение) для переменных Х и У .
  2. Постройте поле корреляции (диаграмму рассеяния) и сформулируйте гипотезу о форме связи.
  3. Вычислите парный коэффициент корреляции между переменными. Интерпретируйте полученные результаты: соответствуют ли знаки коэффициента вашим ожиданиям? Модель парной регрессии:
  4. Найти оценки и параметров модели парной линейной регрессии и . Записать полученное уравнение регрессии.
  5. Проверить значимость оценок коэффициентов и с надежностью 0,95 с помощью t-статистики Стьюдента и сделать выводы о значимости этих оценок.Значимо ли уровень образования влияет на заработок?
  6. Определить интервальные оценки коэффициентов и с надежностью 0,95. Сделайте вывод о точности полученных коэффициентов.
  7. Рассчитайте стандартную ошибку регрессии. Сделать вывод о точности полученного уравнения регрессии.
  8. Определить коэффициент детерминации R2 и сделать вывод о качестве подгонки уравнения регрессии к исходным данным.
  9. Рассчитать среднюю ошибку аппроксимации и сделайте выводы о качестве уравнения регрессии.
  10. Рассчитать прогнозное значение результата , если значение фактора X будет больше на 15% его среднего уровня .
  11. Дать экономическую интерпретацию коэффициентов парной регрессии.

Решение

  1. Вычислим описательные статистики(выборочные средние, медиану, моду, среднее квадратичное отклонение) для переменных Х и У , для этого составим таблицу:

N

X

Y

Х-Хср

(Х-Хср)2

У-Уср

(У-Уср)2

(Х-Хср)(У-Ycp)

1

22,4

53,4

6,3

39,69

29,05

843,9025

183,015

2

8,9

8

-7,2

51,84

-16,35

267,3225

117,72

3

13,3

22

-2,8

7,84

-2,35

5,5225

6,58

4

18,3

29,5

2,2

4,84

5,15

26,5225

11,33

5

13,8

32

-2,3

5,29

7,65

58,5225

-17,595

6

11,7

14,7

-4,4

19,36

-9,65

93,1225

42,46

7

19,5

13

3,4

11,56

-11,35

128,8225

-38,59

8

15,2

11,3

-0,9

0,81

-13,05

170,3025

11,745

9

14,4

18

-1,7

2,89

-6,35

40,3225

10,795

10

22

11,8

5,9

34,81

-12,55

157,5025

-74,045

11

16,4

28

0,3

0,09

3,65

13,3225

1,095

12

18,9

16

2,8

7,84

-8,35

69,7225

-23,38

13

16,1

29,5

0

0

5,15

26,5225

0

14

13,3

23,1

-2,8

7,84

-1,25

1,5625

3,5

15

17,3

55

1,2

1,44

30,65

939,4225

36,78

Сумма

241,5

365,3

 

196,14

 

2842,418

271,41

Среднее

16,1

24,35333

 

 

 

 

 

выборочные средние

Хмах=22,4, Хмин=8,9

R=22.4-8.9=13.5

Медиана Xme=15.65

Мода Хмо=13,3

Дисперсия

среднее квадратичное отклонение

  1. Построим поле корреляции и сформулируем гипотезу о форме связи.

Анализируя данное поле корреляции можно сделать следующие выводы:

- между переменными Х и Y наблюдается прямая зависимость: с ростом Х значения Y увеличиваются.

- точки располагаются близко к прямой линии, т. Е. можно предположить , что связь между переменными линейная.

3. Вычислим парный коэффициент корреляции между переменными.

связь между часовым заработком 1 рабочего Y и общим стажем работы после окончания учебы Х прямая и слабая.

4. Найдем оценки и параметров модели парной линейной регрессии и .

Определим параметры линейной зависимости вида

Для расчета параметров , , коэффициента детерминации , оценки значимости уравнения результаты вспомогательных расчетов представим в виде таблицы.

N

X

Y

XY

X2

Y2

1

22,4

53,4

1196,16

501,76

2851,56

2

8,9

8

71,2

79,21

64

3

13,3

22

292,6

176,89

484

4

18,3

29,5

539,85

334,89

870,25

5

13,8

32

441,6

190,44

1024

6

11,7

14,7

171,99

136,89

216,09

7

19,5

13

253,5

380,25

169

8

15,2

11,3

171,76

231,04

127,69

9

14,4

18

259,2

207,36

324

10

22

11,8

259,6

484

139,24

11

16,4

28

459,2

268,96

784

12

18,9

16

302,4

357,21

256

13

16,1

29,5

474,95

259,21

870,25

14

13,3

23,1

307,23

176,89

533,61

15

17,3

55

951,5

299,29

3025

Сумма

241,5

365,3

6152,74

4084,29

11738,69

Среднее

16,1

24,35333

410,1827

272,286

782,5793

Сначала рассчитаем коэффициент

Используя полученное значение рассчитаем

Запишем полученное уравнение регрессии

Расчетные значения переменной у рассчитаем подстановкой значений Х в данное уравнение

N

X

Y

ур

Y-yp

(Y-yp)2

(Y-yp)2/Y

1

22,4

53,4

33,0768

20,3232

413,0325

7,73469

2

8,9

8

14,3523

-6,3523

40,35172

5,043964

3

13,3

22

20,4551

1,5449

2,386716

0,108487

4

18,3

29,5

27,3901

2,1099

4,451678

0,150904

5

13,8

32

21,1486

10,8514

117,7529

3,679778

6

11,7

14,7

18,2359

-3,5359

12,50259

0,850516

7

19,5

13

29,0545

-16,0545

257,747

19,82669

8

15,2

11,3

23,0904

-11,7904

139,0135

12,30208

9

14,4

18

21,9808

-3,9808

15,84677

0,880376

10

22

11,8

32,522

-20,722

429,4013

36,38994

11

16,4

28

24,7548

3,2452

10,53132

0,376119

12

18,9

16

28,2223

-12,2223

149,3846

9,336539

13

16,1

29,5

24,3387

5,1613

26,63902

0,903018

14

13,3

23,1

20,4551

2,6449

6,995496

0,302835

15

17,3

55

26,0031

28,9969

840,8202

15,28764

Сумма

241,5

365,3

 

 

2466,857

113,1736

Среднее

16,1

24,35333

 

 

164,4572

7,544905

5. Проверим значимость оценок коэффициентов и с надежностью 0,95 с помощью t-статистики Стьюдента

Для оценки значимости уравнения необходимо рассчитать стандартную ошибку регрессии S и S

В среднем истинное значение может отклоняться от значения =1,387 на величину 0,984.

Рассчитаем значение статистики параметра

Значение t =1,41tкр=2,228 , поэтому параметр не является значимым.

Аналогично рассчитаем для параметра

Значение t =0,123<tкр=2,228 , поэтому параметр не является значимым.

5. Определим интервальные оценки коэффициентов и с надежностью 0,95.

Построим доверительные интервалы для параметра для уровня доверия q=0,95.

Построим доверительные интервалы для параметра для уровня доверия q=0,95.

6. Определим коэффициент детерминации R2 и коэффициент корреляции rxy. Сделать выводы о качестве уравнения регрессии.

Таким образом R2=0.133, т.е. на 13,3% дисперсия зависимой переменной у объясняется изменением переменной х, а 86,7% изменения у объясняется влиянием других факторов.

Рассчитаем коэффициент корреляции

Значение коэффициента корреляции 0,365 свидетельствует о том что связь между х и у слабая и прямая.

7. Проверим при уровне значимости 0,05 значимость уравнения регрессии с помощью F-статистики Фишера и сделать выводы о значимости уравнения регрессии.

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:

R2- коэффициент детерминации

Fтабл=4,98 для =0,05; k1=k=1;k2=n-k-1=10

F=1,99Fтабл=4.98

Уравнение регрессии с вероятностью 0,95 статически не значимое

  1. Рассчитаем среднюю ошибку аппроксимации и сделаем выводы о качестве уравнения регрессии.

В среднем на 50,26 % отличаются расчетные значения от фактических. Так как А=50,2610% то качество подгонки не достаточно хорошее.

  1. Рассчитаем прогнозное значение результата , если значение фактора X будет больше на 15% его среднего уровня .

Х среднее равно 16,1

Хпрогн=16,1+15%=18,51

  1. Дать экономическую интерпретацию коэффициентов парной регрессии.

Построенное уравнение регрессии

позволяет выполнить анализ взаимосвязи исследуемых показателей.

Экономический смысл параметра состоит в следующем- при изменении переменной х на единицу значение переменной у изменится в среднем на величину .

Определим коэффициент эластичности у по х.

Это означает что при изменении переменной х на 1 % на 91,7% изменится значение у.

Дополнительно решим задание в программе Microsoft Excel:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,363495

R-квадрат

0,132129

Нормированный R-квадрат

0,06537

Стандартная ошибка

13,77526

Наблюдения

15

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

375,5654

375,5654

1,979182

0,182931

Остаток

13

2466,852

189,7578

Итого

14

2842,417

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

2,074854

16,23041

0,127837

0,900234

-32,9888

37,13852

-32,9888

37,13852

Переменная X 1

1,383757

0,983596

1,406834

0,182931

-0,74117

3,508687

-0,74117

3,508687

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1

33,071

20,329

1,53147

2

14,39029

-6,39029

-0,48141

3

20,47882

1,521185

0,114597

4

27,3976

2,102402

0,158383

5

21,17069

10,82931

0,815818

6

18,2648

-3,5648

-0,26855

7

29,05811

-16,0581

-1,20973

8

23,10795

-11,808

-0,88954

9

22,00095

-4,00095

-0,30141

10

32,5175

-20,7175

-1,56074

11

24,76846

3,23154

0,243446

12

28,22785

-12,2279

-0,92118

13

24,35333

5,146667

0,38772

14

20,47882

2,621185

0,197465

15

26,01384

28,98616

2,183651

Зависимость часового заработка одного рабочего от общего стажа работы после окончания учебы путем построения уравнения парной линейной регрессии