Федеральное агентство по образованию

Всероссийский заочный финансово-экономический институт













Отчет

по лабораторной работе по дисциплине «Эконометрика»

вариант №3










               Исполнитель: Солдатова Т.С.         

       Специальность: БУАиА      

       Группа: дневная, 1

      

       Руководитель: О.В.Прокофьев       











Пенза 2008г.

ЗАДАНИЕ

По данным представленным в таблице 1 , изучается зависимость индекса человеческого развития[1] от переменных:

х1 – ВВП 1997 г., % к 1990 г.;

х2 – расходы на конечное потребление в текущих ценах, % к ВВП;

х3 – расходы домашних хозяйств, % к ВВП;

х4 – валовое накопление, % к ВВП;

х5 – суточная калорийность питания населения, ккал на душу населения;

х6 – ожидаемая продолжительность жизни при рождении в 1997 г., число лет.



страна

у

х1

х2

х3

х4

х5

х6

Австрия

0,904

115

75,5

56,1

25,2

3343

77

Австралия

0,922

123

78,5

61,8

21,8

3001

78,2

Белоруссия

0,763

74

78,4

59,1

25,7

3101

68

Бельгия

0,923

111

77,7

63,3

17,8

3543

77,2

Великобритания

0,918

113

84,4

64,1

15,9

3237

77,2

Германия

0,906

110

75,9

57

22,4

3330

77,2

Дания

0,905

119

76

50,7

20,6

3808

75,7

Индия

0,545

146

67,5

57,1

25,2

2415

62,6

Испания

0,894

113

78,2

62

20,7

3295

78

Италия

0,9

108

78,1

61,8

17,5

3504

78,2

Канада

0,932

113

78,6

58,6

19,7

3056

79

Казахстан

0,74

71

84

71,7

18,5

3007

67,6

Китай

0,701

210

59,2

48

42,4

2844

69,8

Латвия

0,744

94

90,2

63,9

23

2861

68,4

Нидерланды

0,921

118

72,8

59,1

20,2

3259

77,9

Норвегия

0,927

130

67,7

47,5

25,2

3350

78,1

Польша

0,802

127

82,6

65,3

22,4

3344

72,5

Россия

0,747

61

74,4

53,2

22,7

2704

66,6

США

0,927

117

83,3

67,9

18,1

3642

76,7

Украина

0,721

46

83,7

61,7

20,1

2753

68,8

Финляндия

0,913

107

73,8

52,9

17,3

2916

76,8

Франция

0,918

110

79,2

59,9

16,8

3551

78,1

Чехия

0,833

99,2

71,5

51,5

29,9

3177

73,9

Швейцария

0,914

101

75,3

61,2

20,3

3280

78,6

Швеция

0,923

105

79

53,1

14,1

3160

78,5


Задание

1.                     Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны.

2.                     Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.

3.                     Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.

4.                     Отберите информативные факторы по п. 1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.

5.                     Проверьте выполнение предпосылок МНК, в том числе проведите тестирование ошибок уравнения множественной регрессии на гетероскедастичность.









































1.

Вводим таблицу данных. В этом примере n=25, m=6.

Рис. 1. Таблица исходных данных


Используем инструмент Корреляция

Для проведения корреляционного анализа выполним следующие действия:

1.                         Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.

2.                         Выберем команду Сервис→Анализ данных.

3.                         В диалоговом окне Анализ данных выберете инструмент Корреляция, а затем щелкните ОК.

4.                         В диалоговом окне Корреляция в поле Входной интервал вводим B1;H26. Так как у нас выделены заголовки столбцов, то установим флажок Метки в первой строке.

5.                         Выберем параметры вывода.

6.                         ОК.



            Рис 2. Диалоговое окно Корреляция.


Получим матрицу коэффициентов парной корреляции.



            Рис. 3. Матрица коэффициентов парной корреляции.


Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. индекс человеческого развития, имеет тесную связь с суточной калорийностью питания населения (ryx5 = 0,751) и с ожидаемой продолжительностью жизни при рождении в 1997 г. (ryx6 = 0,962). Факторы х5 и х6 не мультиколлинеарны, так как  соблюдается правило неравенств:

0,751>0,704 

0,962>0,704

0,704<0,8

Следует, что включаем в модель факторы х5 и х6.

2.

Для проведения регрессионного анализа выполним следующие действия:

1.     Выберем команду Сервис → Анализ данных.

2.     В диалоговом окне Анализ данных выберем инструмент Регрессия, затем щелкнем на кнопке ОК.

3.     В диалоговом окне Регрессия в поле Входной интервал Y введем А1:А26, который представляет зависимую переменную. В поле Входной интервал Х введем  В1:G26, который содержит значения независимых переменных (рис 4).

4.     Установим флажок Метки в первой строке, так как мы выделим заголовки столбцов.

5.     Выберем параметры ввода.

6.     В поле остатки поставим флажок на остатки и график остатков.

7.     ОК.


                    

                              Рис.4. Диалоговое окно Регрессия.


Получим отчет по регрессионному и дисперсионному анализу (рис.5).


 

      Рис. 5. Вывод итогов регрессионного анализа.

Для построения уравнения множественной регрессии в линейной форме воспользуемся коэффициентами из диапазона В26:В32.

Получим уравнение:

y = -0,636272 - 0,000475x1 + 0,001308x2 – 0,001409x3 + 0,000148x4 + 4,32269E-05x5 + 0,018535x6  


3.

На рис.5 приведены вычисленные (предсказанные) по модели значения зависимой переменной Y и значения остаточной компоненты ei.

Значение коэффициента детерминации и множественной корреляции можно найти в таблице Регрессионная статистика на рис.5. Коэффициент детерминации равен 0,964. он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, 96,4% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Коэффициент множественной корреляции R равен 0,982 он показывает сильную тесноту связи зависимой переменной Y с  независимыми факторами Х.

Следовательно, можно сказать, что  модель уравнения регрессии хорошего качества.

Оценим качество параметров уравнения регрессии с помощью t-критерия Стьюдента.

Введем в пустую ячейку табличное значение коэффициента Стьюдента (рис. 6):

  

                                    Рис.6. Аргументы функции.  

Получим значение равное 2,1009

 

Сравним это значение с ячейками D2:D32. Отсюда следует, так как |tрасч|>tтабл , то коэффициенты а0, а1, а5 и а6 существенны (значимы).


Оценим качество параметров уравнения регрессии с помощью F-критерия Фишера. Значение  F-критерия Фишера можно найти в таблице Регрессионная статистика рис.5., оно равно 81,005.

Табличное значение F-критерия при доверительной вероятности 0,05 при v1=5 и v2=25-6=11 составляет 2,7400, который вычисляется по формуле:

                                    Рис.7. Аргументы функции

Поскольку Fрасч>Fтабл, (81,005>2,7400) уравнение регрессии следует признать адекватным.


4.

Из пунктов 1-3 нам нужно отобрать статистически значимые факторы. Из пункта 1 мы отобрали факторы х5 и х6. Теперь определим значимы ли эти коэффициенты с помощью t-статистики. Для этого введем с помощью автозаполнителя формулы для расчета наблюдаемой t-статистики (начиная с ячейки А38) и с помощью мастера функций – табличное значение t-статистики (ячейка А45) (рис.8).



                                      Рис.8. Расчет t-статистики


Получим значения (рис.9):

Рис 9. Полученные значения t-статистики


Сравнивая расчетные и табличное значения, определим, так как tнабл>tтабл коэффициенты х5 и х6, которые мы отобрали в пункте 1 статистически значимы.

Скопируем выбранные данные на отдельный лист.


Рис.10. Выбранные данные.

Вызовем окно Сервис, Анализ данных, Регрессия. Заполним его

                                      Рис. 11. Диалоговое окно Регрессия

Получим отчет по регрессионному и дисперсионному анализу (рис.12.), (рис.13.)


Рис. 12. Вывод итогов

Рис 13. Вывод остатка

Оценим качество модели, сравним ячейку (В32)  из таблицы вывода итогов рис.12., т.е. R-квадрат равен 0,9364, что говорит о высоком качестве модели.

Введем в любую пустую ячейку табличное значение коэффициента Стьюдента (рис.14)

Рис. 14. Аргументы функции

Сравним по модулю с t-статистикой из таблицы вывода итогов рис. 12. Отсюда мы видим, что все коэффициенты статистически значимы, х5 тоже можно считать значимым коэффициентом корреляции, так как отклонение незначительно.

Введем в любую пустую ячейку табличное значение критерия Фишера (рис.15)


Рис. 15. Аргументы функции

 Сравним это значение со значением из таблицы вывод итогов в ячейке регрессия: F. Так как Fрасч>Fтабл (162,05>3,44), значит уравнение регрессии следует признать адекватным.

Построим уравнение регрессии со статистически значимыми факторами:

Y=-0,637716+4,6357E-05x1+0,018006x2

 

5.

Предпосылка 1. Проверка случайного характера остатков.

Построим график е (ŷ). Для этого используйте мастер диаграмм  и данные Предсказанное Y, Остатки (рис.16).

Рис. 16. График е (ŷ).

На этом графике видно, остатки расположены случайным образом внутри горизонтальной полосы, следовательно, можно сделать вывод о том, что  величины случайны. Первая предпосылка МНК выполняется.



Предпосылка 2. Нулевая гипотеза остатков.

 Построим графики е (х5), е (х6). Для этого  возьмем Графики остатков из окна Регрессия (рис17. и рис.18).

Рис.17 график остатков е (х5)

Рис.18. график остатков е (х6)


Мы видим, что на графиках остатки расположены в виде горизонтальной полосы, следовательно, они не зависимы от значений Х. Отсюда, делаем вывод, что вторая  предпосылка МНК выполняется.


Предпосылка 3.  Гетероскедастичность – это, когда для каждого значения факторов остатки имеют различную дисперсию.

Проверим предпосылку с помощью критерия Гольдфельда –Кванта. Используется для проверки гомоскедастичности. Критерий обоснован для линейной модели, в которой дисперсия остатков пропорциональна квадрату факторов.

Скопируем исходные данные Y, X5, X6 на отдельный рабочий лист.

Получим исходные данные (рис.19).


Рис. 19.Выбранные данные.

Проверим дисперсию остатков на наличие гетероскедастичности по фактору Х5.


Выделим там все  ячейки, вызовем окно Данные, Сортировка (рис.20)

Рис. 20. Сортировка диапазона


Получим список,  отсортированный по Х5 (рис.21).


Рис. 21. Отсортированные данные по Х5

Разобьем данные на 2 группы, между которыми – исключаемые центральные наблюдения, мы исключили 5 значений (рис.22).

Рис.22 Исключение данных


Найдем суммы квадратов остатков для каждой группы. Для каждой половины построен отчет по регрессии (Сервис, Анализ данных, Регрессия). Ячейка, где находится сумма квадратов остатков, выделим желтым цветом (рис.23, рис.24, рис.25 и рис.26).


Рис.23. Диалоговое окно Регрессия

 

Рис. 24. Диалоговое окно Регрессия


Рис.25. Вывод итогов


Рис. 26. Вывод итогов.


В любую пустую ячейку введем критерий Гольдфельда-Квандта как  частное. Надо большую сумму квадратов остатков разделить на меньшую (рис.27).


Рис. 27. Формула расчета критерия Гольдфельда-Квандта

Получим значение 4,6809.

В любую пустую ячейку введем табличный F-критерий (рис.28):

Рис. 28. Аргументы функции

Сравним значение Fрасч с Fтабл, так как Fрасч > Fтабл (4,6809>3,7871), значит присутствует гетероскедастичность.

Проверим дисперсию остатков на наличие гетероскедастичности по фактору Х6.

Выделим там все  ячейки, вызовем окно Данные, Сортировка (рис.29).


Рис. 29. Сортировка диапазона


Получим список,  отсортированный по Х6 (рис.30).


Рис. 30. Отсортированные данные по Х6

Найдем суммы квадратов остатков для каждой группы. Для каждой половины построен отчет по регрессии (Сервис, Анализ данных, Регрессия). Ячейка, где находится сумма квадратов остатков, выделим желтым цветом (рис31,32,33 и 34).

Рис. 31. Диалоговое окно Регрессия

Рис. 32. Диалоговое окно Регрессия



Рис. 33. Вывод итогов


Рис.34. Вывод итогов

В любую пустую ячейку введем критерий Гольдфельда-Квандта как  частное. Надо большую сумму квадратов остатков разделить на меньшую (рис.35).

Рис. 35. Формула расчета критерия Гольдфельда-Квандта

Получим значение 9,4555.

В любую пустую ячейку введем табличный F-критерий (рис.36):

Рис. 36. Аргументы функции

Сравним значение Fрасч с Fтабл, так как Fрасч > Fтабл (9,4555>3,7871), значит присутствует гетероскедастичность. Следовательно третья предпосылка не выполняется.


Предпосылка 4.  О независимости остатков. Остатки должны быть распределены независимо друг от друга.

Остатки регрессионной модели Y(X5, X6) из ячеек С52:С77 (рис. 13) скопируем в новый лист.

Добавим формулы разности и произведения соседних значений остатков, суммы по столбцам (рис.37).


Рис. 37. Формулы разности и произведения соседних значений остатков

Получим значения (рис.38).

Рис. 38. Рассчитанные значения остатков

 


Рассчитаем коэффициент Дарбана-Уотсона по формуле при критических значениях1,21 и 1,55 (рис.39):

Рис. 39. Формула расчета коэффициента Дарбана-Уотсона

Получим значение равное 1,9797. Так как значение попадает в интервал от 1,55 до 2,следовательно, остатки независимы и предпосылка выполняется.


Предпосылка 5.  О нормальном законе распределения остатков

R/S – критерий.

Рассчитаем его по формуле при критических значениях 3,34 и 4,57 (рис.40):


Рис. 40. Формулы расчета R/S – критерия

Получим значение равное 4,5648. Так как значение попадает в интервал между критическими значениями, значит, остатки подчиняются нормальному закону распределения и предпосылка выполняется.


Вывод

Не все предпосылки выполняются, модель нуждается в совершенствовании.



[1] Специальный индекс человеческого развития, который объединяет три показателя (валовой внутренний продукт на душу населения, грамотность и продолжительность предстоящей жизни) и дает обобщенную оценку человеческого прогресса.