ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

Аудиторная работа

по дисциплине «Эконометрика»

студентки 3 курса специальности «Финансы и кредит»

Вариант № 4

Пенза, 2006

Имеются данные по странам за 1997 г.:

Страна	Индекс челове-ческого разви-тия, Y	Ожидаемая продолжительность жизни при рождении в 1997 г., лет, X1,	Суточная калорийность питания населения, ккал на душу, Х2

Австрия	0,904	77	3343
Австралия	0,922	78,2	3001
...........................................................................................................................
Япония	0,924	80	2905

Задание

1. Постройте матрицу парных коэффициентов корреляции.

2. Постройте парные уравнения регрессии, отобразите результаты моделирования на графиках.

3. Оцените статистическую значимость уравнений и их параметров с помощью критериев Фишера и Стьюдента.

4. Постройте уравнение множественной регрессии.

5. Постройте график остатков.

6. Проверьте выполнение предпосылок МНК, в том числе проведите тестирование ошибок уравнения множественной регрессии на гетероскедастичность.

7. Оцените статистическую значимость уравнения множественной регрессии. Определите, какое уравнение лучше использовать для прогноза индекса человеческого развития:

· парную регрессию у на х₁;

· парную регрессию у на х₂;

· множественную регрессию.

Решение

1. Для расчета матрицы парных коэффициентов корреляции используем инструмент Корреляция (Анализ данных в Excel):

· выберем команду Сервис => Анализ данных => Корреляция;

· в диалоговом окне Корреляция в поле Входной интервал введем диапазон ячеек, содержащих исходные данные. Так как введены заголовки столбцов, то установим флажок Метки в первой строке ;

· выберем в качестве параметра вывода Новый рабочий лист и нажмем ОК.

В результате получим матрицу парных коэффициентов корреляции (табл.1).

Таблица 1

	Y	X1,	Х2
Y	1
X1	0,949805867	1
Х2	0,553261358	0,53286729	1

2. Для построения парных уравнений регрессии применим инструмент Регрессия (Анализ данных в Excel):

· выберем команду Сервис => Анализ данных => Регрессия;

· в диалоговом окне Регрессия в поле Входной интервал Y введем диапазон ячеек, содержащих значения зависимой переменной. В поле Входной интервал Х введем диапазон ячеек, содержащих значения независимой переменной. Так как введены заголовки столбцов, то установим флажок Метки;

· выберем в качестве параметра вывода Новый рабочий лист;

· в поле Остатки поставим флажок Остатки и График подбора и нажмем ОК.

Результат регрессионного анализа для модели у-х₁ содержится в табл. 2-4 и на рис. 1. По результатам табл. 4 запишем полученное уравнение линейной регрессии:

у= -0,575 + 0,019 х₁.

Таблица 2

Регрессионная статистика
Множественный R	0,949805867
R-квадрат	0,902131184
Нормированный R-квадрат	0,89925269
Стандартная ошибка	0,032166824
Наблюдения	36

Таблица 3

Дисперсионный анализ
	df	SS	MS	F
Регрессия	1	0,32428	0,324280351	313,403816
Остаток	34	0,03518	0,001034705
Итого	35	0,35946

Таблица 4

	Коэффициенты	Стандартная ошибка	t-статистика
Y-пересечение	-0,575225283	0,079622	-7,224463516
X1	0,01911398	0,00108	17,70321486

Рис. 1. Регрессионная модель у-х₁.

Результат регрессионного анализа для модели у-х₂ содержится в табл. 5-7 и на рис. 2. По результатам табл. 7 запишем полученное уравнение линейной регрессии:

у= 0,234 + 0,00019 х₂.

Таблица 5

Регрессионная статистика
Множественный R	0,553261358
R-квадрат	0,30609813
Нормированный R-квадрат	0,285689251
Стандартная ошибка	0,085651513
Наблюдения	36

Таблица 6

Дисперсионный анализ
	df	SS	MS	F
Регрессия	1	0,11003	0,110030127	14,99828
Остаток	34	0,24943	0,007336182
Итого	35	0,35946

Таблица 7

	Коэффициенты	Стандартная ошибка	t-статистика
Y-пересечение	0,233708671	0,154924	1,508540085
Х2	0,000187383	4,84E-05	3,872761637

Рис. 2. Регрессионная модель у-х₂.

3. Оценку параметров парных регрессионных моделей у-х₁ и у-х₂ проведем с помощью t-критерия Стьюдента. Табличное значение t-критерия определим с помощью функции СТЬЮДРАСПОБР (0.05,34). Табличное значение t-критерия при 5%-ном уровне значимости и степенях свободы (36-1-1=34) составляет 2,032. Так как для всех параметров регрессионной модели у-х₁выполняется неравенство |t_расч|>t_табл, то все коэффициенты парного уравнения регрессии у-х₁являются значимыми (табл. 4). Так как для коэффициента а₀ в парном уравнение у-х₂ неравенство |t_расч|>t_табл не выполняется, то данный коэффициент является незначимым, а коэффициент а₁ парного уравнения регрессии у-х₂ является значимым, так как для него выполняется |t_расч|>t_табл (табл. 7).

Значимости уравнений парных регрессионных моделей у-х₁ и у-х₂ оценим с помощью F-критерия Фишера. Табличное значение F-критерия определим с помощью функции FРАСПОБР (0.05;1;34). Табличное значение F-критерия при доверительной вероятности 0,95 при v1=k=2 и v₂=n-k-1=36-1-1=34 составляет 4,13. Так как для двух уравнений регрессионных моделей у-х₁ и у-х₂ выполняется неравенство F_расч>F_табл, то оба уравнения регрессии являются значимым (табл. 3 и табл. 6).

4. Для построения уравнения множественной регрессии, как и для построения парных уравнений регрессии, применим инструмент Регрессия (Анализ данных в Excel). Отличие состоит в том, что в поле Входной интервал Х введем диапазон ячеек, содержащих значения двух независимых переменных х₁ и х₂.

Результат регрессионного анализа для модели множественной регрессии содержится в табл. 8-11. По результатам табл. 10 запишем полученное уравнение множественной регрессии:

у= -0,594 + 0,0184 х₁ + 0,0000223 х₂.

Таблица 8

Регрессионная статистика
Множественный R	0,951438214
R-квадрат	0,905234676
Нормированный R-квадрат	0,899491323
Стандартная ошибка	0,032128705
Наблюдения	36

Таблица 9

Дисперсионный анализ
	df	SS	MS	F
Регрессия	2	0,325396	0,162697967	157,61432
Остаток	33	0,034064	0,001032254
Итого	35	0,35946

Таблица 10

	Коэффициенты	Стандартная ошибка	t-статистика
Y-пересечение	-0,59437154	0,081632	-7,281087849
X1	0,018408007	0,001274	14,44425507
Х2	0,0000223	2,14E-05	1,039579016

Таблица 11

Наблюдение	Предсказанное Y	Остатки
1	0,897585077	0,006415
2	0,912048986	0,009951
3	0,817496694	0,009503
4	0,726517053	0,036483
5	0,905726151	0,017274
6	0,700792974	0,038207
7	0,898903157	0,019097
8	0,78661178	0,008388
9	0,900976812	0,005023
10	0,923006873	-0,05601
11	0,884022942	0,020977
12	0,699415346	-0,08342
13	0,910728369	-0,02773
14	0,611817824	-0,06682
15	0,91492281	-0,02092
16	0,923264561	-0,02326
17	0,928001747	0,003998
18	0,718898699	0,021101
19	0,753921043	-0,05292
20	0,728528888	0,015471
21	0,912279304	0,008721
22	0,917989966	0,00901
23	0,814771343	-0,01277
24	0,812752164	0,039248
25	0,69189379	0,055106
26	0,757969282	-0,00597
27	0,896888786	0,030111
28	0,755337929	-0,02734
29	0,733483976	-0,01248
30	0,884382501	0,028617
31	0,922471736	-0,00447
32	0,836818893	-0,00382
33	0,925633154	-0,01163
34	0,921116669	0,001883
35	0,650979869	0,04402
36	0,943042852	-0,01904

5. Графики остатков (зависимость е_i от х₁ и от х₂) строятся автоматически, так как в поле инструмента Регрессия Остатки установлен флажок График остатков, данные графики приведены на рис. 4 и 5. Для построения графика остатков (зависимость е_i от у) используем Мастер диаграмм Excel, полученный график приведен на рис. 3.

Рис. 3. График остатков (е_i от у)

Рис. 4. График остатков (е_i от х₁)

Рис. 5. График остатков (е_i от х₂)

6. Для проверки предпосылок МНК рассмотрим графики остатков (рис. 3, 4, 5). На графике е_i от х₁ остаточная величина е_i обнаруживает тенденцию к уменьшению по мере роста х₁. Это дает повод усомниться в случайности остаточной компоненты и выполнении предпосылки о равенстве дисперсий. Проверим наличие гетероскедастичности при помощи метода Голдфельда-Квандта:

· упорядочим все наблюдения по мере возрастания х1;

· разделим совокупность на 2 группы, исключив из рассмотрения 2 центральных наблюдения, тогда в каждой группе будет по 17 наблюдений;

· определим по каждой из групп уравнения регрессии (применим инструмент Регрессия). Остаточные суммы квадратов для первой регрессии S_1у=0,025073, для второй – S_2у=0,003735. Так как S_1у> S_2у, то F_набл= S_1у / S_2у=6.713. Табличное значение F-критерия при доверительной вероятности 0,95 при v1=n1-m=17-2=15 и v2=n-n1-m=36-17-2=15 составляет 2,308. Так как F_набл>F_табл, то наличие гетероскедастичности подтверждается.

Предпосылка о равенстве математического ожидания остаточной компоненты нулю выполняется, так как на графиках остатков (е_i от х_i) (рис 4,5) остатки распределены у оси ох_i симметрично.

Предпосылка о независимости остатков принимается как аксиома, так как дана пространственная выборка.

Проверим предпосылку о нормальности ряда остатков с помощью RS-критерия.

R=ε_max- ε_min=0,05511-(-0,08342)=0,1385.

S=0.0312

RS=0,1385/0,0312=4,439.

Значение RS-критерия попадает в критический интервал (3,58; 4,84) для n=35 и α=0,05, значит остатки распределены по нормальному закону.

7. Уравнение множественной регрессии статистически значимо, так как F_расч>F_табл (F_(0,05;2;33)=3,285) (табл. 8). Так как для коэффициента b₂ в уравнение регрессии неравенство |t_расч|>t_табл (t_(0,05;33)=2,035) не выполняется, то данный коэффициент является незначимым, а коэффициенты b₀ и b₁ являются значимыми, так как для них выполняется |t_расч|>t_табл (табл. 10).

Для прогноза индекса человеческого развития лучше всего использовать парную модель регрессии у-х₁, так как для нее высокий нормированный коэффициент детерминации и все коэффициенты ее значимы.