О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы
по дисциплине
«Эконометрика»
Вариант № 16
Выполнил: студент 3 курса
факультета учетно-статистического
специальности БУ А и А
группы вечерней
Писаренко О.В.
№ л.д. 05убд43274
Проверил: Доц. Луценко А.Г.
Тула, 2007
Задача
По
территориям Центрального федерального округа изучите зависимость доходов
населения от экономических факторов (данные за
У – суммарный доход населения за год, млрд. руб.;
Х1 – фонд средств прожиточного минимума населения за год, млрд. руб.;
Х2 – задолженность по заработной плате, млрд. руб.;
Х3 – суммарный фонд пенсионных выплат за год, млрд. руб.;
Х4 – среднегодовая численность занятых в экономике, млн. чел.
Задание
Опишите изучаемую зависимость множественной регрессионной моделью с информативными факторами в составе факторного комплекса (для α=0,10). Выполните расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят 104,2% от их среднего уровня.
Требуется:
1. Постройте линейное уравнение множественной регрессии с полным перечнем заданных показателей и оцените его;
2. Проведите исключение неинформативных переменных и получите модель только с информативными переменными для уровня значимости α=0,10;
3. Выполните анализ результатов, постройте прогноз уровня результата, указав, при каких условиях он будет возрастать и при каких – снижаться.
1. Осуществим выбор значимых факторных признаков для построения регрессионной модели.
Исходные данные n = 12, k = 4:
Субъекты РФ |
у |
х1 |
х2 |
х3 |
х4 |
Белгородская обл. |
38,3 |
28,2 |
0,225 |
5,6 |
0,678 |
Брянская обл. |
28,7 |
21,4 |
0,272 |
3,9 |
0,596 |
Владимирская обл. |
30,9 |
25,2 |
0,169 |
8,0 |
0,721 |
Ивановская обл. |
18,1 |
21,6 |
0,127 |
6,9 |
0,491 |
Калужская обл. |
21,6 |
17,4 |
0,080 |
6,4 |
0,484 |
Костромская обл. |
17,0 |
12,8 |
0,143 |
4,6 |
0,330 |
Курская обл. |
28,8 |
22,6 |
0,423 |
5,4 |
0,606 |
Рязанская обл. |
27,9 |
20,9 |
0,128 |
7,2 |
0,535 |
Смоленская обл. |
30,0 |
18,3 |
0,127 |
4,0 |
0,488 |
Тамбовская обл. |
30,0 |
19,5 |
0,324 |
3,2 |
0,514 |
Тверская обл. |
30,4 |
27,0 |
0,182 |
7,7 |
0,665 |
Тульская обл. |
41,1 |
25,9 |
0,386 |
8,3 |
0,781 |
Проведем корреляционный анализ (Приложение 1):
|
у |
х1 |
х2 |
х3 |
х4 |
у |
1 |
|
|
|
|
х1 |
0,7509 |
1 |
|
|
|
х2 |
0,5613 |
0,3629 |
1 |
|
|
х3 |
0,2101 |
0,5409 |
-0,1258 |
1 |
|
х4 |
0,8437 |
0,9166 |
0,4944 |
0,5608 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. суммарный доход населения за год , имеет тесную связь с фондом средств прожиточного минимума населения (rYX1 = 0,7509) и со среднегодовой численностью занятых в экономике (rYX4 = 0,8437). Однако факторы Х1 и Х4 тесно связаны между собой (rХ1X4 = 0,9166), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х4 - среднегодовая численность занятых в экономике, переменная Х1 выбывает.
Для расчета параметров и оценки качества модели проведем регрессионный анализ (Приложение 2).
Проверку значимости уравнения регрессии произведем на основе F-критерия Фишера. Из отчета (Приложение 2) видно, что он равен Fрасч = 7,62. Табличное значение F-критерия при доверительной вероятности 1 - α = 0,90 при k1 = k = 4 и
k2 = n - k - 1 = 12 - 4 - 1 = 7 составляет Fтабл = 2,96.
Т.к. Fрасч = 7,62 > Fтабл = 2,96 следует признать уравнение регрессии адекватным.
Для проверки статистической значимости коэффициентов уравнения множественной регрессии проводим сравнение фактических значений t-статистики с табличными значениями t-критерия Стьюдента.
tтабл для числа степеней свободы 7 (n - k - 1 = 12 - 4 - 1 = 7) и α = 0,10 составит 1,8946.
Сравнивая значения t-статистики и tтабл, приходим к выводу, что так как
|tX1| = 0,2174 > 1,8946 = tтабл коэффициент регрессии Х1 является статистически незначимым, ненадежным;
|tX2| = 0,1426 > 1,8946 = tтабл коэффициент регрессии Х2 является статистически незначимым, ненадежным;
|tX3| = 1,6783 > 1,8946 = tтабл коэффициент регрессии Х3 является статистически незначимым, ненадежным, однако достаточно близок к табличному значению;
|tX4| = 2,3042 < 1,8946 = tтабл, приходим к заключению, что величина Х4 является статистически значимой, на нее можно опираться в анализе и в прогнозе.
Из отчета (Приложение 2) видно, что коэффициент множественной корреляции равен R =0,902. Можно сказать, что зависимость Y от представленных факторов характеризуется как тесная.
Коэффициент детерминации равен R2 = 0,814, следовательно, 81,4% вариаций зависимой переменной Y учтено в модели и обусловлено влиянием всех факторов.
Из модели исключим фактор Х1 по свойству мультиколлинеарности, а так же фактор Х2 как наименее статистически значимый.
Следовательно, после исключения незначимых факторов n = 12, k = 2.
2. Для расчета параметров и оценки качества модели после исключения неинформативных переменных проведем регрессионный анализ.
Проверку значимости уравнения регрессии произведем на основе F-критерия Фишера. Из отчета (Приложение 3) видно, что он равен Fрасч = 19,54. Табличное значение F-критерия при доверительной вероятности 1 - α = 0,90 при k1 = k = 2 и
k2 = n - k - 1 = 12 - 2 - 1 = 9 составляет Fтабл = 3,01.
Т.к. Fрасч = 19,54 > Fтабл = 3,01 следует признать уравнение регрессии адекватным.
Для проверки статистической значимости коэффициентов уравнения множественной регрессии проводим сравнение фактических значений t-статистики с табличными значениями t-критерия Стьюдента.
tтабл для числа степеней свободы 9 (n - k - 1 = 12 - 2 - 1 = 9) и α = 0,10 составит 1,8331.
Сравнивая значения t-статистики и tтабл, приходим к выводу, что так как
незначимым, ненадежным;
|tX3| = 2,2034 < 1,8331 = tтабл коэффициент регрессии Х3 является статистически значимым, надежным, на него можно опираться в анализе и в прогнозе;
|tX4| = 6,0794 < 1,8331 = tтабл коэффициент регрессии Х4 является статистически значимым, надежным, на него можно опираться в анализе и в прогнозе.
Из отчета (Приложение 2) видно, что коэффициент множественной корреляции равен R =0,902. Можно сказать, что зависимость Y от представленных факторов характеризуется как тесная.
Коэффициент детерминации равен R2 = 0,813, следовательно, 81,3% вариаций зависимой переменной Y учтено в модели и обусловлено влиянием факторов Х3 и Х4.
Линейная модель множественной регрессии имеет вид:
Yi = ao + a1xi1 + a2xi2 +…+ amxim + εi
Полученное уравнение регрессии зависимости суммарного дохода населения за год от суммарного фонда пенсионных выплат за год и среднегодовой численности занятых в экономике (Приложение 3) можно записать в следующем виде :
y = 3,297 - 1,571X3 + 60,251X4.
3. Выполним расчет прогнозного значения, предполагая, что прогнозные значения факторов составят 104,2% от их среднего уровня.
|
у |
х3 |
х4 |
1 |
38,3 |
5,6 |
0,678 |
2 |
28,7 |
3,9 |
0,596 |
3 |
30,9 |
8,0 |
0,721 |
4 |
18,1 |
6,9 |
0,491 |
5 |
21,6 |
6,4 |
0,484 |
6 |
17,0 |
4,6 |
0,330 |
7 |
28,8 |
5,4 |
0,606 |
8 |
27,9 |
7,2 |
0,535 |
9 |
30,0 |
4,0 |
0,488 |
10 |
30,0 |
3,2 |
0,514 |
11 |
30,4 |
7,7 |
0,665 |
12 |
41,1 |
8,3 |
0,781 |
Сумма |
342,80 |
71,20 |
6,889 |
Среднее |
28,57 |
5,93 |
0,574 |
Х пр 3 = Х ср 3 * 1,042 = |
6,183 |
|
|
Х пр 4 = Х ср 4 * 1,042 = |
0,598 |
|
|
y = 3,297 - 1,571*6,183 + 60,251*0,598 = |
29,63 |
При уменьшении среднего значения суммарного фонда пенсионных выплат за год и увеличении среднегодовой численности занятых в экономике значение суммарного дохода населения за год будет возрастать.
При увеличении среднего значения суммарного фонда пенсионных выплат за год и уменьшении среднегодовой численности занятых в экономике значение суммарного дохода населения за год будет снижаться.