Контрольная работа: Эконометрический анализ основных числовых характеристик
Название: Эконометрический анализ основных числовых характеристик Раздел: Рефераты по экономико-математическому моделированию Тип: контрольная работа |
Введем обозначения: Х1 – удельный вес пашни в с/х угодьях, %; Х2 – удельный вес лугов и пастбищ, % У – уровень убыточности продукции животноводства, % Найдем основные числовые характеристики: 1. Объем выборки – суммарное количество наблюдений: n = 15. 2. Минимальное значение х1 – min х1 = 68,1% максимальное значение х1 – max х1 = 94,7% Значит, удельный вес пашни в с/х угодьях изменяется от 68,1% до 94,7%. 3. min х2 = 9,2%, max х2 = 28,7%. Значит, удельный вес лугов и пастбищ изменяется от 9,2%, до 28,7%. 4. min у = 15%, max у = 45,6%. Значит, уровень убыточности продукции животноводства изменяется от 15%% до 45,6%. 5. Среднее значение вычисляется по формуле Среднее значение удельного веса пашни в с/х угодьях и составляет x1 =80,98% Среднее значение удельного веса лугов и пастбищ составляет х2 = 17,02% Среднее значение уровня убыточности продукции животноводства составляет у = 28,2%. 6. Дисперсия вычисляется по формуле
Дисперсия по х1 : D(х1 ) = 58,83; по х2 : D(х2 ) = 42,45; по у: D(у) = 92,96. 7. Среднеквадратичное отклонение вычисляется по формуле: σх1 = 7,67 – значит, среднее отклонение удельного веса пашни в с/х угодьях от среднего значения составляет 7,67% σх2 = 6,52 – значит, среднее отклонение удельного веса лугов и пастбищ от среднего значения составляет 6,52% σу = 9,642 – значит, среднее отклонение уровня убыточности продукции животноводства от среднего значения составляет 9,642%. Эконометрический анализ По таблице строим корреляционное поле (диаграмму рассеивания). Нанесем точки хi , уi на координатную плоскость. Точка с координатами (х; у) = (80,98; 17,15) называется центром рассеивания. По виду корреляционного поля можно предположить, что зависимость между х и у линейная. Для определения линейной связи найдем коэффициент корреляции. r =0,776111538 Т.к. в данном случае коэффициент корреляции 0,6 ≤| r | ≤ 0,9, то линейная связь между х и у достаточная. Попытаемся описать связь между х и у зависимостью у = b0 + b1 x Параметры b0 и b1 находим по методу наименьших квадратов. b1 = rху σу / σх =-0,6520, b0 = у – b1 x = 69,9498 Т.к. b1 <0, то зависимость между х и у обратная. Т.е. с ростом удельного веса пашни в с/х угодьях, уровень убыточности продукции животноводства уменьшается. Проверим значимость коэффициентов bi . Значимость может быть проверена с помощью критерия Стьюдента. Для коэффициента b0 : =5,854852846 Значимость t наблюдаемого: α·tнабл = 0,0001, т.е. 0,01%<5%, значит, коэффициент b0 статистически значим. Для коэффициента b1 : = -4,437566168 Значимость t наблюдаемого: α·tнабл = 0,0010, т.е. 0,1%<5%, Значит, коэффициент b1 статистически значим. Получим модель зависимости уровня убыточности продукции животноводства от удельного веса пашни в с/х угодьях и удельного веса лугов и пастбищ. у = -0,652х + 69,9498. После того, как была построена модель, проверяем её на адекватность. Разброс данных, объясняемый регрессией: SSP = 350,083702 Остатки необъясняемые – разброс: SSЕ = 231,1136313 Общий разброс данных: SSY = 581,1973333 Для анализа общего качества модели найдем коэффициент детерминации. R2 = SSR/ SSY = 0,57176059 Разброс данных объясняется: линейной моделью на 57,26% и на 42,74% случайными ошибками ((1 – R2 )·100%). Качество модели плохое. Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 350,083702 и MSЕ = SSЕ / R2 = 17,77797164. Вычисляем k1 = 1 и k2 = 14. Находим наблюдаемое значение критерия Фишера. Fнабл = MSR / MSE = 19,6919935. Значимость этого значения: α = 0,000669742, т.е. процент ошибки равен ≈0,067% < 5%. Следовательно, модель у = -0,652х + 69,9498 считается адекватной с гарантией более 95%. Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза. x [xmin , xmax ]; хпр = 88 Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза. у(х=88) = у = -0,652х + 69,9498= 12,577 Найдем полуширину доверительного интервала в каждой точке и в точке прогноза. , где σе – среднеквадратическое отклонение выборочных точек от линии регрессии = 4,216393 tγ – критическая точка распределения Стьюдента для надежности γ =0,95 R = 13; n = 15 – объем выборки; сумма знаменателя – , где D(x) – дисперсия выборки, хпр – точка прогноза. Прогнозируемый доверительный интервал для любой точки х: , где δ для точки прогноза – δ (х=88) = 9,668, т.е. доверительный интервал для хпр составляет от 2,909 до 22,244 с гарантией 95%. Совокупность доверительных интервалов для всех х из области прогнозов образует доверительную область. Т.е. при удельном весе пашни в с/х угодьях 1,458%. уровень убыточности продукции животноводства составит от 2,909% до 22,244%. Найдем эластичность. Для линейной модели эластичность Ех вычисляется по формуле: Коэффициент эластичности показывает, что при изменении удельного веса пашни в с/х угодьях на 1% уровень убыточности продукции животноводства уменьшится на 4,593%. Эконометрический анализ По таблице строим корреляционное поле (диаграмму рассеивания). Нанесем точки хi , уi на координатную плоскость. Точка с координатами (х; у) = (17,02; 28,2) называется центром рассеивания. По виду корреляционного поля можно предположить, что зависимость между х и у нелинейная. Попытаемся описать связь между х и у зависимостью: y = a ln x + b. Перейдем к линейной модели. Делаем линеаризующую подстановку: U= ln x; V = y. Для этих данных строим линейную модель: V = b0 + b1 U. Для определения линейной связи найдем коэффициент корреляции. r =0,864 Т.к. в данном случае коэффициент корреляции | r | > 0,9, то линейная связь между U и V сильная. Попытаемся описать связь между U и V зависимостью V = b0 + b1 U. Параметры b0 и b1 находим по методу наименьших квадратов. b1 = r U V σ V / σ U = 370.76, b0 = V – b1 U = 3.53. Т.к. b1 > 0, то зависимость между U и V прямая. Т.е. с ростом удельного веса лугов и пастбищ, уровень убыточности продукции животноводства повышается. Проверим значимость коэффициентов bi . Значимость может быть проверена с помощью критерия Стьюдента. Для коэффициента b0 : =0,845 Значимость t наблюдаемого: α·tнабл = 0,413221639, т.е. 41%>5%, Значит, коэффициент b0 статистически не значим. Для коэффициента b1 : =6,2 Значимость t наблюдаемого: α·tнабл = 3,23039E‑05, т.е. ≈0%<5%, Значит, коэффициент b1 статистически значим. Получим модель зависимости уровня убыточности продукции животноводства от удельного веса лугов и пастбищ. V = 370,76U +3,53. После того, как была построена модель, проверяем её на адекватность. Разброс данных, объясняемый регрессией: SSP = 972,42 Остатки необъясняемые – разброс: SSЕ = 329,1 Общий разброс данных: SSY = 1301,51 Для анализа общего качества модели найдем коэффициент детерминации. R2 = SSR/ SSY = 0.747 Разброс данных объясняется: линейной моделью на 74,7% и на 25,3% случайными ошибками ((1 – R2 )·100%). Качество модели хорошее. Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 972,42 и MSЕ = SSЕ / R2 = 25,3. Вычисляем k1 = 1 и k2 = 13. Находим наблюдаемое значение критерия Фишера. Fнабл = MSR / MSE = 38.41. Значимость этого значения: α = 3,23Е‑05, т.е. процент ошибки равен ≈0% < 5%. Следовательно, модель V = 370,76U +3,53. считается адекватной с гарантией более 95%. Т.к. линейная модель адекватна, то и соответствующая нелинейная модель то же адекватна. Находим параметры исходной нелинейной модели a и b. Вид нелинейной функции: y = 370,76/x +3,53. Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза. x [xmin , xmax ]; хпр = 17,02, соответственно Uпр = 1/17,02 = 0,06 Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза. V(х=17,02) = 370,76U +3,53. = 25,32, у(х=17,02) = 370,76/x +3,53 = 25,32. Т.к. y(x) = V(U), то полуширина доверительного интервала и доверительный интервал будет равен как для y так и для V. Найдем полуширину доверительного интервала в каждой точке и в точке прогноза. , Прогнозируемый доверительный интервал для любой точки х: , где δ для точки прогноза – δ (х=17,02) = 11,27 т.е. доверительный интервал для хпр составляет от 8,50 до 12,87 с гарантией 95%. Совокупность доверительных интервалов для всех х из области прогнозов образует доверительную область. Т.е. при удельном весе лугов и пастбищ 17,02% уровень убыточности продукции животноводства составит от 14,05% до 36,59%. Найдем эластичность. Для линейной модели эластичность Ех вычисляется по формуле: Коэффициент эластичности показывает, что при изменении удельного веса лугов и пастбищ на 1% уровень убыточности продукции животноводства изменяется на 0,86%. Эконометрический анализПрежде, чем строить модель, проверим факторы на коллинеарность. По исходным данным строим корреляционную матрицу. Коэффициент корреляции между х1 и х2 равен: rх1х2 =-0,79 < 0,95, следовательно х1 и х2 неколлинеарны. Определим связаны ли х1 , х2 и у между собой. Для определения тесноты линейной связи найдем коэффициент корреляции. r = 0,92 Попытаемся описать связь между х1 , х2 и у зависимостью у = b0 + b1 ∙х1 + b2 ∙х2 Параметры b0 , b1 и b2 находим по методу наименьших квадратов. b0 = -19.995, b1 = 0.72, b2 = -0.6 Проверим значимость коэффициентов bi . Значимость может быть проверена с помощью критерия Стьюдента. Для коэффициента b0 : = -0,87 Значимость t наблюдаемого: α·tнабл = 0,40, т.е. 40% > 5%, Значит, коэффициент b0 статистически не значим. Для коэффициента b1 : = 3,04 Значимость t наблюдаемого: α·tнабл = 0,01, т.е. 1% < 5%, Значит, коэффициент b1 статистически значим. Для коэффициента b2 : = -2,11 Значимость t наблюдаемого: α·tнабл = 0,06, т.е. 6% > 5%, Значит, коэффициент b2 статистически не значим. Получим модель зависимости уровня убыточности продукции животноводства от удельного веса пашни в с/х угодьях и и удельного веса лугов и пастбищ. у = -19,995 + 0,72∙х1 – 0,6∙х2 После того, как была построена модель, проверяем её на адекватность. Разброс данных, объясняемый регрессией: SSP = 1090,3 Остатки необъясняемые – разброс: SSЕ = 211,17 Общий разброс данных: SSY = 1301,5 Для анализа общего качества модели найдем коэффициент детерминации. R2 = SSR/ SSY = 0.84 Разброс данных объясняется: линейной моделью на 84% и на 16% случайными ошибками ((1 – R2 )·100%). Качество модели хорошее. Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 545,17 и MSЕ = SSЕ / R2 = 17,6. Вычисляем k1 = 2 и k2 = 12. Находим наблюдаемое значение критерия Фишера. Fнабл = MSR / MSE = 30.98. Значимость этого значения: α = 1,82E‑05, т.е. процент ошибки равен ≈0% < 5%. Следовательно, модель у = -19,995 + 0,72∙х1 – 0,6 ∙х2 – считается адекватной с гарантией более 95%. Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза. X1,2 [xmin , xmax ]; хпр = (80,98; 17,02) Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза. У(80,98;17,02) = у = -19,995 + 0,72∙80,98 – 0,6 ∙17,02=28,17 Найдем коэффициенты частичной эластичности Ех1 , Ех2 . Для линейной модели эластичность Ех вычисляется по формуле: Коэффициент эластичности показывает, что при увеличении удельного веса пашни в с/х угодьях на 1% и удельного веса лугов и пастбищ на 80,98% уровень убыточности продукции животноводства увеличится на 2,064% Коэффициент эластичности показывает, что при увеличении производительности труда на 1% и удельного веса пашни в с/х угодьях на 17,02% уровень убыточности продукции животноводства уменьшится на 0,354%. |