Контрольная работа: Построение регрессионной модели
Название: Построение регрессионной модели Раздел: Рефераты по экономико-математическому моделированию Тип: контрольная работа | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задание Таблица 1
Построить линейное регрессионное уравнение. 1. Построить поле корреляции и линию регрессии на одном графике. Вычислить: 2. коэффициент детерминации; 3. среднюю ошибку аппроксимации; 4. t-статистики; 5. доверительные интервалы. 6. Сделать выводы Построить показательную зависимость и повторить пункты 1–6. Сравнить построенные модели. Решение: Построим поле корреляции: Рис. 1. Поле корреляции пенсии от прожиточного минимума По полю корреляции слабо прослеживается зависимость пенсии от прожиточного минимума. Рассчитаем параметры уравнения линейной парной регрессии. Для расчета параметров a и b уравнения линейной регрессии у = а + bx решим систему нормальных уравнений относительно а и b: По исходным данным рассчитываем Sх, Sу, Sух, Sх2 , Sу2 . Таблица 2
Найдем дисперсию переменных: = 9448,5 – 88,332 = 1646,31 (тыс. руб.)2 = 42261,83 – 196,832 = 3519,78 (тыс. руб.)2 Найдем параметры a и b уравнения линейной регрессии: 0,667 196,83 – 0,667 · 88,33 = 137,91 тыс. руб. Уравнение регрессии: = 137,91 + 0,667 · х Построим линию регрессии на рис. 1. С увеличением прожиточного минимума на 1 тыс. руб. пенсия увеличивается на 0,667 тыс. руб. Рассчитаем линейный коэффициент парной корреляции: 0,456 Т.к. коэффициент в интервале от 0,3 до 0,7 связь средняя, прямая. Определим коэффициент детерминации: (0,456)2 = 0,208 Т.е. вариация пенсий на 20,8% объясняется вариацией прожиточного минимума. Найдем среднюю ошибку аппроксимации: 26,7% Средняя ошибка аппроксимации имеет значение меньше 30% – это говорит о среднем уровне надежности уравнения регрессии. Рассчитаем F-критерий: 2,628 Критическое значение распределения Фишера определяют либо по таблицам распределения Фишера, либо расчетным путем с использованием функции FРАСПОБР() табличного процессора Excel. Для уровня доверия 0,95, одного фактора и 12 значений: Fкр = F(0,05; 1; 10) = 4,964 Т.к. Fкр > Fфакт , то необходимо отклонить гипотезу о статистической значимости параметров уравнения. Т.е. использовать данную функцию для аппроксимации нельзя. Найдем стандартную ошибку остаточной компоненты по формуле: = = = 55,14 Найдем средние квадратичные (стандартные) ошибки оценивания коэффициента b и свободного члена а уравнения регрессии: 39,99 0,411 Найдем t – критерий Стьюдента для обоих параметров: 137,91 / 39,99 = 3,448 0,667 / 0,411 = 1,623 Сравнивая значения t-статистики для каждого из коэффициентов линейной регрессии с табличным значением (α = 0,05; k = 12) tтабл = 2,228, можно сказать, что с вероятностью 95% коэффициент а надёжен, коэффициент b ненадёжен при данном уровне значимости. Для расчета доверительного интервала определяем предельную ошибку Δ: = tтабл · = 2,228 * 39,99 » 89,1 = tтабл · = 2,228 * 0,411 » 0,916 Доверительные интервалы для коэффициентов регрессии: a – Δa < a < a + Δa 48,81 < a < 227,01 b – Δb < b < b + Δb – 0,249 < b < 1,583 Таким образом, полученные оценки коэффициента регрессии b не являются эффективными и состоятельными, а само уравнение = 137,91 + 0,667·х не может использоваться для моделирования и прогнозирования динамики. Это обусловлено большой ошибкой уравнения регрессии. Для построения уравнения показательной кривой у = а · еb х линеризуем переменные логарифмированием обеих частей уравнения: ln у = ln а + b·x Y = A + b·x ГдеY = ln y, A = ln a. Для расчетов будем использовать данные таблицы 4. Таблица 4
Найдем дисперсию переменных: = 9448,5 – 88,332 = 1646,31 = 27,506 – 5,2352 = 0,0955 Найдем параметров А и В регрессии составили: b =0,00314 5,325 – 0,00314 · 88,33 = 4,958 Получено линейное уравнение: = 4,958 + 0,00314 · х Произведем потенцирование полученного уравнения и запишем его в обычной форме: = e4,958 · e0,00314 · х = 142,31 · e0,00314 х Тесноту связи оценим через индекс корреляции рху : 0,436 Связь средняя. Определим коэффициент детерминации: 0,1838 Т.е. вариация результативного признака на 18,38% объясняется вариацией факторного признака. Найдем среднюю ошибку аппроксимации: 25,9% Средняя ошибка аппроксимации имеет значение меньше 30%, т.е. надежность уравнения средняя. Рассчитаем F-критерий: (m – число параметров при переменной x) 1,8378 Fкр = 4,964 Т.к. Fкр > Fфакт , т.е. необходимо отклонить гипотезу о статистической значимости параметров уравнения. Найдем стандартную ошибку остаточной компоненты по формуле: = = = 55,77 Найдем средние квадратичные (стандартные) ошибки оценивания коэффициента b и свободного члена а уравнения регрессии: 40,45 0,416 Найдем t – критерий Стьюдента для обоих параметров: 142,31 / 40,45 = 3,518 0,00314 / 0,411 = 0,0076 Сравнивая значения t-статистики для каждого из коэффициентов линейной регрессии с табличным значением (α = 0,05; k = 12) tтабл = 2,228, можно сказать, что с вероятностью 95% коэффициент а надёжен, коэффициент b ненадёжен при данном уровне значимости. Для расчета доверительного интервала определяем предельную ошибку Δ: = tтабл · = 2,228 * 40,45 » 90,12 = tтабл · = 2,228 * 0,0076 » 0,0169 Доверительные интервалы для коэффициентов регрессии: a – Δa < a < a + Δa 52,19 < a < 232,43 b – Δb < b < b + Δb – 0,01376 < b < 0,02004 Построим линию показательной зависимости на поле корреляции: Рис. 2. Рассчитанные линии регрессий У линейной зависимости меньше стандартная ошибка и больше значение F-критерия. Поэтому из двух уравнений регрессий линейное более достоверно. Но низкая надежность коэффициента регрессии b, говорит, что результаты аппроксимации будут иметь достаточно низкую надежность (80%). |