Контрольная работа: Линейные уравнения парной и множественной регрессии
Название: Линейные уравнения парной и множественной регрессии Раздел: Рефераты по экономико-математическому моделированию Тип: контрольная работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
НЕГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ "ВОЛГОГРАДСКИЙ ИНСТИТУТ БИЗНЕСА" Кафедра Математики и естественных наук Домашняя контрольная работа Дисциплина Эконометрика Тема: Линейные уравнения парной регрессии
Студента (ки) Иванова Ивана Ивановича
Волгоград 2010 Задача№ 1 По данным приведенным в таблице: 1) построить линейное уравнение парной регрессии y на x; 2) рассчитать линейный коэффициент парной корреляции и оценить тесноту связи; 3) оценить статистическую значимость параметров регрессии и корреляции, используя F-статистику, t-статистику Стьюдента и путем расчета доверительных интервалов каждого из показателей; 4) вычислить прогнозное значение y при прогнозном значении x, составляющем 108% от среднего уровня. 5) оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал; 6) полученные результаты изобразить графически и привести экономическое обоснование. Таблица №1 По территориям Центрального района известны данные за 1995 г.
Вывод 1.
Анализ корреляционного поля данных показывает, что между признаками
Таблица № 4 Параметры (коэффициенты) уравнения регрессии
На основании этих данных запишем уравнение регрессии: Коэффициент Таблица №5. Корреляционная матрица
Для оценки качества уравнения регрессии в целом необходимо проверить статистическую значимость индекса детерминации: проверяется нулевая гипотеза Таблица №6
Т.к. Значение детерминации R-квадрат имеет малое значение, которое менее 1%, то дальнейшее решение не имеет смысла, т.к. вероятность того что прогноз будет верным меньше 1%. Задача №2Используя данные, приведенные в таблице: построить линейное уравнение множественной регрессии; 1) оценить значимость параметров данного уравнения и построить доверительные интервалы для каждого из параметров, оценить значимость уравнения в целом, пояснить экономический смысл полученных результатов; 2) рассчитать линейные коэффициенты частной корреляции и коэффициент множественной детерминации, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними; 3) вычислить прогнозное значение y при уменьшении вектора x на 6 % от максимального уровня, оценить ошибку прогноза и построить доверительный интервал прогноза; Таблица №5
Таблица №6 Параметры (коэффициенты) уравнения регрессии
Множественная регрессия широко используется в решении проблем спроса, доходности акций, изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия - один из наиболее распространенных методов в эконометрике . Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. На основании этих данных запишем уравнение регрессии:
Таблица №7 Регрессионная статистика
! Параметр R-квадрат, представляет собой квадрат коэффициента корреляции rxy 2 и называется коэффициентом детерминации . Величина данного коэффициента характеризует долю дисперсии зависимой переменной y, объясненную регрессией (объясняющей переменной x). Соответственно величина 1 - rxy 2 характеризует долю дисперсии переменной y, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных. Доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 0,663668, или 66,3%. Находим, что численное значение 1) Для оценки качества уравнения регрессии в целом необходимо проверить статистическую значимость индекса детерминации Наблюдаемое значение критерия Таблица №8 Дисперсионный анализ:
! Включаемые в уравнение множественной регрессии факторы должны объяснить вариацию зависимой переменной . Если строится модель с некоторым набором факторов, то для нее рассчитывается показатель детерминации , который фиксирует долю объясненной вариации результативного признака (объясняемой переменной ) за счет рассматриваемых в регрессии факторов. А оценка влияния других, неучтенных в модели факторов, оценивается вычитанием из единицы коэффициента детерминации , что и приводит к соответствующей остаточной дисперсии . Таким образом, при дополнительном включении в регрессию еще одного фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит и данные показатели практически недостаточно значимо отличаются друг от друга, то включаемый в анализ дополнительный фактор не улучшает модель и практически является лишним фактором. Если модель насыщается такими лишними факторами, то не только не снижается величина остаточной дисперсии и не увеличивается показатель детерминации, но, более того, снижается статистическая значимость параметров регрессии по критерию Стьюдента вплоть до статистической незначимости. 2) Для статистической оценки значимости коэффициентов регрессии ( Проверяется нулевая гипотеза Для проверки нулевой гипотезы необходимо знать величину наблюдаемых значений критерия
Таблица №9
В этой же таблице находим границы доверительных интервалов для каждого из параметров:
3. Значения парных коэффициентов корреляции найдем из соответствующей матрицы. Таблица №10 Корреляционная матрица
По величине парных коэффициентов корреляции может обнаруживаться лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью , т.е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК). Частные коэффициенты корреляции найдем по формулам
их значения показывают, что при отсутствии влияния других факторов, связь с рассматриваемым фактором усиливается т.е. мультиколлинеарность между ними существует. 4. Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 110% их максимального значения. Найдем прогнозные значения факторов и подставим их в полученное уравнение регрессии. По условию прогнозные значения составляют 110% их максимального значения. Таблица №11
Далее вычисляем прогнозные значения факторов: Таблица №12
матрица значений факторных переменных
Фактор Максимальную ошибку прогноза
Задача № 3Используя данные, представленные в таблице проверить наличие гетероскедастичности, применяя тест Голдфельда-Квандта.
Таблица№13. Данные
1) Найдем параметры линейного уравнения множественной регрессии и значения остатков. Определим остаточные суммы квадратов Таблица№14
1) Находим наблюдаемое значение критерия Вывод: отвергаем нулевую гипотезу Следовательно, предположение об однородности дисперсий ошибок, при условии, что выполнены стандартные предположения о модели наблюдений, включая предположение о нормальности ошибок, неверно. Наблюдается гетероскедастичность, что приводит к ошибочным статистическим выводам при использовании МНК. Следовательно, полученные оценки не являются состоятельными. Задача № 4По данным таблицы построить уравнение регрессии, выявить наличие автокорреляции остатков, используя критерий Дарбина - Уотсона, и проанализировать пригодность полученного уравнения для построения прогнозов.
Таблица №15
Найдем параметры линейного уравнения множественной регрессии и значения остатков. Дополним таблицу данных столбцами " Таблица №16
По формуле Так как равно По таблице критических точек Дарбина Уотсона определим значения критерия Дарбина-Уотсона По этим значениям числовой промежуток
На основании выполненных расчетов находим, что наблюдаемое значение статистики Вывод: существует отрицательная автокорреляция, то есть гипотеза Следовательно, полученное уравнение регрессии Задача № 5В таблице приводятся данные о динамике выпуска продукции Финляндии (млн. долл.). Таблица №17
Задание: 1. Постройте график временного ряда. 2. Сделайте вывод о присутствии или отсутствии тренда при доверительной вероятности 0,95. 3. Найдите среднее значение, среднеквадратическое отклонение и коэффициенты автокорреляции (для лагов 4. Проведите сглаживание данного ВР методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания 5. Найдите уравнение тренда ВР 6. Дайте точечный и интервальный (с надежностью 0,95) прогнозы индивидуального значения выпуска продукции на 2003 год. Таблица №18
2. Для обнаружения тенденции в данном ВР воспользуемся критерием "восходящих и нисходящих" серий. Критерий "восходящих и нисходящих" серий 1) Для исследуемого ВР определяется последовательность знаков, исходя из условий: (+), если При этом, если последующее наблюдение равно предыдущему, то учитывается только одно наблюдение. 2) Подсчитывается число серий 3) Определяется протяженность самой длинной серии 4) Значение Таблица №25
5) Если нарушается хотя бы одно из следующих неравенств, то гипотеза об отсутствии тренда отвергается с доверительной вероятностью 0,95
Определим последовательность знаков: Таблица №19
Определим число серий
Вывод: второе неравенство не выполняются, следовательно, тренд (тенденция) в динамике выпуска продукции имеется на уровне значимости 0,05. Среднее значение Таблица №20
Вывод: 1) высокое значение коэффициента автокорреляции первого порядка 2) исследуемый ряд содержит только тенденцию, так как наиболее высоким оказался коэффициент автокорреляции первого порядка (0,85>0,83). Скользящие средние найдем по формуле: Вычисляем: и так далее. Результаты вычислений занесем в таблицу и построим графики исходного Таблица №21
Таблица № Параметры (коэффициенты) уравнения тренда. Таблица №22
Анализ данных таблицы Дисперсионного анализа показывает, что получено статистически значимое уравнение, так как наблюдаемое значение Сделаем точечный и интервальный (с надежностью 0,95) прогнозы среднего и индивидуального значений прогнозов на 2003 год. Определим точечный прогноз Вычислим интервальный прогноз: Так как тренд является прямой, то доверительный интервал можно представить в виде: Здесь стандартная ошибка предсказания по линии тренда
здесь величина Таблица №23
Итак, по условию задачи имеем: Для вычисления стандартной ошибки предсказания по линии тренда Таблица № 24
Вычисляем По таблице значений критерия Стьюдента найдем Максимальная ошибка прогноза будет равна:
Нижняя граница прогноза имеет значение Верхняя граница прогноза имеет значение Вывод: 1) значение выпуска продукции Финляндии в 2003 составит 20111,2 млн. долл. 2) с надежностью 0,95 данное значение будет находиться в интервале |