Лабораторная работа: Линейное уравнение регрессии
Название: Линейное уравнение регрессии Раздел: Рефераты по экономике Тип: лабораторная работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Всероссийский заочный финансово-экономический институт Лабораторная работа по дисциплине "Эконометрика" Брянск 2010 Задание В таблице 1 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996г.). Таблица 1 – Исходные данные
Принятые в таблице обозначения: Y – цена квартиры, тыс.долл.; Х1 – число комнат в квартире; Х2 – район города (1 – Приморский, Шувалово-Озерки, 2 – Гражданка, 3 – Юго-запад, 4 - Красносельский); Х3 – общая площадь квартиры (м2 ); Х4 – жилая площадь квартиры (м2 ); Х5 – площадь кухни (м2 ); Х6 – тип дома (1 – кирпичный, 0 - другой); Х7 – наличие балкона (1 – есть, 0 - нет); Х8 – число месяцев до окончания срока строительства. 1) Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район). 2) Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z. 3) Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны. 4) Постройте модель у = f(х3 , х6 , х7 , х8 , z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели? 5) Существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга? 6) Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения регрессии проверьте с помощью F-критерия Фишера; оцените качество уравнения регрессии с помощью коэффициента детерминации R2 . Решение 1) Введем фиктивную переменную Z вместо Х2, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые 47 квартир относятся к северной части города (Приморский район, Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов корреляции исходных переменных.
2) Проведем корреляционный анализ на выявление зависимости Y от представленных факторов в среде "СтатЭксперт". Протокол корреляционного анализа Главная цель анализа данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi , а также выявление независимых переменных, имеющих высокий уровень корреляции между собой. Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой. Влияние независимой переменной Х3 , Х4 , включенной в исследование, имеет высокий уровень (r > 0,7), причем это влияние положительно (rух3 = 0,872, rух4 = 0,917). Х5 оказывает умеренное положительное влияние на величину Y (rух5 = 0,303). Х1 , Х2 , Х6 , Х7 , Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6 = = -0,104, rух7 = 0,119, rух8 = -0,005). 3) Построим уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме. Линейная регрессия Уравнение будет иметь вид: у(х) = -0,505 – 0,966х1 + 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5 + 5,835х6 + 1,244х7 – 0,011х8 Линейная или близкая к ней связь между факторами называется мультиколлинеарностью. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7. Рассмотрим матрицу парных коэффициентов корреляции между факторами Хj , включенными в дальнейшем анализ. Матрица парных корреляций Явление сильной коллинеарности наблюдается между факторами: Х1 и Х3 , т.к. rх1х3 = 0,872 > 0,7 Х1 и Х4 , т.к. rх1х4 = 0,917 > 0,7 Х3 и Х4 , т.к. rх3х4 = 0,966 > 0,7 4) Построим модель у = f (х3 , х6 , х7 , х8 , z) в линейной форме. Результаты регрессионного анализа Модель в линейной форме будет иметь вид: у(х) = -5,64 + 0,715х2 + 0,475х3 + 6,786х6 + 1,284х7 – 0,037х8 Х6 (тип дома), значимо воздействует на формирование цены квартиры в модели. 5) Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии проверим с помощью F-критерия; оценим качество уравнения регрессии с помощью коэффициента детерминации R2 . Характеристика остатков линейной регрессии
Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов. Табличное значение F-критерия (Fкрит ) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании: если Fфакт > Fкрит , то модель статистически значима; если Fфакт < Fкрит , то модель статистически незначима. Fфакт > Fкрит , значит модель статистически значима, т.е. пригодна к использованию. Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии. Табличное значение t-критерия при 5% уровне значимости и степени свободы k = 69-8-1 = 60 составляет 2,0003. Если tрасч > tтабл , то коэффициент статистически значим. Характеристика модели
tb 0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим; tb 1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb 2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим; tb 3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим; tb 4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb 5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb 6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим; tb 7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим; tb 7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим; 6) существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга? tb 2 = 2,2212 > 2,0003, tb 3 = 3,9654 > 2,0003 и tb 6 = 7,9759 > 2,0003, значит факторы Х2 (район города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на формирование цен на квартиры. Анализ показал, что разница в ценах на квартиры, расположенные в северной и южной частях Санкт-Петербурга существенна, т.к. tb 2 = 2,2212 > 2,0003. |