Курсовая работа: Анализ экономических данных в странах третьего мира
Название: Анализ экономических данных в странах третьего мира Раздел: Рефераты по экономике Тип: курсовая работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задание для выполнения практической работы по дисциплине эконометрика корреляция регрессия гетероскедастичность Работа включает в себя анализ реальных экономических данных при помощи изученных эконометрических моделей. Работа должны быть выполнена в соответствии со следующими этапами: 1) Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные. 2) Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д. 3) Проверьте модели на отсутствие автокорреляции. 4) Проверка на гетероскедастичность моделей. 5) Сравните модели между собой выберете лучшую Работа выполняется на листах формата А4, с титульным листом и обязательными выводами по работе. Решение: Сбор данных из интернет – источников получены данные средней продолжительности жизни, ВВП в паритетах покупательной способности, темпы прироста населения по сравнению с предыдущим годом, %; темпы прироста рабочей силы по сравнению с предыдущим годом, %; коэффициент младенческой смертности. Изучим зависимость продолжительности жизни от нескольких факторов по данным за 2005 г., представленным в табл.1. Таблица 1. Обзор социальных показателей стран третьего мира.
Принятые в таблице обозначения: у — средняя продолжительность жизни, лет; х1 - ВВП в паритетах покупательной способности, млрд. долл.; х2 - темпы прироста населения по сравнению с предыдущим годом, %; х3 - темпы прироста рабочей силы по сравнению с предыдущим годом; х4 - коэффициент младенческой смертности, %с. 1. Корреляционный анализ Корреляционный анализ проводился с использованием компьютерной программы EXCEL с помощью пакета анализа данных Таблица 2. Корреляционная зависимость продолжительности жизни от различных факторов.
На основании полученных данных можно сделать вывод, что наибольшее влияние на продолжительность жизни оказывает фактор Х1- ВВП в паритетах покупательной способности, у остальных факторов наблюдается слабый корреляционный отклик. 3. Для выбора наилучшей регрессионной функции необходимо ее проанализировать по набору критериев: коэффициенты попарной корреляции, коэффициенты множественной корреляции, критерий Фишера, статистики Стьюдента. Строим регрессионную функцию по всем регрессорам, использую при этом пакет анализа данных MS Excel «Регрессия» Таблица 3. Регрессионная статистика
Пояснения к таблице 2. Регрисеонная статистика содержит строки, характеризующие построенное уравнение регрессии: Для парной регрессии Множественный R равен коэффициенту корреляции (rxу ). Множественный коэффициент корреляции R определяется как коэффициент корреляции между наблюдаемыми значениями Yi и расчетными, прогнозируемыми значениями. По его значению 0,9546 можно сказать, что между X и Y существует сильная линейная зависимость. Строка R–квадрат равна коэффициенту корреляции в квадрате, он близок к 1, это означает что данная модель хорошо описывает данные Нормированный R–квадрат рассчитывается с учетом степеней свободы числителя (n-2) и знаменателя (n-1) по формуле: Стандартная ошибка (S) регрессии вычисляется по формуле 1.4. Последняя строка содержит количество выборочных данных (n). Значимость уравнения в целом оценивается с помощью F-критерия Фишера Если найденное значение F больше табличного для уровня значимости α и степеней свободы (n-m-1) и m, то с вероятность 1 - α делаем заключение о статистической значимости уравнения в целом. Таблица 4 Дисперсионный анализ
Пояснения к таблице дисперсионного анализа: число регрессоров m = 4 число n-m-1 = 27, где n – число наблюдений Для уровня значимости α = 0,05 и при степенях свободы 4, 27 табличное значение критерия Фишера Fтаб = 2,71. Значение F =69,285 существенно превышает табличное, что говорит о статистической значимости уравнения в целом. Таблица 5 Коэффициенты регрессии
В столбце «Коэффициенты» получены коэффициенты уравнения регрессии. Коэффициент b0 = 72,846 в Таблице анализа – это Y -пересечение. Таким образом, получили уравнение регрессии: У=72,846+0,0031Х1-6,173Х2+5,122Х3-0,18Х4 Коэффициент b1 =0,0013 показывает, что при увеличении ВВП на 1 млр. дол. Средняя продолжительность жизни увеличивается в среднем на 0,0031 лет, увеличение темпов прироста населения на 1%,. приводит в среднем уменьшению продолжительности жизни на 6,173 лет, увеличение темпов прироста рабочей силы на 1% приводит к увеличению продолжительности жизни на 5,122 лет, а увеличение коэффициента младенческой смертности, на 1% ведет к уменьшению средней продолжительности жизни на 0,18 лет. Стандартные ошибки mi , t-статистики ti могут быть вычислены по формулам Где σY - среднее квадратическое отклонение для отклика Y, σXi - среднее квадратическое отклонение для регрессора Xi (X1, X2, …)R2 - коэффициент детерминации для уравнения множественной регрессии, - коэффициент детерминации для зависимости отклика Y от всех регрессоров кроме Xi,- коэффициент детерминации для зависимости Xi от всех регрессоров кроме Xi. Табличные t–критерии Стьюдента зависят от принятого уровня значимости и от числа степеней свободы (n-m-1). Если вычисленные значения t–критерия превышают табличные, то говорят, что соответствующий коэффициент регрессии является статистически значимым и на него можно опираться в анализе и прогнозе. Более того, используя табличное значение t-критерия и стандартную ошибку mi коэффициента регрессии bi можно с вероятностью 1 - α сделать вывод о том, что истинное значение коэффициента регрессии попадет в интервал (bi – tтаб *mi , bi + tтаб *mi ). Они составляют: m(X1) =0.192, m(X2) =1,9289, m(X3) =1,5086, m(X4) =0.0258, m(y) =3.4746 t(X1) =0.0163, t(X2) =-3.199, t(X3) =3.395, t(X4) =-6.98, t(y) =20.965 Табличное значение t–критерия Стьюдента при уровне значимости α = 0,05 и числе степеней свободы 27 tтаб =2,051. Коэффициенты t- статистики при регрессорах Х1 , Х2 и Х4 меньше t таб., и согласно t–критерию не являются статистически значимыми. По величине Р -значения возможно определять значимость коэффициентов, не находя критическое значение t -статистики. Если значение t -статистики велико, то соответствующее значение вероятности значимости мало – меньше 0,05, и можно считать, что коэффициент регрессии значим. И наоборот, если значение t -статистики мало, соответственно вероятность значимости больше 0,05 – коэффициент считается незначимым. Для коэффициентов b0 , b2 , b3 , b4 значения вероятности близко к нулю, следовательно, b1 можно считать значимым, b1- близко к единице, коэффициент не значим. Далее представлены доверительные интервалы (нижняя и верхняя границы) для рассчитанных коэффициентов. Таблица 6 Расчет относительной ошибки аппроксимации
Средняя ошибка аппроксимации показывает среднее отклонение расчетных значений от фактических и рассчитывается по формуле: Средняя ошибка аппроксимации составляет 3,2574 %. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так в норме средняя ошибка аппроксимации колеблется в пределах до 10% 3) Проверка модели на отсутствие автокорреляции Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями При проверке независимости значений ei определяется отсутствие в остаточном ряду автокорреляции, под которой понимается корреляция между элементами одного и того же числового ряда. В нашем случае автокорреляция - это корреляция ряда e1, e2, e3 ... с рядом eL+1, eL+2, eL+3 Число L характеризует запаздывание (лаг). Корреляция между соседними членами ряда (т.е. когда L = 1) называется автокорреляцией первого порядка. Далее для остаточного ряда будем рассматривать зависимость между соседними элементами ei . Наличие автокорреляции может быть выявлено при помощи d-критерия Дарбина-Уотсона. Значение критерия вычисляется по формуле: Таблица 7. Расчет критерия в - Дарбина-Уотсона
В таблице значений критерия Дарбина-Уотсона для уровня значимости 5% при m=4и n=32 критические значения d1=1.14, d2=1,74, В нашем расчете значение d-критерия попадает в интервал от d2 до 2, автокорреляция отсутствует. 4) Проверка на гетероскедастичность моделей с использованием теста Бреуша-Пагана Для этого проверки на гетероскедастичность воспользуемся таблицами 6 и 7 Затем строим регрессию, в которой за зависимую переменную берется столбец квадратов остатков еi2, а за зависимые переменные – переменные Х1, Х2, Х3, Х4, Результат представлен в таблицах 8,9,10 Таблица 8. Регрессионная статистика
Таблица 10. Коэффициенты регресси
Найдена статистика: Х2 наб = nR2 =32*0.049305=1,578 Так как Х2набл =1,578< Х2крит =9,48, То гипотеза о гетероскедастичности отвергается и модель считается гомоскедастичной. Критическое значение распределения Хи-квадрат найдено с помощью действий: fx →Статистические→ХИ2ОБР(m ), где m – число переменных, входящих в уравнение регрессии (в данном случае 6). 5) Сравните модели между собой выберете лучшую. Как уже отмечалось ранее по величине Р -значения возможно определять значимость коэффициентов, не находя критическое значение t -статистики. Если значение t -статистики велико, то соответствующее значение вероятности значимости мало – меньше 0,05, и можно считать, что коэффициент регрессии значим. И наоборот, если значение t -статистики мало, соответственно вероятность значимости больше 0,05 – коэффициент считается незначимым. Для коэффициентов b0 , b2 , b3 , b4 полученных при регрессионном анализе в п.4 значения вероятности близко к 1, следовательно, данные коэффициенты не значимы. Таким образом, модель выраженная уравнением У=72,846+0,0031Х1-6,173Х2+5,122Х3-0,18Х4 Выводы Проанализировав данные зависимости средней продолжительности жизни в странах третьего мира ВВП, темпы прироста населения, темпы прироста рабочей силы и коэффициент младенческой смертности можно сделать ряд выводов: 1. В результате проведенного корреляционного анализа наибольшее влияние на среднюю продолжительность жизни оказывает ВВП, у остальных факторов наблюдается слабый корреляционный отклик. 2. В ходе регрессионного анализа было получено уравнение зависимости: У=72,846+0,0031Х1-6,173Х2+5,122Х3-0,18Х4 При этом коэффициент b1=0,0013 показывает, что при увеличении ВВП на 1 млрд. дол. средняя продолжительность жизни увеличивается в среднем на 0,0031 лет, увеличение темпов прироста населения на 1%,. приводит в среднем уменьшению продолжительности жизни на 6,173 лет, увеличение темпов прироста рабочей силы на 1% приводит к увеличению продолжительности жизни на 5,122 лет, а увеличение коэффициента младенческой смертности, на 1% ведет к уменьшению средней продолжительности жизни на 0,18 лет. 3. По значению коэффициента множественной корреляции регрессии равным 0,9546 можно сказать, что между факторными и результативными признаками существует сильная линейная зависимость. 4. Значение F =69,285 существенно превышает табличное, что говорит о статистической значимости уравнения в целом. 5. Табличное значение t–критерия Стьюдента при уровне значимости α = 0,05 и числе степеней свободы 27 tтаб =2,051. Коэффициенты t- статистики при регрессорах Х1 , Х2 и Х4 меньше t таб., и согласно t–критерию не являются статистически значимыми. 6. Средняя ошибка аппроксимации составляет 3,2574 %. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так в норме средняя ошибка аппроксимации колеблется в пределах до 10% 7. В таблице значений критерия Дарбина-Уотсона для уровня значимости 5% при m=4и n=32 критические значения d1=1.14, d2=1,74, В нашем расчете значение d-критерия = 1,89 попадает в интервал от d2 до 2, значит автокорреляция отсутствует. 8. Проверка на гетероскедастичность моделей проводилась с использованием теста Бреуша-Пагана. Тест показал гетероскедастичность отсутствует и модель считается гомоскедастичной. Список используемой литературы 1. Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006. – 576 с. 2. Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006. – 344 с. 3. Эконометрика: Учебно-методическое пособие / Шалабанов А.К., Роганов Д.А. – Казань: Издательский центр Академии управления «ТИСБИ», 2008. – 198 с. 4. Практикум по эконометрике с применение MS Excel / Шалабанов А.К., Роганов Д.А. – Казань: Издательский центр Академии управления «ТИСБИ», 2008 – 53 с. 5. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. – Т. 1. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. – М.: ЮНИТИ-ДАНА, 2001. – 656 с. 6. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. – Т. 2. Айвазян С.А. Основы эконометрики. – М.: ЮНИТИ-ДАНА, 2001. – 432 с. 7. Эконометрика: Учебник / Тихомиров Н.П., Дорохина Е.Ю. – М.: Издательство «Экзамен», 2003. – 512 с 8. Берндт Э. Р. Практика эконометрики: классика и современность: Учебник для студентов вузов. – М.: ЮНИТИ-ДАНА, 2005. – 863 с. 9. Эконометрика: учебное пособие / А.В. Гладилин, А.Н. Герасимов, Е.И. Громов. – М.: КНОРУС, 2008. – 232 с. 10. Введение в эконометрику: учебное пособие / Л.П. Яновский, А.Г. Буховец. – М.: КНОРУС, 2009. – 256 с. 11. Луговская Л.В. Эконометрика в вопросах и ответах: учебное пособие. – М.: ТК Велби, Изд-во Проспект, 2006. – 208 с. |