Контрольная работа: Линейная регрессия
Название: Линейная регрессия Раздел: Рефераты по экономике Тип: контрольная работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Министерство образования и науки Российской Федерации Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования Всероссийский Заочный Финансово-Экономический институт Филиал г. Тула Контрольная работа по дисциплине "Эконометрика" Вариант 8 Выполнила: Проверил: Тула 2008 Задача 1 По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (, млн. руб.) от объема капиталовложений (, млн. руб.). Требуется: 1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии. 2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков. 3. Проверить выполнение предпосылок МНК. 4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента 5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью -критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели. 6. Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения. 7. Представить графически: фактические и модельные значения точки прогноза. 8. Составить уравнения нелинейной регрессии: · гиперболической; · степенной; · показательной. Привести графики построенных уравнений регрессии. 9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод. Вариант 8
Решение: 1. Уравнение линейной регрессии имеет следующий вид: Таблица 1
Найдем b: Тогда Уравнение линейной регрессии имеет вид: ŷx =11,779+0,761x. Коэффициент регрессии показывает среднее изменение результата с изменением фактора на одну единицу. С увеличением объема капиталовложений на 1 млн. рублей объем выпускаемой продукции увеличится в среднем на 761 тыс. рублей. 2. Вычислим остатки при помощи. Получим:
Таблица 2
Найдем остаточную сумму квадратов: Дисперсия остатков равна: . График остатков имеет следующий вид:
График 1 3. Проверим выполнение предпосылок МНК. · Случайный характер остатков. Случайный характер остатков εi проверяется по графику. Как видно из графика 1 в расположении точек εi нет направленности (на графике получена горизонтальная полоса). Следовательно, εi – случайные величины и применение МНК оправдано. · Средняя величина остатков или математическое ожидание равно нулю. Так как расположение остатков на графике не имеет направленности (расположены на графике в виде горизонтальной полосы), то они независимы от значений фактора xi . Следовательно, модель адекватна. · Проверка гомоскедастичности остатков. Выборка у нас малого объема, поэтому для оценки гомоскедастичность остатков используем метод Голдфельда - Квандта. 1) Упорядочим n = 10 наблюдений в порядке возрастания х. 2) Разделим на две группы - с большим и меньшим x, и для каждой группы определим уравнения регрессии.
Таблица 3
3) Рассчитаем остаточные суммы квадратов для каждой регрессии. , . 4) Вычислим F- распределения. Fнабл =S2ŷ /S1ŷ =1,653. 5) Произведем сравнение Fнабл и Fтабл . 1,653<5,32 (при k1 =1 и k2 =n–2=10–2=8), следовательно, гетероскедастичность места не имеет, т.е. дисперсия остатков гомоскедастична. · Отсутствие автокорреляции. Отсутствие автокорреляции проверяется по d-критерию Дарбина - Уотсона:
Таблица 4
; d=75,282/37,961=1,983. Так как d-критерий меньше двух, то мы наблюдаем присутствие положительной автокорреляции. · Остатки подчиняются нормальному закону распределения. 4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента ; , ; , где Тогда , ; и tтабл =2,3060 (при 10-2=8 степенях свободы); tа и tb > tтабл , что говорит о значимости параметров модели. 5. Коэффициент детерминации находится по формуле: . Данные возьмем из таблицы 5: Таблица 5
Для проверки значимости модели используем F-критерий Фишера: . Fтабл =5,32 (k1 =1, k2 =8 степенями свободы) ; F>Fтабл , что говорит о значимости уравнения регрессии. Среднюю относительную ошибку аппроксимации находим по формуле: ; В среднем расчетные значения отклоняются от фактических на 8,4%. Поскольку найденная средняя относительная ошибка аппроксимации находится в интервале от 5 до 10, то можно утверждать, что модель имеет хорошее качество. 6. Ширина доверительного интервала находится по формулам:
где tα =1,86 при m=n-2=8 и α=0,1 Т.о. Верхн. граница: 25,173+4,34=29,513 Нижн. граница: 25,173-4,34=20,833
Таблица 6
7. Фактические и модельные значения Y, точки прогноза представлены на графике 2.
График 2
8. Составить уравнения нелинейной регрессии: · Гиперболической Уравнение показательной кривой имеет вид: ŷ = a + b/x. Произведем линеаризацию модели путем замены Х = 1/х. Тогда уравнение примет вид: ŷ = a + bХ- линейное уравнение регрессии. Данные, необходимые для нахождения параметров приведены в таблице 6
Таблица 7
Значение параметров а и b линейной модели определим по формулам: Уравнение регрессии будет иметь вид ŷ = 27,44 – 51,47 X. Перейдем к исходным переменным, получим уравнение гиперболической модели: . График 3
Степенная Уравнение степенной модели имеет вид: ŷ = a · xb Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg ŷ = lg a + b lg x Обозначим Y = lg ŷ; A = lg a; X = lg x Тогда уравнение примет вид: Y = A + b X - линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 8:
Таблица 8
Значение параметров А и b линейной модели определим по формулам: Значение параметров А и b линейной модели определим по формулам: Уравнение регрессии имеет вид: Y=0,91 + 0,39X Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения: ŷ=100,91 · x0,39 ŷ =8,13 · x0,39 .
График 4 · Показательная Уравнение показательной кривой имеет вид: ŷ = a · bx Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg ŷ = lg a + x lg b Обозначим Y = lg ŷ; A = lg a; B = lg b Тогда уравнение примет вид: Y = A + Bx - линейное уравнение регрессии. Данные, необходимы для нахождения параметров, приведены в таблице 9.
Таблица 9
Значение параметров А и B линейной модели определим по формулам: Уравнение регрессии будет иметь вид: Y = 1,115 + 0,016x. Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения: ŷ =101,115 ·(100,016 )x ; ŷ =13,03·1,038x .
График 5 9. Для указанных моделей найти: R2 – коэффициент детерминации и средние относительные ошибки аппроксимации А. для всех моделей = 264,9 (см. таблицу 5). · Степенная модель (см. таблицу 8): ; ; · Показательная модель (см.таблицу 9): ; ; · Гиперболическая модель (см. таблицу 7): .
Таблица 10
Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов. Чем ближе R2 к 1, тем выше качество модели. Чем выше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7% свидетельствует о хорошем качестве модели. При сравнении гиперболической, степенной и показательной моделей по данным характеристикам мы видим, что наибольшее значение коэффициента детерминации R2 и наименьшую ошибку аппроксимации имеет степенная модель, следовательно, ее можно считать лучшей. Задача 2
Даны две СФМ, которые заданы в виде матриц коэффициентов модели. Необходимо записать системы одновременных уравнений и проверить обе системы на идентифицируемость.
Таблица 1
Решение 2а) , тогда система уравнений будет иметь вид: Модель имеет 3 эндогенные (y1 , y2 , y3 ) и 4 экзогенные (x1 , x2 , x3 , x4 ) переменные. Проверим каждое уравнение на необходимое и достаточное условие идентификации. 1 уравнение: y 1 = b 12 y 2 + b 13 y 3 + a 12 x 2 + a 13 x 3 ; Необходимое условие: в + 1 = H Эндогенные переменные: y1, y2, y3 ; H=3 Отсутствующие экзогенные переменные: х1, х4 ; D=2 2+1=3 - условие необходимости выполнено. Достаточное условие: В уравнении отсутствуют х1, х4 . Построим матрицу из коэффициентов для второго и третьего уравнения:
Таблица 2
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено. 1-ое уравнение идентифицируемо. 2 уравнение: y 2 = b 23 y 3 + a 21 x 1 + a 22 x 2 + a 24 x 4 ; Необходимое условие: в + 1 = H Эндогенные переменные: y2, y3 ; H=2 Отсутствующие экзогенные переменные: х3 ; D=1 1+1=2 - условие необходимости выполнено. Достаточное условие: В уравнении отсутствуют y1, х3 . Построим матрицу из коэффициентов для первого и третьего уравнения:
Таблица 3
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено. 2-ое уравнение идентифицируемо. 3 уравнение: y 3 = b 32 y 2 + a 31 x 1 + a 32 x 2 + a 33 x 3 ; Необходимое условие: в + 1 = H Эндогенные переменные: y2, y3 ; H=2 Отсутствующие экзогенные переменные: х4 ; D=1 1+1=2 - условие необходимости выполнено. Достаточное условие: В уравнении отсутствуют y1, х4 . Построим матрицу из коэффициентов для первого и второго уравнения: Таблица 4
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено. 3-е уравнение идентифицируемо. В целом вся система уравнений является идентифицируемой.
Решение 2б) , Тогда система уравнений будет иметь вид:
Модель имеет 3 эндогенные (y1 , y2 , y3 ) и 4 экзогенные (x1 , x2 , x3 , x4 ) переменные. Проверим каждое уравнение на необходимое и достаточное условие идентификации. 1 уравнение: y 1 = b 13 y 3 + a 11 x 1 + a 13 x 3 + a 14 x 4 ; Необходимое условие: в + 1 = H Эндогенные переменные: y1, y3 ; H=2 Отсутствующие экзогенные переменные: х2 ; D=1 1+1=2 - условие необходимости выполнено. Достаточное условие: В уравнении отсутствуют y2 , х2 . Построим матрицу из коэффициентов для второго и третьего уравнения:
Таблица 5
Найдем определитель: , следовательно, условие достаточности НЕ выполнено. 1-ое уравнение НЕидентифицируемо. 2 уравнение: y 2 = b 11 y 1 + b 23 y 3 + a 22 x 2 + a 24 x 4 ; Необходимое условие: в + 1 = H Эндогенные переменные: y1 , y2, y3 ; H=3 Отсутствующие экзогенные переменные: x1 , х3 ; D=2 2+1=3 - условие необходимости выполнено. Достаточное условие: В уравнении отсутствуют x1, х3 . Построим матрицу из коэффициентов для первого и третьего уравнения:
Таблица 6
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено. 2-ое уравнение идентифицируемо. 3 уравнение : y3 = b31 y2 +a31 x1 +a33 x3 +a34 x4 ; Необходимое условие: в + 1 = H Эндогенные переменные: y1, y3 ; H=2 Отсутствующие экзогенные переменные: х2 ; D=1 1+1=2 - условие необходимости выполнено. Достаточное условие: В уравнении отсутствуют y1, х4 . Построим матрицу из коэффициентов для первого и второго уравнения:
Таблица 7
Найдем определитель: , следовательно, условие достаточности НЕ выполнено 3-е уравнение НЕидентифицируемо. В целом вся система уравнений является НЕидентифицируемой, так как первое и третье уравнение – НЕидентифицируемы. 2в) По данным, используя косвенный метод наименьших квадратов, построить структурную форму модели вида: y1 =a01 +b12 y2 +a11 x1 +ε1 ; y2 =a02 +b21 y1 +a22 x2 +ε2
Таблица 8
Решение 1) Структурную форму модели (СФМ) преобразуем в приведенную форму модели (ПФМ): Для этого из второго уравнения выражаем y2 и подставляем его в первое, а из первого выражаем y1 и подставляем его во второе уравнение. Получим: y1 =δ11 x1 + δ12 x2 +u1; y2 =δ21 x1 + δ22 x2 +u2 , где u1 и u1 –случайные ошибки ПФМ. Здесь
2) В каждом уравнение ПФМ с помощью МНК определим δ – коэффициент. Для первого уравнения: . Для решения системы уравнений требуются вспомогательные расчеты, которые представлены в таблице 9, 10.
Таблица 9
Для упрощения расчетов удобнее работать с отклонениями от средних уровней: ∆у = у - уср ; ∆х = х - хср
Таблица 10
С учетом приведенных данных получим: 404,03 = 47,33δ11 + 27,33δ12 262,73 = 27,33δ11 + 97,33δ12 δ12 = 0,36; С учетом этого первое уравнение ПФМ примет вид:
y 1 = 8,33х1 + 0,36х2 + u 1 Для второго уравнения определим δ – коэффициент с помощью МНК: Для дальнейших расчетов данные берем из таблицы 9, 10. Получим: 256,17=47,33δ21 +27,33δ22 203,07=27,33δ21 +97,33δ22 δ22 = 0,68; Второе уравнение ПФМ примет вид: у2 = 5,02х1 + 0,68х2 + u 2 3) Выполним переход от ПФМ к СПФМ. Для этого из последнего уравнения найдем х2 : Найденное х2 подставим в первое уравнение. , тогда b 12 =0,53; a 11 =5,67 Из первого уравнения ПФМ найдем х1 Подставим во второе уравнение ПФМ , тогда b 21 =0,6; a 22 =0,46 4) Свободные члены СФМ найдем из уравнения: а01 = у1ср - b12 у2ср - а11 х1ср = 73,17 – 0,53 50,98 - 5,67 5,67 = 14,00; а02 = у2ср - b21 у1ср - а22 х2ср = 50,98 - 0,6 73,17 - 0,46 6,67 = 4,00. 5) Записываем СФМ в окончательном виде: y1 =a01 + b12 y2 + a11 x1 + ε1 ; y2 =a02 + b21 y1 + a22 x2 + ε2 . y1 =14 + 0,53y2 + 5,67x1 + ε1 ; y2 = 4 + 0,6y1 + 0,46x2 + ε2. |