ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО‑ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

Филиал в г. Брянске

КОНТРОЛЬНАЯ РАБОТА

по дисциплине

ЭКОНОМЕТРИКА

ВЫПОЛНИЛ(А)

Рычкина Е.А.

СТУДЕНТ(КА)

3 курса («вечер», поток 1)

СПЕЦИАЛЬНОСТЬ

Финансы и кредит

№ ЗАЧ. КНИЖКИ

06ФФД11183

ПРЕПОДАВАТЕЛЬ

Шкаберин В.А.

Брянск — 2009

Вариант 3

ЗАДАНИЕ

По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпускаемой продукции (Y, млн. руб.) от объема капиталовложений (X, млн. руб.):

№ предприятия

X

Y

1

38

69

2

28

52

3

27

46

4

37

63

5

46

73

6

27

48

7

41

67

8

39

62

9

28

47

10

44

67

         Требуется:

1.     Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию углового коэффициента регрессии.

2.     Вычислить остатки; найти остаточную сумму квадратов; определить стандартную ошибку регрессии; построить график остатков.

3.     Проверить выполнение предпосылок метода наименьших квадратов.

4.     Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (уровень значимости a=0,05).

5.     Вычислить коэффициент детерминации R2; проверить значимость уравнения регрессии с помощью F-критерия Фишера (уровень значимости a=0,05); найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

6.     Осуществить прогнозирование значения показателя Y при уровне значимости a=0,1, если прогнозное значения фактора Х составит 80 % от его максимального значения.

7.     Представить графически: фактические и модельные значения Y, точки прогноза.

8.     Составить уравнения нелинейной регрессии:

·        логарифмической;

·        степенной;

·        показательной.

         Привести графики построенных уравнений регрессии.

9.     Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.

РЕШЕНИЕ

Для решения задачи используется табличный процессор EXCEL.

         1. С помощью надстройки «Анализ данных» проводим регрессионный анализ и определяем параметры уравнения линейной регрессии  (меню «Сервис» ® «Анализ данных…» ® «Регрессия»):

В результате этого уравнение регрессии будет иметь вид:

 (прил. 1).

         Угловой коэффициент b1=1,32 показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем на 1,32 млн. руб.

2. При проведении регрессионного анализа в EXCEL одновременно были определены остатки регрессии  (i=1, 2, …, n, где n=10 — число наблюдений значений переменных X и Y) (см. «Вывод остатка» в прил. 1) и рассчитана остаточная сумма квадратов

 (см. «Дисперсионный анализ» в прил. 1).

         Стандартная ошибка линейной парной регрессии Sрег определена там же:

 млн. руб.

(см. «Регрессионную статистику» в прил. 1).

         Стандартная ошибка регрессии Sрег показывает, что фактические значения объема выпускаемой продукции Y отличается от расчетных значений в среднем на 3,101 млн. руб.

         График остатков ei от предсказанных уравнением регрессии значений результата  (i=1, 2, …, n) строим с помощью «Мастера диаграмм». Предварительно в «Выводе остатка» в прил. 1 выделяются блоки ячеек «Предсказанное Y» и «Остатки» вместе с заголовками, а затем выбирается пункт меню «Вставка» ® «Диаграмма…» ® «Точечная»:

График остатков приведен в прил. 2

3. Проверим выполнение предпосылок обычного метода наименьших квадратов.

         1) Случайный характер остатков. Визуальный анализ графика остатков не выявляет в них какой-либо явной закономерности.

         Проверим исходные данные на наличие аномальных наблюдений (выбросов) объема выпускаемой продукции Y. С этой целю сравним абсолютные величины стандартизированных остатков (см. «Вывод остатка» в прил. 1) с табличным значением t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы , которое составляет tтаб=2,306 (см. Справочные таблицы).

         Видно, что ни один из стандартизированных остатков не превышает по абсолютной величине табличное значение t-критерия Стьюдента. Это свидетельствует об отсутствии выбросов.

         2) Нулевая средняя величина остатков. Данная предпосылка всегда выполняется для линейных моделей со свободным коэффициентом b0, параметры которых оцениваются обычным методом наименьших квадратов. В нашей модели алгебраическая сумма остатков и, следовательно, их среднее, равны нулю:  (см. прил. 1).

         Для вычисления суммы и среднего значений остатков использовались встроенные функции «СУММ» и «СРЗНАЧ».

         3) Одинаковая дисперсия (гомоскедастичность) остатков. Выполнение данной предпосылки проверим методом Глейзера в предположении линейной зависимости среднего квадратического отклонения случайной составляющей регрессионной модели от значений факторов. Для этого рассчитывается коэффициент корреляции  между абсолютными величинами остатков  и значениями  (i=1, 2, …, n) с помощью выражения, составленного из встроенных функций:

=КОРРЕЛ(ABS(Остатки);Предсказанное_Y)

         Коэффициент корреляции оказался равным  (см. прил. 1).

            Критическое значение коэффициента корреляции для уровня значимости a=0,05 и числа степеней свободы  составляет rкр=0,632 (см. Справочные таблицы,1).

         Так как коэффициент корреляции  не превышает по абсолютной величине критическое значение, то статистическая гипотеза об одинаковой дисперсии остатков не отклоняется на уровне значимости a=0,05.

         4) Отсутствие автокорреляции в остатках. Выполнение данной предпосылки проверяем методом Дарбина–Уотсона. Предварительно ряд остатков упорядочивается в зависимости от последовательно возрастающих значений результата Y, предсказанных уравнением регрессии. Для этой цели в «Выводе остатка» в прил. 1 выделяется любая ячейка в столбце «Предсказанное Y», и на панели инструментов нажимается кнопка «» («Сортировка по возрастанию»). По упорядоченному ряду остатков рассчитываем d‑статистику Дарбина–Уотсона

 (см. прил. 1).

         Для расчета d‑статистики использовалось выражение, составленное из встроенных функций EXCEL:

=СУММКВРАЗН(«Остатки 2, …, n»; «Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …,n»)

         Критические значения d‑статистики для числа наблюдений n=10, числа факторов p=1 и уровня значимости a=0,05 составляют: d1=0,88; d2=1,32 (см. Справочные таблицы,5).

         Так как выполняется условие

,

статистическая гипотеза об отсутствии автокорреляции в остатках является положительной на уровне значимости a=0,05.

Примечание:

·       если , то остатки признаются независимыми (некоррелированными);

·       если  — имеется положительная автокорреляция;

·       если  — существует отрицательная автокорреляция;

·       если  или , то это указывает на неопределенность ситуации.

         Проверим отсутствие автокорреляции в остатках также и по коэффициенту автокорреляции остатков первого порядка

 (см. прил. 1).

(ряд остатков упорядочен в той же самой последовательности).

         Для расчета коэффициента автокорреляции использовалось выражение, составленное из встроенных функций:

=СУММПРОИЗВ(«Остатки 2, …, n»; «Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …,n»)

         Критическое значение коэффициента автокорреляции для числа наблюдений n=10 и уровня значимости a=0,05 составляет r(1)кр=0,632 (см. Справочные таблицы,1). Так как коэффициент автокорреляции остатков первого порядка не превышает по абсолютной величине критическое значение, то это еще раз указывает на отсутствие автокорреляции в остатках.

         5) Нормальный закон распределения остатков. Выполнение этой предпосылки проверяем с помощью R/S-критерия, определяемого по формуле

,

где emax=6,30; emin=(–3,61) — наибольший и наименьший остатки соответственно (определялись с помощью встроенных функций «МАКС» и «МИН»; см. прил. 1);  — стандартное отклонение ряда остатков (определено с помощью встроенной функции «СТАНДОТКЛОН»; см. прил. 1).

         Критические границы R/S-критерия для числа наблюдений n=10 и уровня значимости a=0,05 имеют значения: (R/S)1=2,67 и (R/S)2=3,69 (см. Справочные таблицы,2).

         Так как расчетное значение R/S-критерия попадает в интервал между критическими границами, то статистическая гипотеза о нормальном законе распределения остатков не отклоняется на уровне значимости a=0,05.

         Таким образом, выполняются четыре из пяти предпосылок обычного метода наименьших квадратов. Это говорит о том, что регрессионная модель не вполне адекватна исследуемому экономическому явлению, и использовать ее для целей анализа и прогнозирования индекса человеческого развития следует с некоторой осторожностью.

4. Проверим статистическую значимость коэффициентов b0 и b1 уравнения регрессии. Табличное значение t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка линейной парной регрессии  составляет tтаб=2,306 (см. Справочные таблицы,3).

         t-статистики коэффициентов

,

были определены при проведении регрессионного анализа в EXCEL: tb0»2,481; tb1»9,481 (см. прил. 1). Их анализ показывает, что по абсолютной величине все они превышают табличное значение t-критерия Стьюдента. Это свидетельствует о статистической значимости обоих коэффициентов.

         Статистическая значимость углового коэффициента b1 дает основание говорить о существенном (значимом) влиянии изменения объема капиталовложений X на изменение объема выпускаемой продукции Y.

5. Коэффициент детерминации R2 линейной модели также был определен при проведении регрессионного анализа:

 

(см. «Регрессионную статистику» в прил. 1).

         Значение R2 показывает, что линейная модель объясняет 91,7 % вариации объема выпускаемой продукции Y.

         F-статистика линейной модели имеет значение

(см. «Дисперсионный анализ» в прил. 1).

         Табличное значение F-критерия Фишера для уровня значимости a=0,05 и чисел степеней свободы  и  составляет Fтаб=5,32 (см. Справочные таблицы, 4). Так как F-статистика превышает табличное значение F-критерия Фишера, то это свидетельствует о статистической значимости уравнения регрессии в целом.

         Среднюю относительную ошибку аппроксимации определяем по приближенной формуле

,

где  млн. руб. — средний объем выпускаемой продукции, определенный с помощью встроенной функции «СРЗНАЧ» (см. «Исходные данные» в прил. 1).

         Значение Еотн показывает, что предсказанные уравнением регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 4,1 %. Линейная модель имеет высокую точность (при  — точность модели высокая, при  — точность хорошая, при  — удовлетворительная, при  — неудовлетворительная).

         По результатам проверок, проведенных в пунктах 3 — 5, можно сделать вывод о высоком качестве линейной модели и возможности ее использования для целей анализа и прогнозирования объема выпускаемой продукции.

6. Спрогнозируем объем выпускаемой продукции Y, если прогнозное значение объема капиталовложений X составит 80 % от своего максимального значения в исходных данных:

·        максимальное значение X xmax=44 млн. руб. (см. «Исходные данные» в прил. 1);

·        прогнозное значение X млн. руб.

         Среднее прогнозируемое значение объема выпускаемой продукции (точечный прогноз) равно

 млн. руб.

         Стандартная ошибка прогноза фактического значения объема выпускаемой продукции y0 рассчитывается по формуле

 млн. руб.,

где  млн. руб. — средний объем капиталовложений;  млн. руб. — стандартное отклонение объема капиталовложений (определены с помощью встроенных функций «СРЗНАЧ» и «СТАНДОТКЛОН»; см. «Исходные данные» в прил. 1).

         Интервальный прогноз фактического значения объема выпускаемой продукции y0 с надежностью (доверительной вероятностью) g=0,9 (уровень значимости a=0,1) имеет вид:

 млн. руб.,

где tтаб=1,860 — табличное значение t-критерия Стьюдента при уровне значимости a=0,1 и числе степеней свободы  (см. Справочные таблицы,3).

         Таким образом, объем выпускаемой продукции Y с вероятностью 90 % будет находиться в интервале от 52,985 до 65,075 млн. руб.

7. График, на котором изображены фактические и предсказанные уравнением регрессии значения Y строим с помощью «Мастера диаграмм» (меню «Вставка» ® «Диаграмма…» ® «Точечная»). Далее строим линию линейного тренда (меню «Диаграмма» ® «Добавить линию тренда…» ® «Линейная»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R2:

 

Точки точечного и интервального прогнозов наносим на график вручную (прил. 3).

8. Логарифмическую, степенную и показательную модели также строим с помощью «Мастера диаграмм» (меню «Вставка» ® «Диаграмма…» ® «Точечная»). Далее последовательно строим соответствующие линии тренда (меню «Диаграмма» ® «Добавить линию тренда…»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R2:

 

Графики линий регрессии, уравнения регрессии и значения R2 приведены в прил. 4. Рассмотрим последовательно каждую модель.       

1) Логарифмическая модель:

.

         Значение параметра b1=46,085 показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на  млн. руб.

         Коэффициент детерминации R2»0,9304 показывает, что логарифмическая модель объясняет 93,04 % вариации объема выпускаемой продукции Y.

         Стандартная ошибка логарифмической регрессии также рассчитывается через коэффициент детерминации R2:

 млн. руб.,

где  млн. руб. — стандартное отклонение объема выпускаемой продукции, определенное с помощью встроенной функции «СТАНДОТКЛОН» (см. «Исходные данные» в прил. 1).

         Среднюю относительную ошибку аппроксимации определяем по приближенной формуле

.

         Предсказанные уравнением логарифмической регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 8,976 млн. руб. или на 12,09 %. Логарифмическая модель имеет хорошую точность.

         2) Степенная модель:

.

         Показатель степени b1=0,7997 показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на 0,7997 %.

         Коэффициент детерминации R2»0,9288 показывает, что степенная модель объясняет 92,88 % вариации объема выпускаемой продукции Y.

         Стандартная ошибка степенной регрессии равна

 млн. руб.

         Средняя относительная ошибка аппроксимации имеет значение

.

         Предсказанные уравнением степенной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 2,856 млн. руб. или на 3,85 %. Степенная модель имеет хорошую точность.

         3) Показательная (экспоненциальная) модель:

,

где е=2,718… — основание натуральных логарифмов;  — функция экспоненты (в EXCEL встроенная функция «EXP»).

         Параметр b1=1,0228 показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем в 1,0228 раза, то есть на 2,28 %.

         Коэффициент детерминации R2»0,9115 показывает, что показательная модель объясняет 91,15 % вариации объема выпускаемой продукции Y.

         Стандартная ошибка показательной регрессии:

 млн. руб.

         Средняя относительная ошибка аппроксимации:

.

         Предсказанные уравнением показательной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 3,06 млн. руб. или на 4,12 %. Показательная модель имеет хорошую точность.

         Сравнивая между собой коэффициенты детерминации R2 четырех построенных моделей (линейной, логарифмической, степенной и показательной), можно придти к выводу, что лучшей моделью является логарифмическая модель, так как она имеет самое большое значение R2.

ПРИЛОЖЕНИЕ 1

ПРИЛОЖЕНИЕ 2

ПРИЛОЖЕНИЕ 3

ПРИЛОЖЕНИЕ 4