Задача
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн руб.) от объема капиталовложений (Х, млн руб.).
Х |
12 |
4 |
18 |
27 |
26 |
29 |
1 |
13 |
26 |
5 |
Y |
21 |
10 |
26 |
33 |
34 |
37 |
9 |
21 |
32 |
14 |
Требуется:
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
3. Проверить выполнение предпосылок МНК.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (α=0,05).
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (α=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
6. Осуществить прогнозирование среднего значения показателя Y при уровне значимости α=0,1, если прогнозное значение фактора Х составит 80% от его максимального значения.
7. Представить графически фактические и модельные значения Y точки прогноза.
8. Составить уравнения нелинейной регрессии:
· гиперболической;
· степенной;
· показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение
1. Расчет параметров уравнения линейной регрессии проводится с помощью инструмента анализа данных в Excel. Однако мы видим, что сначала необходимо отсортировать исходные данные по возрастанию переменной Х, так как в задании присутствует необходимость проверки предпосылок МНК.
Выполним сортировку: Данные – Сортировка – По переменной Х – По возрастанию:
Получим:
Далее выполним: Анализ данных – Регрессия:
Далее введем входные интервалы для Х и Y, поставим галочку на Метки, осуществим запрос на остатки и график остатков:
ВЫВОД ИТОГОВ |
|
||||||||||||||||||
|
|||||||||||||||||||
Регрессионная статистика |
|
||||||||||||||||||
Множественный R |
0,994048 |
|
|||||||||||||||||
R-квадрат |
0,988132 |
|
|||||||||||||||||
Нормированный R-квадрат |
0,986649 |
|
|||||||||||||||||
Стандартная ошибка |
1,190935 |
|
|||||||||||||||||
Наблюдения |
10 |
|
|||||||||||||||||
Дисперсионный анализ |
|
||||||||||||||||||
|
df |
SS |
MS |
F |
Значимость F |
|
|||||||||||||
Регрессия |
1 |
944,7534 |
944,7534 |
666,1041 |
5,45E-09 |
|
|||||||||||||
Остаток |
8 |
11,34662 |
1,418327 |
|
|||||||||||||||
Итого |
9 |
956,1 |
|
|
|
|
|||||||||||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|||||||||||
Y-пересечение |
8,12023 |
0,711501 |
11,41281 |
3,14E-06 |
6,479505 |
9,760955 |
6,479505 |
9,760955 |
|||||||||||
X |
0,967688 |
0,037494 |
25,80899 |
5,45E-09 |
0,881226 |
1,054149 |
0,881226 |
1,054149 |
|||||||||||
Результат регрессионного анализа имеет вид:
ВЫВОД ОСТАТКА |
||
Наблюдение |
Предсказанное Y |
Остатки |
1 |
9,087918 |
-0,08792 |
2 |
11,99098 |
-1,99098 |
3 |
12,95867 |
1,041332 |
4 |
19,73248 |
1,267519 |
5 |
20,70017 |
0,299831 |
6 |
25,53861 |
0,461394 |
7 |
33,28011 |
0,719893 |
8 |
33,28011 |
-1,28011 |
9 |
34,24779 |
-1,24779 |
10 |
36,18317 |
0,81683 |
Таким образом, исходя из коэффициентов, получаем уравнение зависимости объема выпуска продукции от объема капиталовложений:
Y=8,12+0,97Х.
С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции увеличится в среднем на 970 тыс. руб.
2. Остатки получены по итогам регрессии:
Остатки |
-0,08792 |
-1,99098 |
1,041332 |
1,267519 |
0,299831 |
0,461394 |
0,719893 |
-1,28011 |
-1,24779 |
0,81683 |
Остаточная сумма квадратов равна 11,35 (столбец SS остатка в табл. «Дисперсионный анализ»).
Дисперсия остатков Sε2=1,42 (столбец MS остатка в табл. «Дисперсионный анализ).
График остатков ранее уже был получен. Для удобства преобразуем его в точечную диаграмму, соединив точки:
3. 1) Проверим выполнение свойства случайности остатков построенной модели зависимости объемов выпуска продукции от объема капиталовложений. Проверку осуществим с помощью критерия поворотных точек. По графику остатков видно, что количество поворотов p=5. При n=10,
pкр= – 1,96={2,9}=2.
P=5>pкр=2, следовательно, свойство случайности для ряда остатков выполняется.
2) Свойство нулевого математического ожидания для линейной модели выполняется автоматически.
3) Проверим выполнение свойства постоянной дисперсии остаточной компоненты с помощью критерия Голдфельда – Квандта. Возьмем первые и последние четыре уровня, средние два уровня не рассматриваем. С помощью функции Регрессия построим модели по первым и последним четырем наблюдениям:
Итоги регрессии для первых четырех наблюдений:
Итоги регрессии для последних четырех наблюдений:
Для первой модели SS1=4,75; для второй модели SS2=3,33.
F= ==1,43.
Критическое значение Fкр при α=5% и числах степеней свободы
k1=k2=4-1-1=2 найдем с помощью функции FРАСПОБР:
Получили, что Fкр=19.
F=1,43<Fкр=19, следовательно, свойство постоянной дисперсии остаточной компоненты выполняется, модель гомоскедастичная.
4) Проверим выполнение свойства независимости остатков, используя критерий Дарбина – Уотсона.
Вычислим d-статистику с помощью функций СУММКВ и СУММКВРАЗН:
СУММКВРАЗН(Е)= |
22,16079 |
|||
СУММКВ(Е)= |
11,34662 |
|||
d= |
1,953075 |
|||
Определим критические уровни d1 и d2 при n=10 по таблице. Получим, d1=0,88 и d2=1,32. Таким образом, d больше верхнего критического уровня и меньше 2, а это говорит о том, что свойство независимости остаточной компоненты выполняется.
5) Проверим выполнение свойства нормального распределения остатков, используя R/S критерий.
R/S== 2,736084.
Критический интервал при n=10 и α=5% будет (2,67;3,57).
2,74Є(2,67;3,57), следовательно, свойство нормального распределения остатков для построенной модели выполняется.
Проведенная проверка предпосылок регрессионного анализа показала, что для модели выполняются все условия Гаусса – Маркова. Таким образом, МНК – наилучший метод моделирования.
4. Выпишем из Регрессии t-статистику для коэффициентов модели:
а=8,12; t(a)=11,41
b=0,97; t(b)=25,81 (столбец « t-статистик» Регрессии).
Определим tкр с помощью функции СТЬЮДРАСПОБР(5%; 8):
tкр=2,31.
Сравним |t(a)|=11,41>tкр=2,31, следовательно, свободный коэффициент является значимым, его необходимо сохранить в модели.
|t(b)|=25,81>tкр=2,31, следовательно, коэффициент регрессии b является значимым, его и фактор объема капиталовложений нужно также сохранить в модели.
Оба коэффициента являются значимыми и необходимыми в данной модели.
5. Выпишем из Регрессии R2=0,99=99%.
Таким образом, вариация объема выпуска продукции Y на 99% объясняется по полученному уравнению вариацией объема капиталовложений.
Оценим значимость уравнения с помощью F-критерия Фишера.
Выпишем из Регрессии F=666,1.
Fкр=5,32, найдем с помощью функции FРАСПОБР(5%; k1=1; k2=8):
Сравним F=666,1>Fкр=5,32, следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель факторной переменной X.
Найдем теперь среднюю относительную ошибку аппроксимации. Для этого используем исходные значения Yi и найденные Регрессией остатки Ei. Вычислим относительные погрешности: Еотн=||*100%:
С помощью СРЗНАЧ найдем Еотн=4,97%.
Сравним Еотн=4,97%Є(0; 5%), следовательно, модель является достаточно точной, однако точность модели приближена к удовлетворительной.
Вывод: в результате исследования получилось, что все коэффициенты модели, а также сама модель являются значимыми, что свидетельствует об адекватности модели, о том, что ее можно использовать как для анализа, так и для прогнозирования. Модель также является достаточно точной.
6. Для прогнозирования найдем прогнозное значение Х. В задаче сказано, что оно составляет 80% от его максимального значения. Используя функцию МАКС, получим что Хmax=29, а 80% от 29 равно 23,2. Таким образом, Х*=23,2. Найдем ожидаемый объем выпуска продукции Yт*=8,12+0,97*23,2=30,624 (млн руб.)
Для интервального прогноза подготовим:
- стандартная ошибка модели Sε=1,19 (стандартная ошибка в Регрессии);
- среднее значение х=16,1 (СРЗНАЧ по Х);
- ∑(хi-x)2=1008,9 (КВАДРОТКЛ по Х).
Стандартная ошибка прогнозирования составит:
S(Yт*)=1,19=0,461:
При tкр (10%;8)=1,86 в рамках доверительного интервала U(Yт*)= S(Yт*)* tкр=0,461*1,86=0,858.
Границы интервала будут:
Uнижн=30,624-0,858=29,766;
Uверх=30,624+0,858=31,482.
Таким образом, с надежностью 90% можно утверждать, что объем выпуска продукции будет составлять от 29,766 до 31,482 млн руб.
7. Для построения данного графика была выбрана диаграмма точечного типа. На графике представлены исходные значения Х и Y, теоретические (смоделированные) значения Y, а также результаты точечного и интервального прогноза. Была добавлена и линия тренда (прямая по модельным значениям Y).
8. Теперь составим уравнения нелинейной регрессии и приведем графики для составленных уравнений.
1) Построим степенную модель. Отобразим для этого исходные данные в виде точечной диаграммы, а затем добавим линию степенного тренда:
Получили уравнение степенной модели: Y=7,142.
2) Построим показательную модель. Отобразим для этого исходные данные в виде точечной диаграммы, а затем добавим линию экспоненциального тренда.
Получили уравнение модели Y=9,9238.
3) Гиперболическая модель Y=a+ не является стандартной в отличие от степенной и показательной моделей, а, значит, ее нельзя построить обычным стандартным способом. Добавим новую переменную x=, тогда Y=а+b*x.
С помощью Регрессии получим коэффициенты линейной модели Y=а+b*x:
а=28; b=-23,72. Получено уравнение гиперболической модели:
Y=28-. Для построения графика добавим к ряду исходных данных (хi;yi) ряд теоретических значений (xi;yт):
9. Теперь для всех трех нелинейных моделей найдем коэффициенты детерминации, эластичности и средние относительные ошибки аппроксимации.
По полученным данным сделаем вывод, выберем наилучшую модель. Заполним вспомогательную расчетную таблицу для каждой нелинейной модели:
у=7,142х^0,4531 |
|||||||
X |
Y |
Yт |
Е |
Еотн |
|||
1 |
9 |
7,142 |
1,858 |
20,64% |
|||
4 |
10 |
13,38484 |
-3,38484 |
33,85% |
|||
5 |
14 |
14,80891 |
-0,80891 |
5,78% |
СУММКВ(Е)= |
46,98487 |
|
12 |
21 |
22,01896 |
-1,01896 |
4,85% |
КВАДРОТКЛ(Y)= |
956,1 |
|
13 |
21 |
22,83219 |
-1,83219 |
8,72% |
R-квадрат= |
0,950858 |
|
18 |
26 |
26,45963 |
-0,45963 |
1,77% |
|||
26 |
34 |
31,25678 |
2,743218 |
8,07% |
|||
26 |
32 |
31,25678 |
0,743218 |
2,32% |
|||
27 |
33 |
31,79587 |
1,204126 |
3,65% |
|||
29 |
37 |
32,84221 |
4,15779 |
11,24% |
|||
Еотн ср |
10,09% |
||||||
|
|
||||||
у=9,9238е^0,0447х |
b=е^0,0447= |
1,045714 |
|||||
X |
Y |
Yт |
Е |
Еотн |
|||
1 |
9 |
10,37746 |
-1,37746 |
15,31% |
|||
4 |
10 |
11,8667 |
-1,8667 |
18,67% |
|||
5 |
14 |
12,40917 |
1,590828 |
11,36% |
СУММКВ(Е)= |
55,10299 |
|
12 |
21 |
16,96811 |
4,031886 |
19,20% |
КВАДРОТКЛ(Y)= |
956,1 |
|
13 |
21 |
17,7438 |
3,256204 |
15,51% |
R-квадрат= |
0,942367 |
|
18 |
26 |
22,18765 |
3,812348 |
14,66% |
|||
26 |
34 |
31,72598 |
2,27402 |
6,69% |
|||
26 |
32 |
31,72598 |
0,27402 |
0,86% |
|||
27 |
33 |
33,1763 |
-0,1763 |
0,53% |
|||
29 |
37 |
36,27889 |
0,721114 |
1,95% |
|||
Еотн ср |
10,47% |
||||||
у=28-23,72/х |
|||||||
X |
Y |
Yт |
Е |
Еотн |
|||
1 |
9 |
4,28 |
4,72 |
52,44% |
|||
4 |
10 |
22,07 |
-12,07 |
120,70% |
|||
5 |
14 |
23,256 |
-9,256 |
66,11% |
СУММКВ(Е)= |
508,9803 |
|
12 |
21 |
26,02333 |
-5,02333 |
23,92% |
КВАДРОТКЛ(Y)= |
956,1 |
|
13 |
21 |
26,17538 |
-5,17538 |
24,64% |
R-квадрат= |
0,46765 |
|
18 |
26 |
26,68222 |
-0,68222 |
2,62% |
|||
26 |
34 |
27,08769 |
6,912308 |
20,33% |
|||
26 |
32 |
27,08769 |
4,912308 |
15,35% |
|||
27 |
33 |
27,12148 |
5,878519 |
17,81% |
|||
29 |
37 |
27,18207 |
9,817931 |
26,53% |
|||
Еотн ср |
37,05% |
Для вычисления индекса детерминации подготовили:
∑Е2 (СУММКВ для столбцов ошибок);
∑(y-y)2 (КВАДРОТКЛ для Y);
R2 =1-.
Составим итоговую сводную таблицу характеристик качества построенных моделей:
Модель |
Еотн ср |
R-квадрат |
Степенная |
10,09% |
0,9508578 |
Показательная |
10,47% |
0,9423669 |
Гиперболическая |
37,05% |
0,4676496 |
Теперь для всех трех построенных моделей найдем коэффициенты эластичности.
Для степенной модели Y=7,142 коэффициент эластичности (Э) – величина постоянная. В данном случае она равна 0,45. Это означает, сто увеличение объема капиталовложений на 1% приведет к увеличению объема выпуска продукции на 0,45%.
Для показательной (Y=a*bx) Э=x*ln b и гиперболической (Y=a+b/x) Э=- моделей коэффициенты эластичности представлены в таблице:
Х |
коэффициенты эластичности |
|
показ |
гипербол |
|
1 |
0,0447 |
5,5420561 |
4 |
0,1788 |
0,2686905 |
5 |
0,2235 |
0,2039904 |
Таким образом, согласно показательной модели, увеличение объема капиталовложений на 1% приводит к увеличению объема выпуска продукции на величину от 0,04% до 0,22% (с возрастанием Х его влияние на Y усиливается).
Согласно гиперболической модели, при увеличении объема капиталовложений на 1% происходит увеличение объема выпуска продукции от 5,54% до 0,2% (с возрастанием Х его влияние на Y ослабевает).
Вывод: Проанализировав найденные средние относительные ошибки аппроксимации для всех трех нелинейных моделей, можно сделать вывод, что наиболее точной является степенная модель, так как ее точность является удовлетворительной и ее средняя относительная ошибка аппроксимации (Еотн ср=10,09%) является наименьшей из всех трех моделей. Что касается индекса детерминации, то опять же наилучшей моделью является степенная, так как в ней вариация объема выпуска продукции Y учтена на 95% (R2 наибольший из всех трех моделей). Таким образом, как для прогноза, так и для анализа степенная модель из трех построенных подходит наилучшим образом, а гиперболическая модель не подходит ни для описания данной зависимости объема выпуска продукции от объема капиталовложений, ни для прогнозирования. Рассмотрев коэффициенты эластичности, можно также отметить непригодность гиперболической модели. Что касается показательной модели, то по своим характеристикам она близка к степенной и может быть использована для анализа и прогноза.