Цель работы.

Освоить методику построения модели множественной регрессии с использованием пакета программ Statgraphics Plus.

            Порядок выполнения работы

Таблица с исходными данными:

    Y                     Х1             X2             X3                     

178263                47,8            217             -1,2                              

31662                            45,1            220             -25,4          

24589                            39,8            219             -28,5          

87404                            37,1            217             -21,3                            

576864                37,4            220             10,7                              

627909                35,5            229             2,9


Проверка мультиколлениарности исходных данных и отбор определяющих факторов для построения модели:

Матрица коэффициентов парной корреляции. Матрица является продолжением таблицы с исходными данными



y

X1

X2

X3

y

1

-0,54852

0,703626

0,891564

X1

-0,54852

1

-0,50968

-0,20572

X2

0,703626

-0,50968

1

0,386584

X3

0,891564

-0,20572

0,386584

1

Матрица мультиколлинеарна, так как на пересечениях столбцов Х нет значений превышающих 0,8 по модулю

         Отбираем для множественного регрессионного анализа определяющие переменные и записываем имена колонок с их расположением Col_1, Col_3 и т.д. Col_2 не отбираем, т.к. эта графа является просто нумерацией строк.

Нахождение точечных оценок уравнения регрессии, анализ адекватности модели и значимости коэффициентов уравнения

Выполняем множественный регрессионный анализ с отобранными данными, для чего в главном меню вызваем программу Multiple regression. В окно Dependent Variable заносим имя колонки с результирующей переменной (Col_1). В окно Independent Variables заносим имена колонок с отобранными факторными переменными.

При этом на экране появятся результаты выполненного регрессионного анализа в табличной форме и в виде текста.


                                       Standard          T




Parameter               Estimate         Error       Statistic        P-Value


-----------------------------------------------------------------------------




CONSTANT              -3,09771E6      1,16179E6       -2,66633         0,1166


Col_2                   -13885,9        4140,09         -3,354         0,0786


Col_3                    18335,5        4850,49        3,78015         0,0634


Col_4                    12047,1        1144,88        10,5227         0,0089


-----------------------------------------------------------------------------












                           Analysis of Variance





-----------------------------------------------------------------------------




Source             Sum of Squares     Df  Mean Square    F-Ratio      P-Value


-----------------------------------------------------------------------------




Model                  3,76529E11      3    1,2551E11      81,70       0,0121


Residual                3,07246E9      2    1,53623E9




-----------------------------------------------------------------------------




Total (Corr.)          3,79602E11      5













R-squared = 99,1906 percent






R-squared (adjusted for d.f.) = 97,9765 percent




Standard Error of Est. = 39194,8





Mean absolute error = 20596,1






Durbin-Watson statistic = 2,91608













Col_1 = -3,09771E6 - 13885,9*Col_2 + 18335,5*Col_3 + 12047,1*Col_4


















                        Unusual Residuals





--------------------------------------------------------------





                         Predicted                 Studentized




Row                Y             Y      Residual      Residual




--------------------------------------------------------------





     1      178263,0      202906,0      -24642,6         -3,58



     5      576864,0      545686,0       31177,7          9,10



     6      627909,0      643122,0      -15212,8         -8,16



--------------------------------------------------------------






В первой таблице приводятся рассчитанные по методу м.н.к. коэффициенты уравнения регрессии с выбранными факторными переменными. В в .еменныхми факторными ости коэффициентов уравнениям виде

Вграфе Parameter приводятся имена факторных переменных Constant, Col_3, Col_4 и т.д. Во второй графе Estimate указываются точечные оценки параметров модели, в графе Standard Error приводятся стандартные ошибки параметров, а в графе T Statistic приводятся расчетные значения t- критерия Стьюдента для рассчитанных параметров.

Во второй таблице Analysis of Variance приводятся результаты дисперсионного анализа. В первой строке таблицы Model приводится дисперсия регрессии, во второй Residual – дисперсия остатка. Графы слева на право означают: сумму квадратов – Sum of  Squares, число степеней свободы Df, оценку дисперсии – Mean Square, расчетный критерий Фишероа –  F-Ratio.

Ниже таблицы приводятся:

Коэффициент детерминации R-squared в процентах;

Нормированный коэффициент R-квадрат R-squared(adjusted for d.f.);

Стандартная ошибка Standard Error of Est.;

Среднее значение абсолютной ошибки Mean absolute error;

Статистика Дурбина – Ватсона.


Col_1 = -3,09771E6 - 13885,9*Col_2 + 18335,5*Col_3 + 12047,1*Col_4


- запись линейного уравнения регрессии.


Нажимаем Tabular option нажимаем проверку (предпоследняя строчка)-выводятся данные ошибок, выбираем наибольшее значение по модулю (ошибку) и удаляем данную строку в своём варианте, затем снова запускаем программу (предварительно убираем проверку ошибок)


                                                Standard          T



Parameter               Estimate         Error       Statistic        P-Value

-----------------------------------------------------------------------------



CONSTANT              -4,33851E6       225505,0        -19,239         0,0331

Col_2                   -10439,8        743,637       -14,0388         0,0453

Col_3                    23175,8         919,35        25,2089         0,0252

Col_4                    10259,4        264,467        38,7929         0,0164

-----------------------------------------------------------------------------










                           Analysis of Variance




-----------------------------------------------------------------------------



Source             Sum of Squares     Df  Mean Square    F-Ratio      P-Value

-----------------------------------------------------------------------------



Model                  2,54823E11      3    8,4941E10    2314,68       0,0151

Residual                3,66967E7      1    3,66967E7



-----------------------------------------------------------------------------



Total (Corr.)           2,5486E11      4











R-squared = 99,9856 percent





R-squared (adjusted for d.f.) = 99,9424 percent



Standard Error of Est. = 6057,78




Mean absolute error = 2218,93





Durbin-Watson statistic = 3,49002











Col_1 = -4,33851E6 - 10439,8*Col_2 + 23175,8*Col_3 + 10259,4*Col_4


Значение Ф-критерия Фишера при уровне значимости а=0,05 равно 215,72      (1 строка, 3 столбец), полученный нами результат равен 2314,68, отсюда следует что наша модель адекватна


В связи с тем, что на данном компьютерере программа не поддерживает построение графиков п. 3.11 выполнен в п.п. 3.7-3.8


Расчет коэффициента эластичности и коэффициента «бета»


Для получения статистических оценок по исходным данным и результатам вычислений вызваем из главного меню Statgraphics Plus программу Multiple-Variable Analysis. В окно Data вызваем идентификаторы анализируемых данных (Col_3,Col_6) из таблицы исходных данных, т.е. факторов, вошедших в модель и результатного признака.. В командах Tabular options помечаем окно Summary Statistics\ OK. Из таблицы выписываем среднее значение Average, отклонение Variance, стандартное отклонение Standard deviation. Средние значения, стандартные отклонения будем использовать для расчета коэффициентов эластичности, бета  коэффициентов регрессионной модели.

По формулам:

 

                    Col_1               Col_2               Col_3              


--------------------------------------------------------------------------------


Count               5                   5                   5                  


Average             189965,0            41,06               220,4              

Variance            6,37149E10          27,483              24,8               

Standard deviation  252418,0            5,24242             4,97996            

Minimum             24589,0             35,5                217,0              

Maximum             627909,0            47,8                229,0              

Stnd. skewness      1,76017             0,359414            1,70817            

Stnd. kurtosis      1,72733             -0,981888           1,67438             

Sum                 949827,0            205,3               1102,0             

--------------------------------------------------------------------------------









                    Col_4              





--------------------------------------------------------------------------------


Count               5                  





Average             -14,7              





Variance            210,125            




Standard deviation  14,4957            




Minimum             -28,5              




Maximum             2,9                




Stnd. skewness      0,470978           




Stnd. kurtosis      -1,31983           




Sum                 -73,5              





--------------------------------------------------------------------------------























Average (среднее значение)





Variance (отклонение)





Standard deviation (стандартное отклонение)










Эластичность = А * (средний х / средний у)










Бетта коэфициент = А * (стандартное отклонение х/стандартное отклонение у)









Эластичность





Col_2 = 10439,8*(41,06/189965)

 

2,256511



Col_3 = 23175,8*(220,4/189965)

 

26,88888



Col_4 = 10259,4*(-14,7/189965)

 

-0,7939











Бетта коэффициент





Col_2 =10439,8*(5,24242/252418)

0,216822



Col_3 =23175,8*(4,97996/252418)

0,457236



Col_4 =10259,4*(14,4957/252418)

0,58917






Вывод:

Мы освоили методику построения модели множественной регрессии с использованием пакета программ Statgraphics Plus. Мы построили модель множественной регрессии, улучшили ее, определили ее адекватность , нашли коэффициенты эластичности и бета-коэффициенты