Данные взяты из финансовых отчетов компании, размещенных на сайте компании[1] и охватывают период 6 лет с 2004 по 2011 год в помесячной разбивке.
Содержательный смысл переменных X1, X2, X3, Х4 ,Х5 в таблице 3.1 и 5 приложения:
Х1 — Индекс роста промышленного производства по отрасли металлургия, %;
Х2 — Индекс промышленного производства по РФ; Х3 -Экспорт черных металлов, млн. тн; Х4 -Инвестиции в основной капитал, млрд. рублей; Х5 — Экспорт Российской Федерации, млрд. долл.; Y — Выручка предприятия, млн. руб.
Y1 — Рентабельность активов по чистой прибыли, %
Рассчитаем коэффициенты парной корреляции между каждой парой переменных. Значения коэффициентов парной корреляции приведены в таблице 3.2.
Таблица 3.2
Х1 | Х2 | Х3 | Х4 | Х5 | Y | Y1 | |
Х1 | 1 | ||||||
Х2 | 0,75 | 1 | |||||
Х3 | 0,31 | 0,30 | 1 | ||||
Х4 | 0,02 | 0,23 | -0,37 | 1 | |||
Х5 | 0,06 | 0,19 | -0,22 | 0,67 | 1 | ||
Y | 0,05 | 0,11 | -0,26 | 0,60 | 0,88 | 1 | |
Y1 | 0,03 | -0,07 | 0,43 | -0,46 | -0,26 | -0,37 | 1,0 |
Интерпретация связи факторов с выручкой предприятия представлена в таблице 3.3.
Таблица 3.3
Х1 | Х2 | Х3 | Х4 | Х5 | Y | Y1 | |
Х1 | 1 | ||||||
Х2 | сильная | 1 | |||||
Х3 | умеренная | слабая | 1 | ||||
Х4 | связи нет | слабая | связи нет | 1 | |||
Х5 | связи нет | слабая | связи нет | заметная | 1 | ||
Y | связи нет | слабая | связи нет | заметная | сильная | 1 | |
Y1 | связи нет | связи нет | умеренная | связи нет | связи нет | связи нет | 1 |
Среди факторов Х1, Х2, Х3, Х4, Х5 отберем два (Xi и Xj), которые могут быть включены в двухфакторную модель линейной регрессии:
Y = a0+a1Xi + a2Xj
При этом будем исходить из критериев:
|r (Xi ,Xj)| < 0,75
|r (Xi ,Xj)| < |r (Xi ,Y)|
|r (Xi ,Xj)|< |r (Xj ,Y)|
Будем сравнивать коэффициенты корреляции по абсолютной величине, не обращая внимания на их знак.
Как видно из таблицы, наибольшая связь результативного фактора имеется с факторами Х4 и Х5. Однако у этих факторов очень высокая взаимная связь.
|r (X3,X5)| =0,22 < 0,75
|r (X3,X5)| =0,22 < 0,26= |r (X3,Y)|
|r (X4,X5)| =0,22 < 0,88= |r (X5 ,Y)|
Этот вариант является оптимальным.
Таким образом, среди пяти факторов было отобрано такие два фактора, статистическая зависимость между которыми достаточно слабая (чем слабее, тем лучше), но связь каждого из них с показателем Y сильнее, чем между собой.
Рассчитаем параметры уравнения двухфакторной линейной регрессии Y = a0+a1X2+a2X4 с помощью Метода наименьших квадратов (МНК).
В соответствии с этим методом, для расчета параметров данного уравнения, необходимо построить и решить систему нормальных уравнений, которая имеет вид:
na0 + a1 Σxi + a2Σxj= Σy;
a0 Σxi + a1 Σxi2 + a2 Σxi xj= Σyxi;
a0 Σxj + a1 Σxi xj + a2 Σxj2= Σyxj;
Чтобы составить такую систему, вначале необходимо рассчитать все суммы (Σxi , Σxi , Σy,…и т.д.), являющиеся коэффициентами при неизвестных в системе, заполнив вспомогательную таблицу (приложение).
[1] Финансовая отчетность по РСБУ [Электронный ресурс] — Режим доступа: http://mmk.ru/for_investor/financial_statements/dynamics/, свободный. — (Дата обращения — 05.05.2012)