КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №2
«Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel»
Вариант № 21
Выполнила: студентка 3 курса Шевела Ольга Олеговна Специальность: Финансы и кредит Группа: Финансовый менеджмент ( 2 высшее образование) № зачетной книжки: 06ффд60921 Преподаватель: Берлин Ю. И. |
Архангельск, 2007
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В лабораторной работе изучается взаимосвязь между факторным признаком «среднегодовая стоимость основных производственных фондов» (признак Х) и результативным признаком «выпуск продукции» (признак У), значениями которых являются исходные данные Лабораторной работы №1 после исключения из них аномальных значений.
В процессе статистического исследования необходимо решить ряд задач:
1. Установить наличие статистической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом;
б) методом сопоставления параллельных рядов.
2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
3. Оценить тесноту связи признаков Х и Y на основе:
а) эмпирического корреляционного отношения η;
б) линейного коэффициента корреляции r.
4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа.
5. Оценить адекватность и практическую пригодность построенной линейной регрессионной модели, указав:
а) доверительные интервалы коэффициентов ;
б) степень тесноты связи признаков Х и Y;
в) погрешность регрессионной модели.
6. Дать экономическую интерпретацию:
а) коэффициента регрессии ;
б) коэффициента эластичности ;
в) остаточных величин .
7. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.
РЕШЕНИЕ
Задание 1
а) графический метод:
Рис. 1. Поле корреляции
По характеру расположения точек корреляционного поля можно сделать вывод о наличии линейной прямой связи между признаками «среднегодовая стоимость основных производственных фондов» (признак Х) и «выпуск продукции» (признак У).
б) метод сопоставления параллельных рядов.
Ранжируем единицы совокупности по возрастанию факторного признака («Среднегодовая стоимость ОПФ»).
Таблица 1 - Исходные данные |
||
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
5 |
1025,00 |
805,00 |
23 |
1105,50 |
1069,50 |
27 |
1197,50 |
920,00 |
1 |
1232,00 |
1184,50 |
8 |
1278,00 |
1265,00 |
32 |
1301,00 |
1334,00 |
22 |
1393,00 |
1138,50 |
19 |
1427,50 |
1092,50 |
2 |
1450,50 |
1299,50 |
3 |
1496,50 |
1449,00 |
13 |
1508,00 |
1541,00 |
26 |
1542,50 |
1414,50 |
9 |
1565,50 |
1483,50 |
4 |
1577,00 |
1610,00 |
28 |
1611,50 |
1437,50 |
17 |
1623,00 |
1472,00 |
6 |
1657,50 |
1380,00 |
14 |
1657,50 |
1679,00 |
25 |
1657,50 |
1495,00 |
7 |
1703,50 |
1863,00 |
30 |
1772,50 |
1495,00 |
18 |
1795,50 |
1748,00 |
10 |
1807,00 |
1851,50 |
20 |
1818,50 |
1495,00 |
24 |
1853,00 |
1713,50 |
29 |
1864,50 |
1575,50 |
15 |
1899,00 |
2035,50 |
11 |
1979,50 |
1955,00 |
21 |
2025,50 |
2012,50 |
16 |
2175,00 |
2185,00 |
С возрастанием значений признака «среднегодовая стоимость ОПФ» значения признака «выпуск продукции» в целом возрастают, между признаками Х и У возможно наличие прямой корреляционной связи.
Задание 2
Сформируем группировку единиц совокупности по факторному признаку «среднегодовая стоимость ОПФ».
Таблица 2 - Зависимость выпуска продукции от среднегодовой стоимости основных фондов |
||||
Номер группы |
Группы предприятий по среднегодовой стоимости основных фондов, млн. руб. |
Число предприятий, ед. |
Выпуск продукции, млн. руб. |
|
Всего |
В среднем на одно предприятие |
|||
1 |
1025-1255 |
4 |
3979,00 |
994,75 |
2 |
1255-1485 |
5 |
6129,50 |
1225,90 |
3 |
1485-1715 |
11 |
16824,50 |
1529,50 |
4 |
1715-1945 |
7 |
11914,00 |
1702,00 |
5 |
1945-2175 |
3 |
6152,50 |
2050,83 |
ИТОГО |
30 |
44999,5 |
1499,98 |
При переходе от одной группе к другой средние значения результативного признака «выпуск продукции» возрастают, следовательно, между признаками Х и У корреляционная связь.
Задание 3
а) Для анализа тесноты связи между факторным и результативным признаками рассчитаем показатель η – эмпирическое корреляционное отношение: .
: общая дисперсия характеризует всю вариацию выпуска продукции, которая возникает из стоимости ОПФ и других неучтенных при построении признаков. Рассчитывается по правилу сложения дисперсий: .
: средняя из внутригрупповых дисперсий характеризует вариацию выпуска продукции, которая возникает под воздействием всех других признаков, кроме стоимости ОПФ.
: межгрупповая дисперсия характеризует вариацию выпуска продукции, которая возникает под влиянием стоимости ОФ.
Эмпирический коэффициент детерминации: η² = 0,815 или 81,5%. 81,5% вариации выпуска продукции вызывает среднегодовая стоимость ОПФ, а остальные 18,5% вариации признака вызывают другие неучтенные факторы.
Эмпирическое корреляционное отношение: η = 0,903, показывает, что связь между выпуском продукции и стоимостью ОПФ тесная.
Таблица 3 – Расчет внутригрупповых дисперсий
Номер группы |
Группы предприятий по среднегодовой стоимости основных фондов, млн. руб. |
Число предприятий, ед. |
Внутригрупповая дисперсия выпуска продукции |
|
1 |
1025-1255 |
4 |
20796,313 |
|
2 |
1255-1485 |
5 |
8813,14 |
|
3 |
1485-1715 |
11 |
17937,909 |
|
4 |
1715-1945 |
7 |
33931,571 |
|
5 |
1945-2175 |
3 |
9551,389 |
|
ИТОГО |
|
30 |
590743,1167 |
Таблица 4 - Дисперсии и эмпирические показатели тесноты взаимосвязи |
|||||
Общая дисперсия |
Средняя из внутригрупповых дисперсий |
Межгрупповая дисперсия |
Эмпирический коэффициент детерминации |
Эмпиричское корреляционное отношение |
|
106432,008 |
19691,437 |
86740,571 |
0,815 |
0,903 |
б) линейный коэффициент корреляции (или множественный R) равный 0,913 говорит о том, что связь между признаками есть, линейная и тесная.
Коэффициент детерминации (R²) равен 0,8339.
Нормированный R-квадрат –скорректированный коэффициент детерминации ( более точный).
Стандартная ошибка показывает на сколько единиц в среднем расчетные значения отличается от фактических.
Цифра наблюдений говорит о том, что мы рассматривали 30 предприятий.
Таблица 5 - Линейный коэффициент корреляции признаков
|
Столбец 1 |
Столбец 2 |
Столбец 1 |
1 |
|
Столбец 2 |
0,91318826 |
1 |
Таблица 6 - Регрессионная статистика
Множественный R |
0,91318826 |
R-квадрат |
0,833912798 |
Нормированный R-квадрат |
0,827981112 |
Стандартная ошибка |
137,6213532 |
Наблюдения |
30 |
Задание 4
Таблица 7 – Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
2662650,41 |
2662650,41 |
140,5861384 |
1,97601E-12 |
Остаток |
28 |
530309,8321 |
18939,63686 |
||
Итого |
29 |
3192960,242 |
|
|
|
|
Коэф- фици- енты |
Стан-дарт- ная ошибка |
t-статис- тика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 68,3% |
Верхние 68,3% |
Y- Пересе-чение |
-242,99 |
149,132 |
-1,629 |
0,114 |
-548,469 |
62,499 |
-394,927 |
-91,042 |
Средне- годовая стоимость ОПФ, млн.руб. |
1,089 |
0,092 |
11,857 |
1,97601E-12 |
0,901 |
1,277 |
0,996 |
1,183 |
df- число степеней свободы, соответствует количеству факторов в модели;
SS-сумма квадратов отклонений;
MS-дисперсия факторная и остаточная;
F – расчетный критерий Фишера, равен 140,58614. Данное значение сравнивают с табличным (), следовательно, уравнение значимо с вероятностью 0,683.
Значимость F – так как данный показатель меньше уровня значимости (0,317), то уравнение регрессии значимо с вероятностью 0,683, т. е. зависимость между признаками Х и Y регрессионной модели является статистически значимой, построенная регрессионная модель в целом адекватна исследуемому признаку.
У – пересечение: свободный член регрессии (а0), равен -242,99.
Коэффициент регрессии (а1) равен 1,089.
Стандартная ошибка – указаны значения средних квадратических отклонений для a0 u a1.
Sа0=109,992 иSа1=0,092
t-статистика –содержит расчетные значения критерия Стьюдента для проверки значимости параметров уравнения регрессии
ta0 = -1,629, ta1 = 11,857, t(0,317;28) = 1,019.
Ta1 > t(табл), следовательно, коэффициент регрессии а1 – значим.
Р-значение (вероятность): 0,114 < 0,317, следовательно, коэффициент регрессии является значимыми, не равен нулю.
Линейное уравнение регрессии: Y= -242,99 + 1,089·Х
Задание 5
а) Интервальная оценка параметров:
С вероятностью 0,95 можно гарантировать, что а0 находится в пределах от -548,469 до 62,499 и с вероятностью 0,683 – а0 находится в пределах от -394,927 до -91,042.
С вероятностью 0,95 можно гарантировать, что а1 находится в пределах от 0,901 до 1,277 и с вероятностью 0,683 – а1 находится в пределах от 0,996 до 1,183.
б) Коэффициент детерминации (R²) равен 0,8339 означает высокую степень тесноты связи признаков в уравнении регрессии: 83,4% вариации признака «выпуск продукции» происходит за счет фактора «среднегодовая стоимость ОПФ», включенного в модель, а остальные 16,6% вариаций – под влиянием факторов неучтенных в модели.
в) Погрешность регрессионной модели равна %, следовательно, погрешность не большая, тогда уравнение адекватное.
Задание 6
а) Коэффициент регрессии (а1) равен 1,089: связь между результативным признаком и факторным – прямая, если факторный (Среднегодовая стоимость ОПФ) признак увеличиться на 1 млн. руб., результативный признак (выпуск продукции) в среднем увеличиться на 1,089 млн. руб. Коэффициент эластичности: , . При изменении факторного признака на 1% результативный признак в среднем изменяется на 1,16%.
в) Согласно уравнению регрессии Y = 1,089·Х-242,99 предсказанный выпуск продукции будет следующим:
Таблица 8 – Вывод остатков
Наблюдение |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Предсказанный выпуск продукции, млн. руб. |
Остатки |
1 |
1025,00 |
873,6041043 |
-68,60410429 |
2 |
1105,50 |
961,2971964 |
108,2028036 |
3 |
1197,50 |
1061,517873 |
-141,517873 |
4 |
1232,00 |
1099,100627 |
85,39937326 |
5 |
1278,00 |
1149,210965 |
115,7890349 |
6 |
1301,00 |
1174,266134 |
159,7338658 |
7 |
1393,00 |
1274,486811 |
-135,9868109 |
8 |
1427,50 |
1312,069565 |
-219,5695646 |
9 |
1450,50 |
1337,124734 |
-37,62473378 |
10 |
1496,50 |
1387,235072 |
61,7649279 |
11 |
1508,00 |
1399,762657 |
141,2373433 |
12 |
1542,50 |
1437,34541 |
-22,84541043 |
13 |
1565,50 |
1462,40058 |
21,09942041 |
14 |
1577,00 |
1474,928164 |
135,0718358 |
15 |
1611,50 |
1512,510918 |
-75,01091791 |
16 |
1623,00 |
1525,038502 |
-53,0385025 |
17 |
1657,50 |
1562,621256 |
-182,6212562 |
18 |
1657,50 |
1562,621256 |
116,3787438 |
19 |
1657,50 |
1562,621256 |
-67,62125624 |
20 (№7) |
1703,50 |
1612,731595 |
250,2684054 |
21 |
1772,50 |
1687,897102 |
-192,897102 |
22 |
1795,50 |
1712,952271 |
35,04772879 |
Таблица 8 (продолжение)
23 |
1807,00 |
1725,479856 |
126,0201442 |
24 (№20) |
1818,50 |
1738,00744 |
-243,0074404 |
25 |
1853,00 |
1775,590194 |
-62,09019411 |
26 |
1864,50 |
1788,117779 |
-212,6177787 |
27 |
1899,00 |
1825,700532 |
209,7994676 |
28 |
1979,50 |
1913,393625 |
41,6063755 |
29 |
2025,50 |
1963,503963 |
48,99603717 |
30 |
2175,00 |
2126,362562 |
58,63743762 |
Остатки: , характеризуют отклонения i-х наблюдений от расчетных значений . На предприятии №7 значение остатка максимально (250,27 млн. руб.), следовательно на данном предприятии ОПФ используются эффективнее; предприятие №20 недоиспользует ОПФ (значение остатка минимально: -243,01 млн. руб.)
Задание 7
Рис.2. Уравнение регрессии (полином 2-го порядка) и его график
Рис. 3. Уравнение регрессии (полином 3-го порядка) и его график
Рис. 4. Уравнение регрессии (степенная функция) и его график
Рис. 5. Уравнения регрессии (экспонента) и его график
Максимальное значение коэффициента детерминации R² определяет вид наиболее адекватного уравнения регрессии. Таким образом, наиболее адекватная модель регрессии – полином 3-го порядка (Рис. 3).