КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №2
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант № 14
Выполнил: ст. III курса гр.________________
Проверил:______________________________
Уфа
1. Постановка задачи
Корреляционно-регрессионный анализ (КР-анализ) взаимосвязи признаков является составной частью проводимого статистического исследования двух экономических показателей статистической совокупности 32 предприятий и частично использует результаты Лабораторной работы № 1.
В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак X) и результативным признаком Выпуск продукции (признак У), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений (табл.1).
Таблица 1
Исходные данные
1 |
854,00 |
824,00 |
2 |
1006,00 |
904,00 |
3 |
1038,00 |
1008,00 |
4 |
1094,00 |
1120,00 |
5 |
710,00 |
560,00 |
6 |
1150,00 |
960,00 |
7 |
1182,00 |
1296,00 |
8 |
886,00 |
880,00 |
9 |
1086,00 |
1032,00 |
10 |
1254,00 |
1288,00 |
11 |
1374,00 |
1360,00 |
13 |
1046,00 |
1072,00 |
14 |
1150,00 |
1168,00 |
15 |
1318,00 |
1416,00 |
16 |
1510,00 |
1520,00 |
17 |
1126,00 |
1024,00 |
18 |
1246,00 |
1216,00 |
19 |
990,00 |
760,00 |
20 |
1262,00 |
1040,00 |
21 |
1406,00 |
1400,00 |
22 |
966,00 |
792,00 |
23 |
766,00 |
744,00 |
24 |
1286,00 |
1192,00 |
25 |
1150,00 |
1040,00 |
26 |
1070,00 |
984,00 |
27 |
830,00 |
640,00 |
28 |
1118,00 |
1000,00 |
29 |
1294,00 |
1096,00 |
30 |
1230,00 |
1040,00 |
32 |
902,00 |
928,00 |
В процессе статистического исследования необходимо решить ряд задач.
1.Установить наличие статистической связи между факторным признаком Х и результативным признаком Y:
а)графическим методом;
б)методом сопоставления параллельных рядов.
2.Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
3.Оценить тесноту связи признаков Х и Y на основе:
а)эмпирического корреляционного отношения ŋ;
б)линейного коэффициента корреляции r.
4.Построить однофакторную линейную регрессионную модель связи признаков X и Y, используя инструмент Регрессия надстройки Пакет анализа.
5. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.
2. Рабочий файл с результативными таблицами и графиками
Исходные данные |
||
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
5 |
710,00 |
560,00 |
23 |
766,00 |
744,00 |
27 |
830,00 |
640,00 |
1 |
854,00 |
824,00 |
8 |
886,00 |
880,00 |
32 |
902,00 |
928,00 |
22 |
966,00 |
792,00 |
19 |
990,00 |
760,00 |
2 |
1006,00 |
904,00 |
3 |
1038,00 |
1008,00 |
13 |
1046,00 |
1072,00 |
26 |
1070,00 |
984,00 |
9 |
1086,00 |
1032,00 |
4 |
1094,00 |
1120,00 |
28 |
1118,00 |
1000,00 |
17 |
1126,00 |
1024,00 |
6 |
1150,00 |
960,00 |
14 |
1150,00 |
1168,00 |
25 |
1150,00 |
1040,00 |
7 |
1182,00 |
1296,00 |
30 |
1230,00 |
1040,00 |
18 |
1246,00 |
1216,00 |
10 |
1254,00 |
1288,00 |
20 |
1262,00 |
1040,00 |
24 |
1286,00 |
1192,00 |
29 |
1294,00 |
1096,00 |
15 |
1318,00 |
1416,00 |
11 |
1374,00 |
1360,00 |
21 |
1406,00 |
1400,00 |
16 |
1510,00 |
1520,00 |
таблица 2.2 |
||||
Зависимость выпуска продукции от среднегодовой стоимости основных фондов |
||||
|
|
|
|
|
номер группы |
группы предприятий по среднегодовой стоимости основных фондов, млн.руб. |
число предприятий |
выпуск продукции, млн.руб. |
|
всего |
в среднем на одно предприятие |
|||
1 |
710-870 |
4 |
2768,00 |
692,00 |
2 |
870-1030 |
5 |
4264,00 |
852,80 |
3 |
1030-1190 |
11 |
11704,00 |
1064,00 |
4 |
1190-1350 |
7 |
8288,00 |
1184,00 |
5 |
1350-1510 |
3 |
4280,00 |
1426,67 |
|
|
30 |
31304,00 |
|
|
|
|
Таблица 2.3 |
|
Показатели внутригрупповой вариации |
||
|
|
|
|
номер группы |
Группа предприятий по стоимости основных фондов, млн.руб. |
Число предприятий |
Внутригрупповые дисперсии признака Y |
1 |
710-870 |
4 |
10064,0000 |
2 |
870-1030 |
5 |
4264,9600 |
3 |
1030-1190 |
11 |
8680,7273 |
4 |
1190-1350 |
7 |
16420,5714 |
5 |
1350-1510 |
3 |
4622,2222 |
|
|
30 |
44052,4809 |
Таблица 2.4 |
|||
Показатели дисперсии и эмпирического корреляционного отношения |
|||
Общая дисперсия |
Дисперсия средняя из внутригрупповых |
факторная дисперсия |
Эмпирическое корреляционное отношение |
51505,8488889 |
9529,3155556 |
41976,5333333 |
0,9027656 |
таблица 2.5 |
|||
Линейный коэффициент корреляции признаков |
|||
|
Столбец 1 |
Столбец 2 |
|
Столбец 1 |
1 |
||
Столбец 2 |
0,91318826 |
1 |
ВЫХОДНЫЕ ТАБЛИЦЫ |
|||
ВЫВОД ИТОГОВ |
|||
Регрессионная статистика |
|||
Множественный R |
0,91318826 |
||
R-квадрат |
0,833912798 |
||
Нормированный R-квадрат |
0,827981112 |
||
Стандартная ошибка |
95,73659354 |
||
Наблюдения |
30 |
Дисперсионный анализ |
|||||||||
|
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
1 |
1288541,597 |
1288541,597 |
140,5861384 |
1,97601E-12 |
||||
Остаток |
28 |
256633,8696 |
9165,495343 |
||||||
Итого |
29 |
1545175,467 |
|
|
|
||||
ВЫВОД ОСТАТКА |
||
Наблюдение |
Предсказанное Y |
Остатки |
1 |
607,7245943 |
-47,72459429 |
2 |
668,7284844 |
75,27151558 |
3 |
738,447216 |
-98,447216 |
4 |
764,5917403 |
59,40825966 |
5 |
799,4511061 |
80,54889387 |
6 |
816,880789 |
111,119211 |
7 |
886,5995206 |
-94,59952061 |
8 |
912,744045 |
-152,744045 |
9 |
930,1737278 |
-26,17372785 |
10 |
965,0330936 |
42,96690636 |
11 |
973,7479351 |
98,25206491 |
12 |
999,8924594 |
-15,89245943 |
13 |
1017,322142 |
14,67785768 |
14 |
1026,036984 |
93,96301623 |
15 |
1052,181508 |
-52,18150811 |
16 |
1060,89635 |
-36,89634956 |
17 |
1087,040874 |
-127,0408739 |
18 |
1087,040874 |
80,9591261 |
19 |
1087,040874 |
-47,0408739 |
20 |
1121,90024 |
174,0997603 |
21 |
1174,189288 |
-134,1892884 |
22 |
1191,618971 |
24,38102872 |
23 |
1200,333813 |
87,66618728 |
24 |
1209,048654 |
-169,0486542 |
25 |
1235,193179 |
-43,19317851 |
26 |
1243,90802 |
-147,90802 |
27 |
1270,052544 |
145,9474557 |
28 |
1331,056434 |
28,94356556 |
29 |
1365,9158 |
34,08419977 |
30 |
1479,208739 |
40,79126095 |
3. Выводы по результатам выполнения лабораторной работы.
1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом.
На основе анализа диаграммы рассеяния из Лабораторной работы № 1, полученной после удаления аномальных значений, можно сделать вывод, что имеет (не имеет) место стохастическая связь. Предположительный вид связи: линейная (нелинейная) прямая (обратная).
б) методом сопоставления параллельных рядов.
Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются (уменьшаются) значения результативного признака, за исключением некоторых отклонений от общей тенденции, что позволяет сделать вывод о наличии стохастической связи.
2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.
Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что существует корреляционная связь между Среднегодовой стоимостью основных производственных фондов и Выпуском продукции.
3. Оценка тесноты связи признаков Х и Y:
а) на основе эмпирического корреляционного отношения.
Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой : .
Для вычисления η необходимо знать общую дисперсию и межгрупповую дисперсию результативного признака Y - Выпуск продукции.
Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.Величина η=0,90 является близкой к единице, что свидетельствует о тесной связи между факторным и результативным признаками.
б) на основе линейного коэффициента корреляции признаков.
В предположении, что связь между факторным и результативным признаками прямолинейная, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.
Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла. Значение коэффициента корреляции r=0,91 лежит в интервале 0,9-0,99, что в соответствии со шкалой Чэддока, говорит о весьма тесной связи между факторным и результативным признаками.
Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.
Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.
Теснота связи между факторным и результативным признаками весьма значительна.
4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.
Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.
5. Регрессионные модели связи
Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии и проверку его адекватности исследуемым фактическим данным.
В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла.
Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид прямой.
6. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.
Уравнения регрессии и их графики построены для 4-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.
Уравнения регрессии и соответствующие им коэффициенты детерминации R2 приведены в следующей таблице:
Вид уравнения |
Уравнение регрессии |
Коэффициент детерминации R2 |
Полином 2-го порядка |
y = 0,0002x2 + 0,6732x + 55,451 |
0,8353 |
Полином 3-го порядка |
y = 1E-06x3 - 0,0038x2 + 4,9925x - 1457,9 |
0,8381 |
Степенное |
y = 0,2829x1,1702 |
0,8371 |
Экспоненциальное |
y = 301,55e0,0011x |
0,8272 |
Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод: Максимальное значение коэффициента детерминации R2 =0,8381
Вид искомого уравнения регрессии – полином третьего порядка.
Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния 2.2 Рабочего файла.