ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
ФИЛИАЛ В Г. Владимире
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №2
Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel
Вариант № 10
Выполнила: ст. III курса гр. БУ, анализ и аудит
Цыкина Валентина Сергеевна
Проверил: Новокупова Ирина Николаевна
Владимир,
1. Постановка задачи
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.
В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.
Таблица 2.1 |
||
Исходные данные |
||
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
5 |
530,00 |
420,00 |
23 |
572,00 |
558,00 |
27 |
620,00 |
480,00 |
1 |
638,00 |
618,00 |
8 |
662,00 |
660,00 |
32 |
674,00 |
696,00 |
22 |
722,00 |
594,00 |
19 |
740,00 |
570,00 |
2 |
752,00 |
678,00 |
3 |
776,00 |
756,00 |
13 |
782,00 |
804,00 |
26 |
800,00 |
738,00 |
9 |
812,00 |
774,00 |
4 |
818,00 |
840,00 |
28 |
836,00 |
750,00 |
17 |
842,00 |
768,00 |
6 |
860,00 |
720,00 |
14 |
860,00 |
876,00 |
25 |
860,00 |
780,00 |
7 |
884,00 |
972,00 |
31 |
920,00 |
780,00 |
18 |
932,00 |
912,00 |
10 |
938,00 |
966,00 |
20 |
944,00 |
780,00 |
24 |
962,00 |
894,00 |
29 |
968,00 |
822,00 |
15 |
986,00 |
1062,00 |
12 |
1028,00 |
1020,00 |
21 |
1052,00 |
1050,00 |
16 |
1130,00 |
1140,00 |
В процессе статистического исследования необходимо решить ряд задач.
1. Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y: а) графическим методом; б) методом сопоставления параллельных рядов.
2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
3. Оценить тесноту связи признаков Х и Y на основе: а) эмпирического корреляционного отношения η; б) линейного коэффициента корреляции r.
Сравнить значения η и r и сделать вывод о возможности линейной связи между признаками Х и Y.
4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.
Построить теоретическую линию регрессии.
Дать экономическую интерпретацию коэффициента регрессии.
Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.
5. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.
6. Сделать заключение о возможности практического использования в качестве адекватной модели взаимосвязи признаков линейной модели , полученной с использованием инструмента Регрессия.
II. Рабочий файл с результативными таблицами и графиками.
Таблица 2.2 |
||||
Зависимость выпуска продукции от среднегодовой стоимости основных фондов |
||||
Номер группы |
Группы предприятий по стоимости основных фондов |
Число предприятий |
Выпуск продукции |
|
Всего |
В среднем на одно предприятие |
|||
1 |
530-650 |
4 |
2076,00 |
519,00 |
2 |
650-770 |
5 |
3198,00 |
639,60 |
3 |
770-890 |
11 |
8778,00 |
798,00 |
4 |
890-1010 |
7 |
6216,00 |
888,00 |
5 |
1010-1130 |
3 |
3210,00 |
1070,00 |
Итого |
Х |
30 |
23478,00 |
782,6 |
Таблица 2.3 |
||||
Показатели внутригрупповой вариации |
||||
Номер группы |
Группы предприятий по стоимости основных фондов |
Число предприятий |
Внутригрупповая дисперсия |
|
1 |
530-650 |
4 |
5661,00 |
|
2 |
650-770 |
5 |
2399,04 |
|
3 |
770-890 |
11 |
4882,91 |
|
4 |
890-1010 |
7 |
9236,57 |
|
5 |
1010-1130 |
3 |
2600,00 |
|
Итого |
х |
30 |
24779,52 |
|
Таблица 2.4 |
||||
Показатели дисперсии и эмпирического корреляционного отношения |
||||
Общая дисперсия |
Средняя из внутригрупповых дисперсия |
Межгрупповая дисперсия |
Эмпирическое корреляционное отношение |
|
28972,04 |
5360,24 |
23611,8 |
0,902765617 |
|
Таблица 2.5 |
||||
Линейный коэффициент корреляции признаков |
|
|||
|
Столбец1 |
Столбец2 |
||
Столбец1 |
1 |
|
||
Столбец2 |
0,91318826 |
1 |
||
Рис.2.1
Графики для 4-х видов нелинейной зависимости между признаками
Рис.2.2
Вид искомого уравнения регрессии и его график
III. Выводы по результатам выполнения лабораторной работы.
Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом.
Вывод: На основе анализа диаграммы рассеяния из Лабораторной работы №1, полученной после удаления аномальных значений, можно сделать вывод, что имеет место стохастическая связь. Предположительный вид связи: линейная прямая.
б) методом сопоставления параллельных рядов.
Вывод: Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются значения результативного признака, за исключением некоторых отклонений от общей тенденции, что позволяет сделать вывод о том, что связь есть и она прямая.
Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.
Вывод: Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что, что связь есть.
Задача 3.Оценка тесноты связи признаков Х и Y:
а) на основе эмпирического корреляционного отношения.
Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой
.
Для вычисления η необходимо знать общую дисперсию и межгрупповую дисперсию результативного признака Y - Выпуск продукции.
Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.
Вывод: Величина η=0,90 является близкой к единице, что свидетельствует о том, что связь тесная.
б) на основе линейного коэффициента корреляции признаков.
В предположении, что связь между факторным и результативным признаками прямолинейная, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.
Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.
Вывод: Значение коэффициента корреляции r=0,91 лежит в интервале от 0,9 до 0,95, что в соответствии со шкалой Чэддока, говорит о тесной связи между факторным и результативным признаками.
Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.
Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.
Вывод: ,это значит, что гипотезу о прямолинейной связи можно считать подтвержденной.
Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.
Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.
Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии и проверку его адекватности исследуемым фактическим данным.
В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла.
Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид у =0,9471х-3Е-12
Доверительные интервалы коэффициентов уравнения регрессии представлены в нижеследующей таблице:
Коэффициенты |
Границы доверительных интервалов |
|||
с надежностью Р=0,68 |
с надежностью Р=0,95 |
|||
Нижняя |
Верхняя |
Нижняя |
Верхняя |
|
а0 |
н/д |
н/д |
н/д |
н/д |
а1 |
0,914463767 |
0,979727807 |
0,930850123 |
0,96334145 |
С увеличением надежности границы доверительных интервалов нижняя граница увеличивается, а верхняя, наоборот, - уменьшается.
Экономическая интерпретация коэффициента регрессии а1: параметр а1 > 0, значит, с возрастанием среднегодовой стоимости основных производственных фондов увеличивается выпуск продукции. Из уравнения следует, что возрастание на 1 млн. руб. среднегодовой стоимости основных производственных фондов приводит к увеличению выпуска продукции в среднем на 0,9471 млн. руб.
Коэффициент эластичности =0,9471830/782,6=1,00.
Экономическая интерпретация коэффициента эластичности Э: с возрастанием среднегодовой стоимости основных производственных фондов на 1 % выпуск продукции в среднем увеличивается на 1,00%
Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.
Уравнения регрессии и их графики построены для 4-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.
Уравнения регрессии и соответствующие им коэффициенты детерминации R2 приведены в следующей таблице:
Регрессионные модели связи[1]
Вид уравнения |
Уравнение регрессии |
Коэффициент детерминации R2 |
Полином 2-го порядка |
У=0,0003х2+0,6745х+43,273 |
0,8353 |
Полином 3-го порядка |
У=2Е-0,6х3-0,0051х2+4,9671х-1081 |
0,8381 |
Степенное |
У=0,3059х1,1664 |
0,8371 |
Экспоненциальное |
У=226,99е0,0015х |
0,8272 |
Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным
Вывод: Максимальное значение коэффициента детерминации R2 =0,8381.
Вид искомого уравнения регрессии – У=2Е-0,6х3-0,0051х2+4,9671х-1081. Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния 2.2 Рабочего файла.
Задача 6. Значения коэффициентов детерминации кубического (R2) и линейного уравнения (η2), найденного с помощью инструмента Регрессия надстройки Пакет анализа, расходятся очень незначительно (на величину -0,18). В теории статистики установлено, что если для показателей тесноты связи имеет место неравенство , то в качестве адекватного исходным данным уравнения регрессии может быть принято линейное уравнение.
Вывод: , значит, гипотеза о прямолинейной связи отклоняется. Соответственно связь криволинейная.
[1] Коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел.