ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

ФИЛИАЛ В Г. Владимире

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №2

Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel

Вариант № 10

                                              Выполнила: ст. III курса гр. БУ, анализ и аудит

Цыкина Валентина Сергеевна                                                                                                      

                                              Проверил: Новокупова  Ирина Николаевна

Владимир, 2008 г.

1. Постановка задачи

Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.

В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.

Таблица 2.1

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5

530,00

420,00

23

572,00

558,00

27

620,00

480,00

1

638,00

618,00

8

662,00

660,00

32

674,00

696,00

22

722,00

594,00

19

740,00

570,00

2

752,00

678,00

3

776,00

756,00

13

782,00

804,00

26

800,00

738,00

9

812,00

774,00

4

818,00

840,00

28

836,00

750,00

17

842,00

768,00

6

860,00

720,00

14

860,00

876,00

25

860,00

780,00

7

884,00

972,00

31

920,00

780,00

18

932,00

912,00

10

938,00

966,00

20

944,00

780,00

24

962,00

894,00

29

968,00

822,00

15

986,00

1062,00

12

1028,00

1020,00

21

1052,00

1050,00

16

1130,00

1140,00

В процессе статистического исследования необходимо решить ряд задач.

1.     Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y: а) графическим методом; б) методом сопоставления параллельных рядов.

2.     Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.

3.     Оценить тесноту связи признаков Х и Y на основе: а) эмпирического корреляционного отношения η; б) линейного коэффициента корреляции r.

Сравнить значения η и r и сделать вывод о возможности линейной связи между признаками Х и Y.

4.     Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.

Построить теоретическую линию регрессии.

Дать экономическую интерпретацию коэффициента регрессии.

Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.

5.     Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.

6.     Сделать заключение о возможности практического использования в качестве адекватной модели взаимосвязи признаков линейной модели , полученной с использованием инструмента Регрессия.

II. Рабочий файл с результативными таблицами и графиками.

Таблица 2.2

Зависимость выпуска продукции от среднегодовой стоимости основных фондов

Номер группы

Группы предприятий по стоимости основных фондов

Число предприятий

Выпуск продукции

Всего

В среднем  на одно  предприятие

1

530-650

4

2076,00

519,00

2

650-770

5

3198,00

639,60

3

770-890

11

8778,00

798,00

4

890-1010

7

6216,00

888,00

5

1010-1130

3

3210,00

1070,00

Итого

Х

30

23478,00

782,6

Таблица 2.3

Показатели внутригрупповой вариации

Номер группы

Группы предприятий по стоимости основных фондов

Число предприятий

Внутригрупповая дисперсия

1

530-650

4

5661,00

2

650-770

5

2399,04

3

770-890

11

4882,91

4

890-1010

7

9236,57

5

1010-1130

3

2600,00

Итого

х

30

24779,52

Таблица 2.4

Показатели дисперсии и эмпирического корреляционного отношения

Общая дисперсия

Средняя из внутригрупповых дисперсия

Межгрупповая дисперсия

Эмпирическое корреляционное отношение

28972,04

5360,24

23611,8

0,902765617

Таблица 2.5

Линейный коэффициент корреляции признаков

 

 

Столбец1

Столбец2

Столбец1

1

 

Столбец2

0,91318826

1

Рис.2.1

Графики для 4-х видов нелинейной зависимости между признаками

Рис.2.2

Вид искомого уравнения регрессии и его график

III. Выводы по результатам выполнения лабораторной работы.

Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом.

Вывод: На основе анализа диаграммы рассеяния из Лабораторной  работы №1, полученной после удаления аномальных значений, можно сделать вывод, что имеет место стохастическая связь. Предположительный вид связи: линейная прямая.

б) методом сопоставления параллельных рядов.

Вывод: Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются значения результативного признака, за исключением некоторых отклонений от общей тенденции, что позволяет сделать вывод о том, что связь есть  и она прямая.

Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.

Вывод:  Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что, что связь есть.

Задача 3.Оценка тесноты связи признаков Х и Y:

а) на основе эмпирического корреляционного отношения.

Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой

           .

Для вычисления η необходимо знать общую дисперсию  и межгрупповую дисперсию  результативного признака Y - Выпуск продукции.

Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.

Вывод:  Величина η=0,90 является близкой к единице, что свидетельствует о том, что связь тесная.

б) на основе линейного коэффициента корреляции признаков.

В предположении, что связь между факторным и результативным признаками прямолинейная, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.

Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.

Вывод: Значение коэффициента корреляции r=0,91 лежит в интервале от 0,9 до 0,95, что в соответствии со шкалой Чэддока, говорит о тесной связи между факторным и результативным признаками.

Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.

Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.

Вывод: ,это значит, что гипотезу о прямолинейной связи можно считать подтвержденной.

Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.

Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.

Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии  и проверку его адекватности исследуемым фактическим данным.

В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла.

Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид у =0,9471х-3Е-12

Доверительные интервалы коэффициентов уравнения регрессии представлены в нижеследующей таблице:

Коэффициенты

Границы доверительных интервалов

с надежностью Р=0,68

с надежностью Р=0,95

Нижняя

Верхняя

Нижняя

Верхняя

а0

н/д

н/д

н/д

н/д

а1

0,914463767

0,979727807

0,930850123

0,96334145

С увеличением надежности границы доверительных интервалов нижняя граница увеличивается, а верхняя, наоборот, - уменьшается.

Экономическая интерпретация коэффициента регрессии а1: параметр а1 > 0, значит, с возрастанием среднегодовой стоимости основных производственных фондов увеличивается выпуск продукции. Из уравнения следует, что возрастание на 1 млн. руб. среднегодовой стоимости основных производственных фондов приводит к увеличению выпуска продукции в среднем на 0,9471 млн. руб.

Коэффициент эластичности =0,9471830/782,6=1,00.

Экономическая интерпретация коэффициента эластичности Э: с возрастанием среднегодовой стоимости основных производственных фондов на 1 % выпуск продукции в среднем увеличивается на 1,00%

Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.

Уравнения регрессии и их графики построены для 4-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.

Уравнения регрессии и соответствующие им коэффициенты детерминации R2 приведены в следующей таблице:

Регрессионные модели связи[1]

Вид уравнения

Уравнение регрессии

Коэффициент

детерминации R2

Полином 2-го порядка

У=0,0003х2+0,6745х+43,273

0,8353

Полином 3-го порядка

У=2Е-0,6х3-0,0051х2+4,9671х-1081

0,8381

Степенное

У=0,3059х1,1664

0,8371

Экспоненциальное

У=226,99е0,0015х

0,8272

 

Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным

Вывод: Максимальное значение коэффициента детерминации R2 =0,8381.

Вид искомого уравнения регрессии – У=2Е-0,6х3-0,0051х2+4,9671х-1081. Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния 2.2 Рабочего файла.

Задача 6. Значения коэффициентов детерминации кубического (R2) и линейного уравнения (η2), найденного с помощью инструмента Регрессия надстройки Пакет анализа, расходятся очень незначительно (на величину -0,18). В теории статистики установлено, что если для показателей тесноты связи имеет место неравенство , то в качестве адекватного исходным данным уравнения регрессии может быть принято линейное уравнение.

Вывод: , значит, гипотеза о прямолинейной связи отклоняется. Соответственно связь криволинейная.


[1] Коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел.