ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ


КАФЕДРА СТАТИСТИКИ




О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №2


Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel


Вариант № 15









Выполнил: ст. III курса гр. 05МЭБ03957 Э.Т.

Портнова А.А.      

          Ф.И.О.

Проверил:  Циндин Н.С.

     Ф.И.О.







Пенза, 2008 г.



1. Постановка задачи

Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.


В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.


                     




           









        В процессе статистического исследования необходимо решить ряд задач.

1.     Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y: а) графическим методом; б) методом сопоставления параллельных рядов.

2.     Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.

3.     Оценить тесноту связи признаков Х и Y на основе: а) эмпирического корреляционного отношения η; б) линейного коэффициента корреляции r.

Сравнить значения η и r и сделать вывод о возможности линейной связи между признаками Х и Y.

4.     Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.

Построить теоретическую кривую регрессии.

Дать экономическую интерпретацию коэффициента регрессии.

Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.

5.     Найти наиболее адекватное уравнение регрессии с помощью средств инструмента Мастер диаграмм.


II. Рабочий файл с результативными таблицами и графиками.

                                     



  
















                                                 

 

 

 

 

 

 

 

 






 

 

 



III. Выводы по результатам выполнения лабораторной работы.

Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом.

Вывод: На основе анализа диаграммы рассеяния из Лабораторной  работы №1, полученной после удаления аномальных значений, можно сделать вывод, что имеет место стохастическая связь. Предположительный вид связи: линейная прямая.

б) методом сопоставления параллельных рядов.

Вывод:  Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются значения результативного признака, за исключением некоторых отклонений, что позволяет сделать вывод о наличии прямой зависимости между показателями.

Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.

Вывод:  Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что, что с ростом стоимости основных фондов растёт и выпуск продукции, что свидетельствует о наличии прямой зависимости между показателями.

Задача 3.Оценка тесноты связи признаков Х и Y:

а) на основе эмпирического корреляционного отношения

Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой

          

Для вычисления η необходимо знать общую дисперсию  и межгрупповую дисперсию  результативного признака Y - Выпуск продукции.

Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.

Вывод:  Величина η=0,9028 является  близкой к единице, что свидетельствует о тесной зависимости между стоимостью фондов и выпуском продукции



б) на основе линейного коэффициента корреляции признаков


В предположении, что связь между факторным и результативным признаком имеется, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.

Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.

Вывод: Значение коэффициента корреляции r=0,913 лежит в интервале (0,9;0,99), что в соответствии со шкалой Чэддока, говорит о весьма высокой тесноте связи между показателями.

Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.

Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.

Вывод: Между стоимостью основных фондов и выпуском продукции существует очень тесная (практически прямолинейная) прямая зависимость.

Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.

Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.

Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии  и проверка его адекватности исследуемым фактическим данным.

В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла.

Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид

Yx= -176,75+1,089Х

Доверительные интервал коэффициентов уравнения регрессии представим в нижеследующей таблице

Коэффициенты

Границы доверительных интервалов

С надежностью Р=0,68

С надежностью Р=0,95

Нижние

Верхние

Нижние

Верхние

а0

288,82

64,69

402,06

48,55

а1

1,00

1,18

0,90

1,27


С увеличением надежности границы доверительных интервалов расширяются.

Экономическая интерпретация коэффициента регрессии а1: при росте стоимости основных фондов на 1 млн.руб. выпуск продукции увеличивается в среднем на 1,089 млн.руб..

Коэффициент эластичности =1,16

Экономическая интерпретация коэффициента эластичности Э: при увеличении стоимости основных фондов на 1% от среднего значения выпуск продукции увеличивается на 1,16% от своего среднего значения.


Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.

Возможности инструмента Мастер диаграмм позволяют быстро производить построение и анализ адекватности регрессионных моделей, базирующихся на использовании различных видов зависимости между признаками X и Y.

Построение моделей осуществляется непосредственно на диаграмме рассеяния.

На диаграмме рассеяния отображается линия и уравнение регрессии, а также коэффициент детерминации R2.

В лабораторной работе уравнения регрессии и их графики были построены для 5-ти видов зависимости между признаками и даны на диаграмме  Рабочего файла.

Уравнения регрессии и соответствующие им коэффициент детерминации R2 даны в следующей таблице:

Регрессионные модели связи[1]

Вид уравнения

Уравнение регрессии

Коэффициент

детерминации R2

Линейное

У=1,0894Х-176,76

0,8339

Полином 2-го порядка

У=0,0002Х2+0,673Х+58,496

0,8353

Полином 3-го порядка

У=1Е-0,6Х^3-0,0036Х^2+4,997Х-1552,2

0,8381

Степенное

У=0,2785Х^1,1709

0,8371

Экспоненциальное

У=320,19е^0,001

0,8272

 

Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным

Вывод: Максимальное значение коэффициента детерминации R2 =0,8381

Вид искомого уравнения регрессии – У=1Е-0,6Х^3-0,0036Х^2+4,997Х-1552,2

Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния .

                            





Вместе с тем, так как значения коэффициентов R2 кубического и линейного уравнения расходятся очень незначительно (на величину 0,0028), а для показателей тесноты связи имеет место неравенство , то в качестве адекватного уравнения регрессии может быть принято линейное уравнение, совпадающее с найденным с помощью инструмента Регрессия надстройки Пакет анализа.