ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №2

«Автоматизированный априорный анализ статистической совокупности

 в среде MS Excel»

Вариант № 14

Выполнил: ст. III курса гр.________________

Проверил:______________________________

      

Уфа 2007 г.

1. Постановка задачи

Корреляционно-регрессионный анализ (КР-анализ) взаи­мосвязи признаков является составной частью проводимого ста­тистического исследования двух экономических показателей ста­тистической совокупности 32 предприятий и частично использует результаты Лабораторной работы № 1.

В Лабораторной работе № 2 изучается взаимосвязь меж­ду факторным признаком Среднегодовая стоимость основных производственных фондов (признак X) и результативным призна­ком Выпуск продукции (признак У), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений (табл.1).

Таблица 1

Исходные данные

1

854,00

824,00

2

1006,00

904,00

3

1038,00

1008,00

4

1094,00

1120,00

5

710,00

560,00

6

1150,00

960,00

7

1182,00

1296,00

8

886,00

880,00

9

1086,00

1032,00

10

1254,00

1288,00

11

1374,00

1360,00

13

1046,00

1072,00

14

1150,00

1168,00

15

1318,00

1416,00

16

1510,00

1520,00

17

1126,00

1024,00

18

1246,00

1216,00

19

990,00

760,00

20

1262,00

1040,00

21

1406,00

1400,00

22

966,00

792,00

23

766,00

744,00

24

1286,00

1192,00

25

1150,00

1040,00

26

1070,00

984,00

27

830,00

640,00

28

1118,00

1000,00

29

1294,00

1096,00

30

1230,00

1040,00

32

902,00

928,00

В процессе статистического исследования необходимо ре­шить ряд задач.

1.Установить наличие статистической связи между фактор­ным признаком Х и результативным признаком Y:

а)графическим методом;

б)методом сопоставления параллельных рядов.

2.Установить наличие корреляционной связи между призна­ками Х и Y методом аналитической группировки.

3.Оценить тесноту связи признаков Х и Y на основе:

а)эмпирического корреляционного отношения ŋ;

б)линейного коэффициента корреляции r.

4.Построить однофакторную линейную регрессионную мо­дель связи признаков X и Y, используя инструмент Регрессия над­стройки Пакет анализа.

5. Найти наиболее адекватное нелинейное уравнение регрес­сии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.

2. Рабочий файл с результативными таблицами и графиками

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5

710,00

560,00

23

766,00

744,00

27

830,00

640,00

1

854,00

824,00

8

886,00

880,00

32

902,00

928,00

22

966,00

792,00

19

990,00

760,00

2

1006,00

904,00

3

1038,00

1008,00

13

1046,00

1072,00

26

1070,00

984,00

9

1086,00

1032,00

4

1094,00

1120,00

28

1118,00

1000,00

17

1126,00

1024,00

6

1150,00

960,00

14

1150,00

1168,00

25

1150,00

1040,00

7

1182,00

1296,00

30

1230,00

1040,00

18

1246,00

1216,00

10

1254,00

1288,00

20

1262,00

1040,00

24

1286,00

1192,00

29

1294,00

1096,00

15

1318,00

1416,00

11

1374,00

1360,00

21

1406,00

1400,00

16

1510,00

1520,00

таблица 2.2

Зависимость выпуска продукции от среднегодовой стоимости основных фондов

 

 

 

 

номер группы

группы предприятий по среднегодовой стоимости основных фондов, млн.руб.

число предприятий

выпуск продукции, млн.руб.

всего

в среднем на одно предприятие

1

710-870

4

2768,00

692,00

2

870-1030

5

4264,00

852,80

3

1030-1190

11

11704,00

1064,00

4

1190-1350

7

8288,00

1184,00

5

1350-1510

3

4280,00

1426,67

 

 

30

31304,00

 

 

 

 

Таблица 2.3

 

Показатели внутригрупповой вариации

 

 

 

 

номер группы

Группа предприятий по стоимости основных фондов, млн.руб.

Число предприятий

Внутригрупповые дисперсии признака Y

1

710-870

4

10064,0000

2

870-1030

5

4264,9600

3

1030-1190

11

8680,7273

4

1190-1350

7

16420,5714

5

1350-1510

3

4622,2222

 

 

30

44052,4809

Таблица 2.4

Показатели дисперсии и эмпирического корреляционного отношения

Общая дисперсия

Дисперсия средняя из внутригрупповых

факторная дисперсия

Эмпирическое корреляционное отношение

51505,8488889

9529,3155556

41976,5333333

0,9027656

таблица 2.5

Линейный коэффициент корреляции признаков

 

Столбец 1

Столбец 2

Столбец 1

1

Столбец 2

0,91318826

1

ВЫХОДНЫЕ ТАБЛИЦЫ

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,91318826

R-квадрат

0,833912798

Нормированный R-квадрат

0,827981112

Стандартная ошибка

95,73659354

Наблюдения

30

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

1288541,597

1288541,597

140,5861384

1,97601E-12

Остаток

28

256633,8696

9165,495343

Итого

29

1545175,467

 

 

 

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

1

607,7245943

-47,72459429

2

668,7284844

75,27151558

3

738,447216

-98,447216

4

764,5917403

59,40825966

5

799,4511061

80,54889387

6

816,880789

111,119211

7

886,5995206

-94,59952061

8

912,744045

-152,744045

9

930,1737278

-26,17372785

10

965,0330936

42,96690636

11

973,7479351

98,25206491

12

999,8924594

-15,89245943

13

1017,322142

14,67785768

14

1026,036984

93,96301623

15

1052,181508

-52,18150811

16

1060,89635

-36,89634956

17

1087,040874

-127,0408739

18

1087,040874

80,9591261

19

1087,040874

-47,0408739

20

1121,90024

174,0997603

21

1174,189288

-134,1892884

22

1191,618971

24,38102872

23

1200,333813

87,66618728

24

1209,048654

-169,0486542

25

1235,193179

-43,19317851

26

1243,90802

-147,90802

27

1270,052544

145,9474557

28

1331,056434

28,94356556

29

1365,9158

34,08419977

30

1479,208739

40,79126095

3. Выводы по результатам выполнения лабораторной работы.

1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:

     а) графическим методом.

     На основе анализа диаграммы рассеяния из Лабораторной  работы № 1, полученной после удаления аномальных значений, можно сделать вывод, что имеет (не имеет) место стохастическая связь. Предположительный вид связи: линейная (нелинейная) прямая (обратная).

     б) методом сопоставления параллельных рядов.

     Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются (уменьшаются) значения результативного признака, за исключением некоторых отклонений от общей тенденции, что позволяет сделать вывод о наличии стохастической связи.

2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.

     Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что существует корреляционная связь между Среднегодовой стоимостью основных производственных фондов и Выпуском продукции.

3. Оценка тесноты связи признаков Х и Y:

     а) на основе эмпирического корреляционного отношения.

     Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой :    .

     Для вычисления η необходимо знать общую дисперсию  и межгрупповую дисперсию  результативного признака Y - Выпуск продукции.

Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.Величина η=0,90 является близкой к единице, что свидетельствует о тесной связи между факторным и результативным признаками.

     б) на основе линейного коэффициента корреляции признаков.

В предположении, что связь между факторным и результативным признаками прямолинейная, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.

Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла. Значение коэффициента корреляции r=0,91 лежит в интервале 0,9-0,99, что в соответствии со шкалой Чэддока, говорит о весьма тесной связи между факторным и результативным признаками.

    Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.

    Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.

Теснота связи между факторным и результативным признаками весьма значительна.

4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа.

Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y.

5. Регрессионные модели связи

     Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии  и проверку его адекватности исследуемым фактическим данным.

     В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла.

     Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид прямой.

6. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.

    Уравнения регрессии и их графики построены для 4-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.

   Уравнения регрессии и соответствующие им коэффициенты детерминации R2 приведены в следующей таблице:

Вид уравнения

Уравнение регрессии

Коэффициент

детерминации R2

Полином 2-го порядка

y = 0,0002x2 + 0,6732x + 55,451

0,8353

Полином 3-го порядка

y = 1E-06x3 - 0,0038x2 + 4,9925x - 1457,9

0,8381

Степенное

y = 0,2829x1,1702

 0,8371

Экспоненциальное

y = 301,55e0,0011x

0,8272

     Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

Вывод: Максимальное значение коэффициента детерминации R2 =0,8381

Вид искомого уравнения регрессии – полином третьего порядка.

Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния 2.2 Рабочего файла.