ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №2

«Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных   в среде MS Excel»

Вариант № 21

Выполнила: студентка 3 курса

Шевела Ольга Олеговна

Специальность: Финансы и кредит

Группа: Финансовый менеджмент

( 2 высшее образование)

№ зачетной книжки: 06ффд60921

Преподаватель: Берлин Ю. И.

Архангельск, 2007

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В лабораторной работе изучается взаимосвязь между факторным признаком «среднегодовая стоимость  основных производственных фондов» (признак Х) и результативным признаком «выпуск продукции» (признак У), значениями которых являются исходные данные Лабораторной работы №1 после исключения из них аномальных значений.

В процессе статистического исследования необходимо решить ряд задач:

1. Установить наличие статистической связи между факторным признаком Х и результативным признаком Y:

а) графическим методом;

б) методом сопоставления параллельных рядов.

2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.

3. Оценить тесноту связи признаков Х и Y на основе:

а) эмпирического корреляционного отношения η;

б) линейного коэффициента корреляции r.

4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа.

5. Оценить адекватность и практическую пригодность построенной линейной регрессионной модели, указав:

а) доверительные интервалы коэффициентов ;

б) степень тесноты связи признаков Х и Y;

в) погрешность регрессионной модели.

6. Дать экономическую интерпретацию:

а) коэффициента регрессии ;

б) коэффициента эластичности ;

в) остаточных величин .

7. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм. Построить для этого уравнения теоретическую кривую регрессии.

РЕШЕНИЕ

Задание 1

а) графический метод:

Рис. 1. Поле корреляции

       По характеру расположения точек корреляционного поля можно сделать вывод о наличии линейной прямой связи между признаками «среднегодовая стоимость  основных производственных фондов» (признак Х) и «выпуск продукции» (признак У).

б) метод сопоставления параллельных рядов.

 Ранжируем единицы совокупности по возрастанию факторного признака («Среднегодовая стоимость ОПФ»).

Таблица 1 - Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5

1025,00

805,00

23

1105,50

1069,50

27

1197,50

920,00

1

1232,00

1184,50

8

1278,00

1265,00

32

1301,00

1334,00

22

1393,00

1138,50

19

1427,50

1092,50

2

1450,50

1299,50

3

1496,50

1449,00

13

1508,00

1541,00

26

1542,50

1414,50

9

1565,50

1483,50

4

1577,00

1610,00

28

1611,50

1437,50

17

1623,00

1472,00

6

1657,50

1380,00

14

1657,50

1679,00

25

1657,50

1495,00

7

1703,50

1863,00

30

1772,50

1495,00

18

1795,50

1748,00

10

1807,00

1851,50

20

1818,50

1495,00

24

1853,00

1713,50

29

1864,50

1575,50

15

1899,00

2035,50

11

1979,50

1955,00

21

2025,50

2012,50

16

2175,00

2185,00

       С возрастанием значений признака «среднегодовая стоимость ОПФ» значения признака «выпуск продукции» в целом возрастают, между признаками Х и У возможно наличие прямой корреляционной связи.

Задание 2

       Сформируем группировку единиц совокупности по факторному признаку «среднегодовая стоимость ОПФ».

Таблица 2 - Зависимость выпуска продукции от среднегодовой стоимости основных фондов

Номер группы

Группы предприятий по среднегодовой стоимости основных фондов, млн. руб.

Число предприятий, ед.

Выпуск продукции, млн. руб.

Всего

В среднем на одно предприятие

1

1025-1255

4

3979,00

994,75

2

1255-1485

5

6129,50

1225,90

3

1485-1715

11

16824,50

1529,50

4

1715-1945

7

11914,00

1702,00

5

1945-2175

3

6152,50

2050,83

ИТОГО

30

44999,5

1499,98

       При переходе от одной группе к другой средние значения результативного признака «выпуск продукции» возрастают, следовательно, между признаками Х и У корреляционная связь.

Задание 3

       а) Для анализа тесноты связи между факторным и результативным признаками рассчитаем показатель η – эмпирическое корреляционное отношение: .

: общая дисперсия характеризует всю вариацию выпуска продукции, которая возникает из стоимости ОПФ и других неучтенных при построении признаков. Рассчитывается по правилу сложения дисперсий: .

: средняя из внутригрупповых дисперсий характеризует вариацию выпуска продукции, которая возникает под воздействием всех других признаков, кроме стоимости ОПФ.

: межгрупповая дисперсия характеризует вариацию выпуска продукции, которая возникает под влиянием стоимости ОФ.

Эмпирический коэффициент детерминации: η² = 0,815 или 81,5%. 81,5% вариации выпуска продукции вызывает среднегодовая стоимость ОПФ, а остальные 18,5% вариации признака вызывают другие неучтенные факторы.

Эмпирическое корреляционное отношение: η = 0,903, показывает, что связь между выпуском продукции и стоимостью ОПФ тесная.

Таблица 3 – Расчет внутригрупповых дисперсий

Номер группы

Группы предприятий по среднегодовой стоимости основных фондов, млн. руб.

Число предприятий, ед.

Внутригрупповая дисперсия выпуска продукции

1

1025-1255

4

20796,313

2

1255-1485

5

8813,14

3

1485-1715

11

17937,909

4

1715-1945

7

33931,571

5

1945-2175

3

9551,389

ИТОГО

 

30

590743,1167

Таблица 4 - Дисперсии и эмпирические показатели тесноты взаимосвязи

Общая дисперсия

Средняя из внутригрупповых дисперсий

Межгрупповая дисперсия

Эмпирический коэффициент детерминации

Эмпиричское корреляционное отношение

106432,008

19691,437

86740,571

0,815

0,903

б) линейный коэффициент корреляции (или множественный R) равный 0,913 говорит о том, что связь между признаками есть, линейная и тесная.

Коэффициент детерминации (R²) равен 0,8339.

Нормированный R-квадрат –скорректированный коэффициент детерминации  ( более точный).

Стандартная ошибка показывает на сколько единиц в среднем расчетные значения отличается от фактических.

Цифра наблюдений говорит о том, что мы рассматривали 30 предприятий.

Таблица 5 - Линейный коэффициент корреляции признаков

 

Столбец 1

Столбец 2

Столбец 1

1

Столбец 2

0,91318826

1

Таблица 6 - Регрессионная статистика

Множественный R

0,91318826

R-квадрат

0,833912798

Нормированный R-квадрат

0,827981112

Стандартная ошибка

137,6213532

Наблюдения

30

Задание 4

Таблица 7 – Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

2662650,41

2662650,41

140,5861384

1,97601E-12

Остаток

28

530309,8321

18939,63686

Итого

29

3192960,242

 

 

 

 

Коэф-

фици-

енты

Стан-дарт-

ная ошибка

t-статис-

тика

P-Значение

Нижние 95%

Верхние 95%

Нижние 68,3%

Верхние 68,3%

Y-

Пересе-чение

-242,99

149,132

-1,629

0,114

-548,469

62,499

-394,927

-91,042

Средне-

годовая стоимость ОПФ, млн.руб.

1,089

0,092

11,857

1,97601E-12

0,901

1,277

0,996

1,183

df- число степеней свободы, соответствует количеству факторов в модели;

SS-сумма квадратов отклонений;

MS-дисперсия факторная и остаточная;

F – расчетный критерий Фишера, равен 140,58614. Данное значение сравнивают с табличным (), следовательно, уравнение значимо с вероятностью 0,683.

Значимость F – так как данный показатель меньше уровня значимости (0,317), то уравнение регрессии значимо с вероятностью 0,683, т. е. зависимость между признаками Х и Y регрессионной модели является статистически значимой, построенная регрессионная модель в целом адекватна исследуемому признаку.

У – пересечение: свободный член регрессии (а0), равен -242,99.

Коэффициент регрессии (а1) равен 1,089.

Стандартная ошибка – указаны значения средних квадратических отклонений для a0 u a1.

Sа0=109,992 иSа1=0,092

t-статистика –содержит расчетные значения критерия Стьюдента для проверки значимости параметров уравнения регрессии

ta0 = -1,629, ta1 = 11,857, t(0,317;28) = 1,019.

Ta1 > t(табл), следовательно, коэффициент регрессии  а1 – значим.

Р-значение (вероятность): 0,114 < 0,317, следовательно, коэффициент регрессии является значимыми, не равен нулю.

Линейное уравнение регрессии: Y= -242,99 + 1,089·Х

Задание 5

а) Интервальная оценка параметров:

С вероятностью 0,95 можно гарантировать, что а0 находится в пределах от     -548,469 до  62,499 и с  вероятностью 0,683 – а0 находится в пределах от        -394,927 до -91,042.

С вероятностью 0,95 можно гарантировать, что а1 находится в пределах от 0,901 до  1,277 и с   вероятностью 0,683 –  а1 находится в пределах от 0,996 до 1,183.

б) Коэффициент детерминации (R²) равен 0,8339 означает высокую степень тесноты связи признаков в уравнении регрессии: 83,4% вариации признака «выпуск продукции» происходит за счет фактора «среднегодовая стоимость ОПФ», включенного в модель, а остальные 16,6%  вариаций –  под влиянием факторов неучтенных в модели.

в) Погрешность регрессионной модели равна %, следовательно, погрешность не большая, тогда уравнение адекватное.

Задание 6

а) Коэффициент регрессии (а1) равен 1,089: связь между результативным признаком и факторным – прямая, если факторный (Среднегодовая стоимость ОПФ) признак увеличиться на 1 млн. руб., результативный признак (выпуск продукции) в среднем увеличиться на 1,089 млн. руб. Коэффициент эластичности: , . При изменении факторного признака на 1% результативный признак в среднем изменяется на 1,16%.

в)  Согласно уравнению регрессии Y = 1,089·Х-242,99 предсказанный выпуск продукции будет следующим:

Таблица 8 – Вывод остатков

Наблюдение

Среднегодовая стоимость основных производственных фондов, млн.руб.

Предсказанный

выпуск продукции, млн. руб.

Остатки

1

1025,00

873,6041043

-68,60410429

2

1105,50

961,2971964

108,2028036

3

1197,50

1061,517873

-141,517873

4

1232,00

1099,100627

85,39937326

5

1278,00

1149,210965

115,7890349

6

1301,00

1174,266134

159,7338658

7

1393,00

1274,486811

-135,9868109

8

1427,50

1312,069565

-219,5695646

9

1450,50

1337,124734

-37,62473378

10

1496,50

1387,235072

61,7649279

11

1508,00

1399,762657

141,2373433

12

1542,50

1437,34541

-22,84541043

13

1565,50

1462,40058

21,09942041

14

1577,00

1474,928164

135,0718358

15

1611,50

1512,510918

-75,01091791

16

1623,00

1525,038502

-53,0385025

17

1657,50

1562,621256

-182,6212562

18

1657,50

1562,621256

116,3787438

19

1657,50

1562,621256

-67,62125624

20 (№7)

1703,50

1612,731595

250,2684054

21

1772,50

1687,897102

-192,897102

22

1795,50

1712,952271

35,04772879

Таблица 8 (продолжение)

23

1807,00

1725,479856

126,0201442

24 (№20)

1818,50

1738,00744

-243,0074404

25

1853,00

1775,590194

-62,09019411

26

1864,50

1788,117779

-212,6177787

27

1899,00

1825,700532

209,7994676

28

1979,50

1913,393625

41,6063755

29

2025,50

1963,503963

48,99603717

30

2175,00

2126,362562

58,63743762

Остатки: , характеризуют отклонения i-х наблюдений от расчетных значений . На предприятии №7 значение остатка максимально (250,27 млн. руб.), следовательно на данном предприятии ОПФ используются эффективнее; предприятие №20 недоиспользует ОПФ (значение остатка минимально: -243,01 млн. руб.)

Задание 7

Рис.2. Уравнение регрессии (полином 2-го порядка) и его график

Рис. 3. Уравнение регрессии (полином 3-го порядка) и его график

Рис. 4. Уравнение регрессии (степенная функция) и его график

Рис. 5. Уравнения регрессии (экспонента) и его график

Максимальное значение коэффициента детерминации R² определяет вид наиболее адекватного уравнения регрессии. Таким образом, наиболее адекватная модель регрессии – полином 3-го порядка (Рис. 3).