ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1

«Автоматизированный априорный анализ статистической совокупности в среде MS Excel»

Вариант № 20

                             Выполнил:                                                                                             

     

Проверил: ________________________

Должность        

                                                                                                                              

  _________________________________________

                                                                                                              Ф.И.О.

Москва

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

 

 

Таблица 1

 

Исходные данные

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

1

1178,00

1133,00

2

1387,00

1243,00

3

1431,00

1386,00

4

1508,00

1540,00

5

980,00

770,00

6

1585,00

1320,00

7

1629,00

1782,00

8

1222,00

1210,00

9

1497,00

1419,00

10

1728,00

1771,00

11

650,00

1650,00

12

1893,00

1870,00

13

1442,00

1474,00

14

1585,00

1606,00

15

1816,00

1947,00

16

2080,00

2090,00

17

1552,00

1408,00

18

1717,00

1672,00

19

1365,00

1045,00

20

1739,00

1430,00

21

1937,00

1925,00

22

1332,00

1089,00

23

1057,00

1023,00

24

1772,00

1639,00

25

1585,00

1430,00

26

1475,00

1353,00

27

1145,00

880,00

28

1541,00

1375,00

29

1783,00

1507,00

30

2080,00

550,00

31

1695,00

1430,00

32

1244,00

1276,00

        

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ  выборочной совокупности

1.    Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

2.    Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию (), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (), структурный коэффициент асимметрии  К.Пирсона (Asп).

3.    На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

4.    Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5.     Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду (Мо) полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

Статистический анализ  генеральной совокупности

1.    Рассчитать генеральную дисперсию (), генеральное среднее квадратическое отклонение () и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

2.    Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

3.    Рассчитать коэффициенты асимметрии (As) и эксцесса (Ek). На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

 

 

 

 

           

Для решения ряда статистических задач для выборочной и генеральной совокупностей в процессе исследования совокупности оформим рабочий файл.

Номер варианта

20

 

 

Таблица 1

 

Исходные данные

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

1

1178,00

1133,00

2

1387,00

1243,00

3

1431,00

1386,00

4

1508,00

1540,00

5

980,00

770,00

6

1585,00

1320,00

7

1629,00

1782,00

8

1222,00

1210,00

9

1497,00

1419,00

10

1728,00

1771,00

11

650,00

1650,00

12

1893,00

1870,00

13

1442,00

1474,00

14

1585,00

1606,00

15

1816,00

1947,00

16

2080,00

2090,00

17

1552,00

1408,00

18

1717,00

1672,00

19

1365,00

1045,00

20

1739,00

1430,00

21

1937,00

1925,00

22

1332,00

1089,00

23

1057,00

1023,00

24

1772,00

1639,00

25

1585,00

1430,00

26

1475,00

1353,00

27

1145,00

880,00

28

1541,00

1375,00

29

1783,00

1507,00

30

2080,00

550,00

31

1695,00

1430,00

32

1244,00

1276,00

 

 

 

Рисунок 1

Точечная диаграмма  рассеяния признаков изучаемой совокупности

               

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции,

млн. руб.

11

650,00

1650,00

30

2080,00

550,00

Рисунок 2

Точечная диаграмма  рассеяния признаков изучаемой совокупности

 

 

Таблица 1А

 

Исходные данные

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

1

1178,00

1133,00

2

1387,00

1243,00

3

1431,00

1386,00

4

1508,00

1540,00

5

980,00

770,00

6

1585,00

1320,00

7

1629,00

1782,00

8

1222,00

1210,00

9

1497,00

1419,00

10

1728,00

1771,00

12

1893,00

1870,00

13

1442,00

1474,00

14

1585,00

1606,00

15

1816,00

1947,00

16

2080,00

2090,00

17

1552,00

1408,00

18

1717,00

1672,00

19

1365,00

1045,00

20

1739,00

1430,00

21

1937,00

1925,00

22

1332,00

1089,00

23

1057,00

1023,00

24

1772,00

1639,00

25

1585,00

1430,00

26

1475,00

1353,00

27

1145,00

880,00

28

1541,00

1375,00

29

1783,00

1507,00

31

1695,00

1430,00

32

1244,00

1276,00

 

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Среднее

1530

Среднее

1434,766667

Стандартная

ошибка

48,57611636

Стандартная ошибка

57,9471357

Медиана

1546,5

Медиана

1424,5

Мода

1585

Мода

1430

Стандартное отклонение

266,0623469

Стандартное отклонение

317,3895337

Дисперсия выборки

70789,17241

Дисперсия выборки

100736,1161

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

1100

Интервал

1320

Минимум

980

Минимум

770

Максимум

2080

Максимум

2090

Сумма

45900

Сумма

43043

Счет

30

Счет

30

Уровень надежности(95,4%)

101,2720687

Уровень надежности(95,4%)

120,808882

 

 

Таблица 4а

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Уровень надежности(68,3%)

49,46046722

Уровень надежности(68,3%)

59,00209035

 

Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Уровень надежности(99,7%)

157,3575611

Уровень надежности(99,7%)

187,7140585

 

Таблица 5

Выборочные показатели вариации и асимметрии

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Стандартное отклонение

261,5903923

Стандартное отклонение

312,0548759

Дисперсия

68429,53333

Дисперсия

97378,24556

Среднее линейное

отклонение

210,4666667

Среднее линейное отклонение

240,3866667

Коэффициент вариации, %

17,09741126

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

Asп

-0,21025237

Коэффициент асимметрии Asп

0,015275091

Таблица 6

Карман

Частота

1

1200

3

1420

5

1640

11

1860

7

2080

3

 

Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группа предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы, %

980-1200

4

13,33%

1200-1420

5

30,00%

1420-1640

11

66,67%

1640-1860

7

90,00%

1860-2080

3

100,00%

Итого

30

Рисунок 3

Гистограмма распределения предприятий по стоимости основных производственных фондов

    

Статистический анализ  выборочной совокупности

          1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

          В результате визуального анализа диаграммы рассеяния признаков единиц изучаемой совокупности (рисунок 1 «Рабочего файла») выявлены следующие аномальные единицы наблюдения, представленные в таблице 2 «Рабочего файла»:

Рисунок 1

Точечная диаграмма  рассеяния признаков изучаемой совокупности

                

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

11

650,00

1650,00

30

2080,00

550,00

        

Приведенные в таблице 2 аномальные единицы наблюдения удалены из изучаемой совокупности. Корреляционное поле имеет вид:

Рисунок 2

Точечная диаграмма  рассеяния признаков изучаемой совокупности

          После исключения аномальных единиц наблюдения из изучаемой совокупности исходные данные принимают вид, представленный в таблице 1А «Рабочего файла»:

 

 

Таблица 1А

 

Исходные данные

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

1

1178,00

1133,00

2

1387,00

1243,00

3

1431,00

1386,00

4

1508,00

1540,00

5

980,00

770,00

6

1585,00

1320,00

7

1629,00

1782,00

8

1222,00

1210,00

9

1497,00

1419,00

10

1728,00

1771,00

12

1893,00

1870,00

13

1442,00

1474,00

14

1585,00

1606,00

15

1816,00

1947,00

16

2080,00

2090,00

17

1552,00

1408,00

18

1717,00

1672,00

19

1365,00

1045,00

20

1739,00

1430,00

21

1937,00

1925,00

22

1332,00

1089,00

23

1057,00

1023,00

24

1772,00

1639,00

25

1585,00

1430,00

26

1475,00

1353,00

27

1145,00

880,00

28

1541,00

1375,00

29

1783,00

1507,00

31

1695,00

1430,00

32

1244,00

1276,00

         

          2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию (), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (), структурный коэффициент асимметрии  К.Пирсона (Asп).

          Обобщающие статистические показатели совокупности по изучаемым признакам в результате расчетов представлены в таблице 3 и в таблице 5 «Рабочего файла»:

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Среднее

1530

Среднее

1434,766667

Стандартная

ошибка

48,57611636

Стандартная ошибка

57,9471357

Медиана

1546,5

Медиана

1424,5

Мода

1585

Мода

1430

Стандартное отклонение

266,0623469

Стандартное отклонение

317,3895337

Дисперсия выборки

70789,17241

Дисперсия выборки

100736,1161

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

1100

Интервал

1320

Минимум

980

Минимум

770

Максимум

2080

Максимум

2090

Сумма

45900

Сумма

43043

Счет

30

Счет

30

Уровень надежности(95,4%)

101,2720687

Уровень надежности(95,4%)

120,808882

Таблица 5

Выборочные показатели вариации и асимметрии

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Стандартное отклонение

261,5903923

Стандартное отклонение

312,0548759

Дисперсия

68429,53333

Дисперсия

97378,24556

Среднее линейное

отклонение

210,4666667

Среднее линейное отклонение

240,3866667

Коэффициент вариации, %

17,09741126

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии Asп

-0,21025237

Коэффициент асимметрии Asп

0,015275091

           

            На основе этих таблиц сформируем единую таблицу значений выборочных показателей (таблица 8):

Таблица 8

Описательные статистики выборочной совокупности

Наименование показателя

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Среднее

1530

1434,766667

Стандартная ошибка

48,57611636

57,9471357

Медиана

1546,5

1424,5

Мода

1585

1430

Стандартное отклонение

266,0623469

317,3895337

Дисперсия выборки

70789,17241

100736,1161

Эксцесс

-0,344943844

-0,205332365

Асимметричность

-0,152503649

0,042954448

Интервал

1100

1320

Минимум

980

770

Максимум

2080

2090

Сумма

45900

43043

Счет

30

30

Уровень надежности(95,4%)

101,2720687

120,808882

Стандартное отклонение

261,5903923

312,0548759

Дисперсия

68429,53333

97378,24556

Среднее линейное отклонение

210,4666667

240,3866667

Коэффициент вариации, %

17,09741126

21,74952089

Коэффициент асимметрии Asп

-0,21025237

0,015275091

        

          3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

         а) степень колеблемости значений признаков совокупности

Степень колеблемости значений признаков совокупности оценивается по величине коэффициента вариации : если  < - колеблемость незначительная; если 40%< - колеблемость средняя (умеренная); если >60% - колеблемость значительная.

Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов составляет 17,097%, что свидетельствует о незначительной колеблемости значений признаков изучаемой совокупности. Коэффициент вариации для признака Выпуск продукции составляет 21,750% , что свидетельствует о незначительной колеблемости значений признаков изучаемой совокупности.

         б) степень однородности совокупности по изучаемым признакам

         Для нормальных и близких к нормальному распределений коэффициент вариации  служит индикатором однородности совокупности. Принято считать, что при выполнимости неравенства , совокупность является количественно однородной по данному признаку.

Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов составляет 17,097%, что свидетельствует о количественной однородности изучаемой совокупности. Коэффициент вариации для признака Выпуск продукции составляет 21,750% , что свидетельствует о количественной однородности изучаемой совокупности.

         в) устойчивость индивидуальных значений признаков

         Вывод об устойчивости индивидуальных значений признака позволяет сделать сопоставление средних отклонений – квадратического  и линейного .

В условиях симметричного и нормального, а также близких к ним распределений между показателями  и  имеют место равенства: , . Поэтому отношение показателей  и  может служить индикатором устойчивости данных: если >0,8, то значения признака неустойчивы, в них имеются аномальные выбросы.

Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений, некоторые аномалии в исходных данных продолжают сохраняться. В этом случае их следует выявить и рассматривать в качестве возможных «кандидатов» на исключение из выборки.

Для признака Среднегодовая стоимость основных производственных фондов = (0,791<0,8), что свидетельствует об устойчивости индивидуальных значений признака изучаемой совокупности и об отсутствии некоторых аномалий в исходных данных, которые следует рассматривать в качестве возможных «кандидатов» на исключение из выборки. Для признака Выпуск продукции =  (0,757<0,8), что свидетельствует об устойчивости индивидуальных значений признака изучаемой совокупности и об отсутствии некоторых аномалий в исходных данных, которые следует рассматривать в качестве возможных «кандидатов» на исключение из выборки.

         г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ()

         По значениям показателей и  можно определить границы диапазонов рассеяния значений признака относительно средней , т.е. установить, какая доля значений признака попадет в тот или иной диапазон отклонений от .

В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:

68,3% значений признака войдет в диапазон ();

95,4% значений признака попадет в диапазон ();              (*)

99,7% значений признака появится в диапазоне ().

Соотношение (*) известно как правило «трех сигм».

Распределение значений признака по диапазонам рассеяния  приведем в таблице 9:

Таблица 9

Распределение значений признака по диапазонам рассеяния признака относительно

Границы диапазонов

Количество значений , находящихся в диапазоне

Первый

признак

Второй признак

Первый признак

Второй признак

1264-1796

1117-1752

20

19

998-2062

800-2070

28

28

732-2328

483-2387

30

30

На основе данных таблицы 9 определим процентное соотношение рассеяния значений признака по трем диапазонам и полученные данные отразим в таблице 9А:

  Таблица 9А

Процентное соотношение рассеяния значений признака по диапазонам

Границы диапазонов

Процентное соотношение рассеяния значений признака

Первый признак

Второй признак

Первый

признак

Второй

признак

1264-1796

1117-1752

66,67%

63,33%

998-2062

800-2070

93,33%

93,33%

732-2328

483-2387

100%

100%

Следовательно,

Для признака Среднегодовая стоимость основных производственных фондов вероятностные оценки диапазонов рассеяния значений признака таковы:

66,67% значений признака войдет в диапазон (1264-1796);

93,33% значений признака попадет в диапазон (998-2062);

100% значений признака появится в диапазоне (732-2328).

Для признака Среднегодовая стоимость основных производственных фондов ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» таковы:

68,3% значений признака войдет в диапазон (1264-1796);

95,4% значений признака попадет в диапазон (998-2062);

99,7% значений признака появится в диапазоне (732-2328).

Для признака Выпуск продукции вероятностные оценки диапазонов рассеяния значений признака таковы:

63,33% значений признака войдет в диапазон (1117-1752);

93,33% значений признака попадет в диапазон (800-2070);

100% значений признака появится в диапазоне (483-2387).

Для признака Выпуск продукции ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» таковы:

68,3% значений признака войдет в диапазон (1117-1752);

95,4% значений признака попадет в диапазон (800-2070);

99,7% значений признака появится в диапазоне (483-2387).

Сопоставляя вероятностные оценки диапазонов рассеяния значений признака и ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» для признака Среднегодовая стоимость основных производственных фондов можно сделать вывод о том, что распределение значений признака по диапазонам рассеяния признака относительно близко к нормальному.

Сопоставляя вероятностные оценки диапазонов рассеяния значений признака и ожидаемые оценки диапазонов рассеяния значений признака по правилу «трех сигм» для признака Выпуск продукции можно сделать вывод о том, что распределение значений признака по диапазонам рассеяния признака относительно близко к нормальному.

          4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков

Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов меньше, чем коэффициент вариации для признака Выпуск продукции, так как 17,097%<21,750% (<). Следовательно, степень колеблемости признака Среднегодовая стоимость основных производственных фондов меньше, чем степень колеблемости признака Выпуск продукции.

б) количественной однородности единиц

Для признака Среднегодовая стоимость основных производственных фондов изучаемая совокупность количественно однородна, так как 17,097%≤33% (). Для признака Выпуск продукции изучаемая совокупность количественно однородна, так как 21,750%≤33% (). Следовательно, изучаемая совокупность признака Среднегодовая стоимость основных производственных фондов более количественно однородна, чем изучаемая совокупность признака Выпуск продукции ().

в) надежности (типичности) средних значений признаков

Для признака Среднегодовая стоимость основных производственных фондов средняя арифметическая величина  является надежной характеристикой, так как 17,097%≤40% (). Для признака Выпуск продукции средняя арифметическая величина  является надежной характеристикой, так как 21,750%≤40% (). Следовательно, средняя арифметическая величина  для признака Среднегодовая стоимость основных производственных фондов является более надежной характеристикой, чем средняя арифметическая величина  для признака Выпуск продукции ().

г) симметричности распределений в центральной части ряда

Для оценки асимметричности распределения значений признака в центральном диапазоне () служит коэффициент К.Пирсона (). При правосторонней асимметрии >0, при левосторонней асимметрии <0. Если =0, то имеет место симметричность распределений в центральной части ряда.

Для признака Среднегодовая стоимость основных производственных фондов <0 (= -0,21025237), следовательно, имеет место левосторонняя асимметрия распределения значений признака в центральной части. Для признака Выпуск продукции >0 (= 0,015275091), следовательно, имеет место правосторонняя асимметрия распределения значений признака в центральной части.

          5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду (Мо) полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

          Интервальный вариационный ряд представлен в таблице 7 «Рабочего файла»:

Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группа предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы, %

980-1200

4

13,33%

1200-1420

5

30,00%

1420-1640

11

66,67%

1640-1860

7

90,00%

1860-2080

3

100,00%

Итого

30

Гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлена на рисунке 3 «Рабочего файла»:

 Рисунок 3

Гистограмма распределения предприятий по стоимости основных производственных фондов

    

При анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам). Если на гистограмме четко прослеживаются два-три «горба» частот вариантов, это говорит о том, что значения признака концентрируются сразу в нескольких интервалах, и, следовательно, распределение не является однородным. Если гистограмма имеет одновершинную форму, есть основания полагать, что выборка является однородной по данному признаку.

 В результате визуального анализа гистограммы приходим к выводу о том, что гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов имеет одновершинную форму, и, следовательно, есть основания полагать, что выборка является однородной по данному признаку.

Нормальное распределение является симметричным, если для него выполняется соотношение: .

Для признака Среднегодовая стоимость основных производственных фондов соотношение   не выполняется, так как . Нарушение этого соотношения свидетельствует о наличии асимметрии распределения.

Для оценки асимметричности распределения значений признака служит коэффициент К.Пирсона (). При правосторонней асимметрии >0, при левосторонней асимметрии <0. Правосторонняя асимметрия означает, что в распределении чаще встречаются более высокие значения признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.

Для признака Среднегодовая стоимость основных производственных фондов <0 (= -0,21025237), следовательно, имеет место левосторонняя асимметрия распределения значений признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.

          Рассчитаем моду (Мо) полученного интервального ряда и сравним ее с показателем Мо несгруппированного ряда данных.

          Для полученного интервального ряда значение моды (Мо) рассчитывается по формуле: , где

- нижняя граница модального интервала; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным.

          Для несгруппированного ряда данных значение моды (Мо) равное 1585 млн. руб. отражено в таблице 3 «Рабочего файла»:

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Среднее

1530

Среднее

1434,766667

Стандартная

ошибка

48,57611636

Стандартная ошибка

57,9471357

Медиана

1546,5

Медиана

1424,5

Мода

1585

Мода

1430

Стандартное отклонение

266,0623469

Стандартное отклонение

317,3895337

Дисперсия выборки

70789,17241

Дисперсия выборки

100736,1161

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

1100

Интервал

1320

Минимум

980

Минимум

770

Максимум

2080

Максимум

2090

Сумма

45900

Сумма

43043

Счет

30

Счет

30

Уровень надежности(95,4%)

101,2720687

Уровень надежности(95,4%)

120,808882

          Расхождение между значениями моды объясняется тем, что для интервального ряда значение моды рассчитывалось по средним значениям, а для несгруппированного ряда – по фактическим значениям. 

Статистический анализ  генеральной совокупности

          1. Рассчитать генеральную дисперсию (), генеральное среднее квадратическое отклонение () и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

          Генеральные показатели изучаемой совокупности рассчитаны с помощью инструмента «Описательная статистика», и их значения представлены в таблице 3 «Рабочего файла»:

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Среднее

1530

Среднее

1434,766667

Стандартная

ошибка

48,57611636

Стандартная ошибка

57,9471357

Медиана

1546,5

Медиана

1424,5

Мода

1585

Мода

1430

Стандартное отклонение

266,0623469

Стандартное отклонение

317,3895337

Дисперсия выборки

70789,17241

Дисперсия выборки

100736,1161

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

1100

Интервал

1320

Минимум

980

Минимум

770

Максимум

2080

Максимум

2090

Сумма

45900

Сумма

43043

Счет

30

Счет

30

Уровень надежности(95,4%)

101,2720687

Уровень надежности(95,4%)

120,808882

          Сформируем для генеральных показателей изучаемой совокупности отдельную таблицу (таблица 10):

Таблица 10

Описательные статистики генеральной совокупности

Наименование показателя

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Стандартное отклонение

266,0623469

317,3895337

Дисперсия выборки

70789,17241

100736,1161

Эксцесс

-0,344943844

-0,205332365

Асимметричность

-0,152503649

0,042954448

          При малом числе наблюдений (n≤40-50) для вычисления генеральной дисперсии () по выборочной дисперсии () можно воспользоваться формулой:  . Установим степень расхождения между  и : .

          В условиях близости распределения единиц генеральной совокупности к нормальному для прогнозной оценки размаха вариации признака () воспользуемся формулой: . Для признака Среднегодовая стоимость основных производственных фондов . Для признака Выпуск продукции .

          Для каждого признака прогнозное значение  сравним с . Для признака Среднегодовая стоимость основных производственных фондов  > (1596>1100), т.е. прогнозная оценка размаха вариации больше полученного размаха вариации в выборке на 496. Для признака Выпуск продукции > (1904>1320), т.е. прогнозная оценка размаха вариации больше полученного размаха вариации в выборке на 584. Т.к. прогнозное значение  для каждого признака незначительно расходится с , то распределение единиц выборочной совокупности по изучаемым признакам близко к нормальному.

2. Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки

Средняя ошибка выборки для признака Среднегодовая стоимость основных производственных фондов рассчитана с помощью инструмента «Описательная статистика» и отражена в таблице 3 «Рабочего файла» как параметр «Стандартная ошибка» и равна 48,57611636. Средняя ошибка выборки для признака Выпуск продукции рассчитана с помощью инструмента «Описательная статистика» и отражена в таблице 3 «Рабочего файла» как параметр «Стандартная ошибка» и равна 57,9471357.

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Среднее

1530

Среднее

1434,766667

Стандартная

ошибка

48,57611636

Стандартная ошибка

57,9471357

Медиана

1546,5

Медиана

1424,5

Мода

1585

Мода

1430

Стандартное отклонение

266,0623469

Стандартное отклонение

317,3895337

Дисперсия выборки

70789,17241

Дисперсия выборки

100736,1161

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

1100

Интервал

1320

Минимум

980

Минимум

770

Максимум

2080

Максимум

2090

Сумма

45900

Сумма

43043

Счет

30

Счет

30

Уровень надежности(95,4%)

101,2720687

Уровень надежности(95,4%)

120,808882

б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

Оценки предельных ошибок выборки представлены в таблице 3, таблице 4а, таблице 4б «Рабочего файла»:

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Среднее

1530

Среднее

1434,766667

Стандартная

ошибка

48,57611636

Стандартная ошибка

57,9471357

Медиана

1546,5

Медиана

1424,5

Мода

1585

Мода

1430

Стандартное отклонение

266,0623469

Стандартное отклонение

317,3895337

Дисперсия выборки

70789,17241

Дисперсия выборки

100736,1161

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

1100

Интервал

1320

Минимум

980

Минимум

770

Максимум

2080

Максимум

2090

Сумма

45900

Сумма

43043

Счет

30

Счет

30

Уровень надежности(95,4%)

101,2720687

Уровень надежности(95,4%)

120,808882

 

Таблица 4а

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Уровень надежности(68,3%)

49,46046722

Уровень надежности(68,3%)

59,00209035

 

Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов,

млн. руб."

По столбцу "Выпуск продукции,

млн. руб."

Столбец 1

 

Столбец 2

 

Уровень надежности(99,7%)

157,3575611

Уровень надежности(99,7%)

187,7140585

На основе этих оценок  и формулы  сформируем таблицу 11:

Таблица 11

Предельные ошибки выборки и ожидаемые границы для генеральных средних

Довери-тельная вероят-

ность

Р

Коэффи-циент доверия

t

Предельные ошибки выборки

Ожидаемые границы

для средних

для первого признака

для второго признака

для первого

признака

для второго признака

0,683

1

49,46046722

59,00209035

1481≤≤1579

1376≤≤1494

0,954

2

101,2720687

120,808882

1429≤≤1631

1314≤≤1556

0,997

3

157,3575611

187,7140585

1373≤≤1687

1247≤≤1622

3. Рассчитать коэффициенты асимметрии (As) и эксцесса (Ek). На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.     

          Коэффициенты асимметрии (As) и эксцесса (Ek) рассчитаны с помощью инструмента «Описательная статистика», и их значения представлены в таблице 10:

 

Таблица 10

Описательные статистики генеральной совокупности

Наименование показателя

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Стандартное отклонение

266,0623469

317,3895337

Дисперсия выборки

70789,17241

100736,1161

Эксцесс

-0,344943844

-0,205332365

Асимметричность

-0,152503649

0,042954448

Если распределение единиц выборочной совокупности близко к нормальному, выборка является репрезентативной (значение показателей  и  расходятся незначительно) и при этом коэффициенты As и Ek указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.

Т.к. распределение единиц выборочной совокупности для признака Среднегодовая стоимость основных производственных фондов близко к нормальному, выборка является репрезентативной (значение показателей  и  расходятся незначительно: 70789,17241 и 68429,53333) и при этом коэффициенты As и Ek указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно (коэффициент As = -0,152503649, As≤0,25 – асимметрия незначительная; коэффициент Ek = -0,344943844, Ek<0 – вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной, следовательно, значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону), то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.

Т.к. распределение единиц выборочной совокупности для признака Выпуск продукции близко к нормальному, выборка является репрезентативной (значение показателей  и  расходятся незначительно: 100736,1161 и 97378,24556) и при этом коэффициенты As и Ek указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно (коэффициент As =0,042954448, As≤0,25 – асимметрия незначительная; коэффициент Ek = -0,205332365, Ek<0 – вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной, следовательно, значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону), то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.

Экономическая интерпретация результатов статистического исследования предприятий

1. Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?

                В результате визуального анализа диаграммы рассеяния признаков единиц изучаемой совокупности (рисунок 1 «Рабочего файла») выявлены следующие аномальные единицы наблюдения, представленные в таблице 2 «Рабочего файла»:

Рисунок 1

Точечная диаграмма  рассеяния признаков изучаемой совокупности

               

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции,

млн. руб.

11

650,00

1650,00

30

2080,00

550,00

Приведенные в таблице 2 аномальные единицы наблюдения удалены из изучаемой совокупности. Корреляционное поле имеет вид:

Рисунок 2

Точечная диаграмма  рассеяния признаков изучаемой совокупности

          После исключения аномальных единиц наблюдения из изучаемой совокупности исходные данные принимают вид, представленный в таблице 1А «Рабочего файла»:

 

 

Таблица 1А

 

Исходные данные

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

1

1178,00

1133,00

2

1387,00

1243,00

3

1431,00

1386,00

4

1508,00

1540,00

5

980,00

770,00

6

1585,00

1320,00

7

1629,00

1782,00

8

1222,00

1210,00

9

1497,00

1419,00

10

1728,00

1771,00

12

1893,00

1870,00

13

1442,00

1474,00

14

1585,00

1606,00

15

1816,00

1947,00

16

2080,00

2090,00

17

1552,00

1408,00

18

1717,00

1672,00

19

1365,00

1045,00

20

1739,00

1430,00

21

1937,00

1925,00

22

1332,00

1089,00

23

1057,00

1023,00

24

1772,00

1639,00

25

1585,00

1430,00

26

1475,00

1353,00

27

1145,00

880,00

28

1541,00

1375,00

29

1783,00

1507,00

31

1695,00

1430,00

32

1244,00

1276,00

         

            Исходные данные, представленные в таблице 1А «Рабочего файла», образующие выборку предприятия по значениям изучаемых экономических показателей, типичны по значениям изучаемых экономических показателей.

          2. Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов и выпуска продукции?

          Наиболее характерные для предприятий значения показателей среднегодовой стоимости основных производственных фондов  и выпуска продукции таковы:

          Средняя арифметическая значений для признака Среднегодовая стоимость основных производственных фондов – 1530 млн. руб. Средняя арифметическая значений для признака Выпуск продукции – 1434,77 млн. руб.

          Среднее квадратическое отклонение для признака Среднегодовая стоимость основных производственных фондов – 266,06 млн. руб. Среднее квадратическое отклонение для признака Выпуск продукции –317,39 млн. руб.

          Для признака Среднегодовая стоимость основных производственных фондов  в диапазон от 1264 млн. руб.  до  1796 млн. руб.

(), включаются следующие предприятия с наиболее характерными значениями показателей:

№ п/п

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

1

2

1387,00

2

3

1431,00

3

4

1508,00

4

6

1585,00

5

7

1629,00

6

9

1497,00

7

10

1728,00

8

13

1442,00

9

14

1585,00

10

17

1552,00

11

18

1717,00

12

19

1365,00

13

20

1739,00

14

22

1332,00

15

24

1772,00

16

25

1585,00

17

26

1475,00

18

28

1541,00

19

29

1783,00

20

31

1695,00

          Для признака Выпуск продукции  в диапазон от 1117 млн. руб. до 1752 млн. руб. (), включаются следующие предприятия с наиболее характерными значениями показателей:

№ п/п

Номер предприятия

Выпуск продукции, млн. руб.

1

1

1133,00

2

2

1243,00

3

3

1386,00

4

4

1540,00

5

6

1320,00

6

8

1210,00

7

9

1419,00

8

13

1474,00

9

14

1606,00

10

17

1408,00

11

18

1672,00

12

20

1430,00

13

24

1639,00

14

25

1430,00

15

26

1353,00

16

28

1375,00

17

29

1507,00

18

31

1430,00

19

32

1276,00

          3. Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?

Для нормальных и близких к нормальному распределений коэффициент вариации  служит индикатором однородности совокупности. Принято считать, что при выполнимости неравенства , совокупность является количественно однородной по данному признаку.

Коэффициент вариации для признака Среднегодовая стоимость основных производственных фондов составляет 17,097%, что свидетельствует о количественной однородности изучаемой совокупности. Коэффициент вариации для признака Выпуск продукции составляет 21,750% , что свидетельствует о количественной однородности изучаемой совокупности.

Максимальное расхождение в значениях показателей (размах вариации) для признака Среднегодовая стоимость основных производственных фондов составляет 1100 млн. руб. Максимальное расхождение в значениях показателей (размах вариации) для признака Выпуск продукции составляет 1320 млн. руб.

          4. Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных производственных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показателя? Какие именно это предприятия?

          Интервальный ряд распределения предприятий по стоимости основных производственных фондов представлен в таблице 7 «Рабочего файла»:

         

Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группа предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы, %

980-1200

4

13,33%

1200-1420

5

30,00%

1420-1640

11

66,67%

1640-1860

7

90,00%

1860-2080

3

100,00%

Итого

30

          Модальный интервал соответствует группе предприятий по стоимости основных производственных фондов от 1420 до 1640 млн. руб., т.к. в эту группу включается наибольшее число предприятий равное 11, а именно:

№ п/п

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

1

3

1431,00

2

4

1508,00

3

6

1585,00

4

7

1629,00

5

9

1497,00

6

13

1442,00

7

14

1585,00

8

17

1552,00

9

25

1585,00

10

26

1475,00

11

28

1541,00

          В группу с наименьшей стоимостью основных производственных фондов от 980 до 1200 млн. руб. включаются 4 предприятия, а именно:

№ п/п

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

1

1

1178,00

2

5

980,00

3

23

1057,00

4

27

1145,00

          В группу с наибольшей стоимостью основных производственных фондов от 1860 до 2080 млн. руб. включаются 3 предприятия, а именно: 

№ п/п

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

1

12

1893,00

2

16

2080,00

3

21

1937,00

          Удельный вес предприятий модального интервала равен 36,67%. Удельный вес предприятий интервала с наименьшими значениями показателя равен 13,33%. Удельный вес предприятий интервала с наибольшими значениями показателя равен 10%.

          5. Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?

Гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлена на рисунке 3 «Рабочего файла»:

 Рисунок 3

Гистограмма распределения предприятий по стоимости основных производственных фондов

    

         

В результате визуального анализа гистограммы приходим к выводу о том, в гистограмме распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов имеется определенная закономерность, которая дает основание предполагать, что распределение эмпирических данных близко к нормальному (наблюдается незначительная асимметрия).

Для оценки асимметричности распределения значений признака служит коэффициент К.Пирсона (). При правосторонней асимметрии >0, при левосторонней асимметрии <0. Правосторонняя асимметрия означает преимущественное появление в распределении более высоких значений признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.

Для признака Среднегодовая стоимость основных производственных фондов <0 (= -0,21025237), следовательно, имеет место левосторонняя асимметрия распределения значений признака. Левосторонняя асимметрия означает, что в распределении чаще встречаются более низкие значения признака.

          6. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях показателя можно ожидать?

          Предельные ошибки средней и границы, в которых будут находиться средние значения показателей, отражены в таблице 11:

Таблица 11

Предельные ошибки выборки и ожидаемые границы для генеральных средних

Довери-тельная вероят-

ность

Р

Коэффи-циент доверия

t

Предельные ошибки выборки

Ожидаемые границы

для средних

для первого признака

для второго признака

для первого

признака

для второго признака

0,683

1

49,46046722

59,00209035

1481≤≤1579

1376≤≤1494

0,954

2

101,2720687

120,808882

1429≤≤1631

1314≤≤1556

0,997

3

157,3575611

187,7140585

1373≤≤1687

1247≤≤1622

          В условиях близости распределения единиц генеральной совокупности к нормальному для прогнозной оценки размаха вариации признака () воспользуемся формулой: . Для признака Среднегодовая стоимость основных производственных фондов . Для признака Выпуск продукции .