ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ


КАФЕДРА СТАТИСТИКИ




О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1


«Автоматизированный априорный анализ статистической совокупности

 в среде MS Excel»


Вариант №__43__








Выполнил: ст. III


Проверил доц. Клизогуб Л.М.               

 










Калуга 2007 г

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Для демонстрационного примера (ДП) выборочные данные приведены в табл. 1-ДП.

Таблица 1-ДП

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

2420,00

2317,50

2

2847,50

2542,50

3

2937,50

2835,00

4

3095,00

3150,00

5

2015,00

1575,00

6

3252,50

2700,00

7

3342,50

3645,00

8

2510,00

2475,00

9

3072,50

2902,50

10

3545,00

3622,50

11

3882,50

3825,00

13

2960,00

3015,00

14

3252,50

3285,00

15

3725,00

3982,50

16

4265,00

4275,00

17

3185,00

2880,00

18

3522,50

3420,00

19

2802,50

2137,50

20

3567,50

2925,00

21

3972,50

3937,50

22

2735,00

2227,50

23

2172,50

2092,50

24

3635,00

3352,50

25

3252,50

2925,00

26

3027,50

2767,50

27

2352,50

1800,00

28

3162,50

2812,50

29

3657,50

3082,50

30

3477,50

2925,00

32

2555,00

2610,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности

1.    Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

2.    Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (Vσ), структурный коэффициент асимметрии  К.Пирсона (Asп).

3.    На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым     признакам;

в) устойчивость индивидуальных значений признаков;

                   г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

4.    Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5.    Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

 

Статистический анализ  генеральной совокупности

1.               Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение  и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

2.               Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

3.               Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.












Результативные таблицы

 

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

2420,00

2317,50

2

2847,50

2542,50

3

2937,50

2835,00

4

3095,00

3150,00

5

2015,00

1575,00

6

3252,50

2700,00

7

3342,50

3645,00

8

2510,00

2475,00

9

3072,50

2902,50

10

3545,00

3622,50

11

3882,50

3825,00

13

2960,00

3015,00

14

3252,50

3285,00

15

3725,00

3982,50

16

4265,00

4275,00

17

3185,00

2880,00

18

3522,50

3420,00

19

2802,50

2137,50

20

3567,50

2925,00

21

3972,50

3937,50

22

2735,00

2227,50

23

2172,50

2092,50

24

3635,00

3352,50

25

3252,50

2925,00

26

3027,50

2767,50

27

2352,50

1800,00

28

3162,50

2812,50

29

3657,50

3082,50

30

3477,50

2925,00

32

2555,00

2610,00

 

 

 

 

 

 

 

 




Рис.1. Точечный график – диаграмма




Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12

1340,00

3375,00

31

4265,00

1125,00









Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 





Среднее

3140

Среднее

2934,75

Стандартная ошибка

99,36023801

Стандартная ошибка

118,5282321

Медиана

3173,75

Медиана

2913,75

Мода

3252,5

Мода

2925

Стандартное отклонение

544,2184367

Стандартное отклонение

649,2058644

Дисперсия выборки

296173,7069

Дисперсия выборки

421468,2543

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

2250

Интервал

2700

Минимум

2015

Минимум

1575

Максимум

4265

Максимум

4275

Сумма

94200

Сумма

88042,5

Счет

30

Счет

30

Уровень надежности(95,4%)

207,1473216

Уровень надежности(95,4%)

247,1089675










 


Таблица 4а

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 





Уровень надежности(68,3%)

101,1691694

Уровень надежности(68,3%)

120,686132












Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 





Уровень надежности(99,7%)

321,8685556

Уровень надежности(99,7%)

383,9615488







Таблица 5


Выборочные показатели вариации и асимметрии


По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

535,0712569

Стандартное отклонение

638,2940643

Дисперсия

286301,25

Дисперсия

407419,3125

Среднее линейное отклонение

430,5

Среднее линейное отклонение

491,7

Коэффициент вариации, %

17,04048589

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091






Таблица 6



Карман

Частота



1



2465

3



2915

5



3365

11



3815

7


 

4265

3















Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группы предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы

2015-2465

4

13,33%

2465-2915

5

30,00%

2915-3365

11

66,67%

3365-3815

7

90,00%

3815-4265

3

100,00%

Итого:

30

100,00%








Рис. 2. Гистограмма



            В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистичемкий анализ генеральной совокупности

 



Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12

1340,00

3375,00

31

4265,00

1125,00

 

         Приведенные в табл.2 аномальные единицы наблюдения удалены из изучаемой совокупности с целью повышения степени ее однородности и статистической точности оценок расчетных показателей. Аномальные единицы наблюдения подлежат индивидуальному анализу с точки зрения «законности» причинах появления в совокупности.

         Приведенные в таблице аномальные единицы наблюдения удалены из изучаемой совокупности. Корреляционное поле имеет вид:




2. Выборочные показатели в результате расчетов представлены в 2-х таблицах – Таблица 3 и Таблица 5









Таблица 3

Описательные статистики

Столбец1

 

Столбец2

 





Среднее x

3140

Среднее x

2934,75

Стандартная ошибка

99,36023801

Стандартная ошибка

118,5282321

Медиана Me

3173,75

Медиана Me

2913,75

Мода Mo

3252,5

Мода Mo

2925

Стандартное отклонение σn

544,2184367

Стандартное отклонение σn

649,2058644

Дисперсия выборки σn2

296173,7069

Дисперсия выборки σn2

421468,2543

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал R

2250

Интервал R

2700

Минимум

2015

Минимум

1575

Максимум

4265

Максимум

4275

Сумма

94200

Сумма

88042,5

Счет

30

Счет

30

Уровень надежности(95,4%)

207,1473216

Уровень надежности(95,4%)

247,1089675






 

 

 

Таблица 5

 

Выборочные показатели вариации и асимметрии

 

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

535,0712569

Стандартное отклонение

638,2940643

Дисперсия

286301,25

Дисперсия

407419,3125

Среднее линейное отклонение

430,5

Среднее линейное отклонение

491,7

Коэффициент вариации, %

17,04048589

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

Asп

-0,21025237

Коэффициент асимметрии

Asп

0,015275091






3. а) после удаления аномальных значений коэффициент вариации Vσ:

         1. признака «Среднегодовая стоимость основных производственных фондов» составляет 17,0404%, исходя из оценочной шкалы находится в диапазоне 0%<Vσ≤40%. – колеблемость незначительная;

         2. признака «Выпуск продукции» составляет 21,7495%, исходя их оценочной шкалы находится в диапазоне 0%< Vσ≤40%. – колеблемость незначительная.

         б) однородность совокупности для нормального и близких к нормальному распределений устанавливается по условию: Vσ≤33%.

         Коэффициент вариации признака «Среднегодовая стоимость основных производственных фондов» составляет 17,0404%, что свидетельствует об однородности изучаемой совокупности.

         Коэффициент вариации признака «Выпуск продукции» составляет 21,7495%, что свидетельствует об однородности изучаемой совокупности.

         Чем однороднее изучаемая совокупность, тем надежнее полученная средняя.

         в) Сопоставление средних отклонений – квадратического σ и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

По столбцу «Среднегодовая стоимость основных производственных фондов, млн. руб.»

По столбцу «Выпуск продукции, млн. руб.»

/σ

0,790

/σ

0,757

 

         Отношение показателей σ и может служить индикатором устойчивости данных:

если /σ < 0,8, то можно сделать вывод об устойчивости индивидуальных значений признака, среди них отсутствуют «аномальные» выбросы.

         Так как это условие соблюдается, то можно сделать вывод об устойчивости индивидуальных значений признака Среднегодовая стоимость основных производственных фондов и признака Выпуск продукции, то есть среди них отсутствуют «аномальные» варианты значений, значения признака устойчивы.

         г)

Признаки

Количество значений признака Xi, находящихся в диапазоне

 

x- σn≤ Xi x+ σn

1.        2596 Xi3684

  1. 2286 Xi3584

 

x-2σn Xi x+2σn

1.2052 Xi≤4228

2. 1637≤ Xi≤4233

 

x-3σn Xi x+3σn

1.1508≤ Xi≤4772

2.988≤ Xi≤4882

 

1. Среднегодовая стоимость основных производственных фондов

20

28

31

2. Выпуск продукции

20

29

32

         По значениям показателей x и σ можно определить границы интервалов вариации признака, т.е. установить, какая доля единиц совокупности попадает в тот или иной интервал отклонений значений признака от x.

         В нормально распределенных и близких к ним рядах вероятностные оценки границ интервалов таковы:

68,3% значений признака войдет в интервал ;

95,4% значений признака попадет в интервал ;

99,7% значений признака появится в интервале .

Следовательно,

         Для признака среднегодовая стоимость основных фондов:

68,3% значений признака войдет в интервал от 2596 до 3684;

95,4% значений признака попадет в интервал от 2052 до 4228;

99,7% значений признака появится в интервале от 1508 до 4772.

         Для признака выпуск продукции:

68,3% значений признака войдет в интервал от 2286 до 3584;

95,4% значений признака попадет в интервал от 1637 до 4233;

99,7% значений признака появится в интервале от 988 до 4882.

         Ожидаемые границы вариации выборки для признака «Среднегодовая стоимость основных производственных фондов» соответствует:

±σ  с вероятностью Р = 68,3%, т.е. ±544;

±2σ с вероятностью Р = 95,4%, т.е. ±1088;

±3σ с вероятностью Р = 99,7%, т.е. ±1632.

         Ожидаемые границы вариации выборки для признака «Выпуск продукции» соответствует:

±σ  с вероятностью Р = 68,3%, т.е. ±649;

±2σ с вероятностью Р = 95,4%, т.е. ±1298;

±3σ с вероятностью Р = 99,7%, т.е. ±1947.

         Для обоих признаков рассчитанные значения процентное соотношение рассеяния отличаются на незначительную величину от вероятных оценок диапазонов рассеяния.

         4. а) Так как, значение показателя вариации Vσ = 17,04 для признака «Среднегодовая стоимость основных производственных фондов», а Vσ = 21,75 для признака «Выпуск продукции», то индивидуальные значения признака «Среднегодовая стоимость основных производственных фондов», мало отличаются друг от друга, единицы наблюдения количественно однородны, чем для признака «Выпуск продукции».                                                         

         б) Так как значение Vσ для обоих признаков невелико, т.е. Vσ≤33%, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.

         в) По таблице 5 видно, что Asп < 0 (Asп = -0,210) для признака «Среднегодовая стоимость основных производственных фондов», и это означает, что асимметрия левосторонняя, для которой справедливо равенство

x < Me < Mo, означающее, что в распределении чаще встречаются более низкие значения признака, а для признака «Выпуск продукции» Asп > 0, т.е. 

Asп = 0,015, и это значит, что асимметрия правосторонняя, для которой справедливо неравенство x > Me >Mo, означающее, что в распределении чаще встречаются более высокие значения признака.

         г) Для обеих признаков |As| ≤ 0,25 – асимметрия незначительная, значит основная масса единиц располагается в центральной зоне ряда, но для признака «Выпуск продукции» форма кривой значительнее ближе к распределению нормальной кривой.

         5.




Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группы предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы

2015-2465

4

13,33%

2465-2915

5

30,00%

2915-3365

11

66,67%

3365-3815

7

90,00%

3815-4265

3

100,00%

Итого:

30

100,00%


Рис. 2. Гистограмма

         Для полученного интервального ряда рассчитываем значение моды  Mo:


Mo = XMo + IMo * fMo - fMo /( fMo – fMo-1) + (fMo + fMo+1) =

=2915 + 450 * (11 -5) / (11 – 5) + (11 – 7) = 3185 (млн. руб.)

         Расхождения между полученными значениями Мо и значениями моды из таблицы 3, т.е. Мо = 3252,5 млн. руб. объясняется тем, что значение Мо = 3185 млн. руб. получено по фактическим значениям, а для интервального ряда – по центральным значениям.

Статистический анализ генеральной совокупности

 

         1. Установим степень расхождения между уn2 и yN2 по формуле:

         Для признака «Среднегодовая стоимость основных производственных фондов»

         σ N2 / σn2 = 296173,70 / 286301,25 = 1,034

         Для признака «Выпуск продукции»

           σ N2 / σn2 = 421568,25 / 407419,31= 1,034

         Степень расхождения:  σ N2 / σn2 = n / n-1 = 30 / 29 = 1,034

         Степень расхождения между уn2 и yN2 для обоих признаков отсутствует. Рассчитываем прогнозные оценки размаха вариации RN и сравниваем с Rn:

                Для признака «Среднегодовая стоимость основных производственных фондов»

RN = 6σ = 6 * 544,22 = 3265,32

Rn= 6σ = 6 * 544,22 = 3265,32

R = 3265,32 – 3265,32 = 0

         Для признака «Выпуск продукции»

RN = 6σ = 6 *649,21 = 3895,26

Rn = 6σ = 6 *649,21= 3895,26

R = 3895,26– 3895,26= 0

         Прогнозные оценки размаха вариации для обоих признаков отсутствуют.

2. а) Для признака «Среднегодовая стоимость основных производственных фондов» - 99,36 млн. руб.

Для признака «Выпуск продукции» - 118,53 млн. руб.

    б) Хср-∆Х ≤Хср≤Хср +∆Х


Дове-ритель-ная вероят-

ность Р

Коэффи-

циент

доверия t

Предельные ошибки выборки

Ожидаемые границы для средних

Для первого признака

Для второго признака

Для первого признака

Для второго признака

0,683

1

101,17

120,69

3038,83 – 3241,17

2814,06 – 3055,44

0,954

2

207,15

247,11

2938,83 – 3347,15

2687,54 – 3181,86

0,997

3

321,87

383,96

2818,13 – 3461,87

2550,88 – 3318,81


3.  AsN = |0,153| - указывает на незначительную величину асимметрии, а    EkN = -0,345 указывает на умеренную величину эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по признаку «Среднегодовая стоимость основных производственных фондов», будет близко к нормальному. Распределение единиц генеральной совокупности по признаку «Выпуск продукции» AsN =                 

|0,043| и EkN = -0,205 указывает на незначительную величину асимметрии и эксцесса соответственно.


        


 






















Экономическое содержание задачи

1.     Предприятия с резко выделяющимися характеристиками:

№12 – 1340 млн. руб.; 3375 млн. руб.; № 31 – 4265 млн. руб.; 1125 млн. руб. –

т.е. они выходят из диапазона ().

     2. Для показателя «Среднегодовая стоимость основных производственных фондов»: Хср = 3140 млн. руб., σ = 544,22 млн. руб.

        Для показателя «Выпуск продукции»: Хср = 2934,75 млн. руб., σ = 649,21

        Для показателя «Среднегодовая стоимость основных производственных фондов предприятия, входящие в диапазон (),-

№2,3,4,6,7,9,10,13,14,17,18,19,20,22,24,25,26,28,29,30

        Для показателя «Выпуск продукции» предприятия, входящие в диапазон (),-

№1,2,3,4,6,8,9,12,13,14,17,18,20,24,25,26,28,29,30,32

3. Коэффициенты вариации Vσ = 17,0405; Vσ = 21,7495

         Из значений коэффициентов видно, что совокупность является однородной.

4. Модальный интервал 2465 - 3365

         Типичные предприятия, входящие в модальный интервал № 2,8,19,22,32

         Предприятия, входящие в группу с наименьшей стоимостью основных фондов №1,5,23,27;

         Предприятия, входящие в группу с наибольшей стоимостью основных фондов №3,4,6,7,9,13,14,17,25,26,28.;

         Удельный вес предприятий модального интервала: Р = 5/30 = 0,167 или 16,7%

         Удельный вес предприятий модального интервала с наименьшими значениями Р = 4/30 = 0,133 или 13,3%

         Удельный вес предприятий модального интервала с наибольшими значениями Р = 11/30 = 0,367 или 36,7%


5. Asп = -0,210, распределение близко к нормальному. В совокупности доминируют предприятия с более низкой стоимостью основных фондов.

6. Ожидаемый размах показателей:

Для признака «Среднегодовая стоимость основных производственных фондов:

 R = 3265,32 – 3265,32 = 0

Для признака «Выпуск продукции»

R = 3895,26 – 3895,26 = 0

Прогнозные оценки размаха вариации для обоих признаков отсутсвуют.

         Ожидаемые границы для средних

Для признака «Среднегодовая стоимость основных производственных фондов:

Доверительная

вероятность:              0,683                    3038,83 – 3241,17

0,954                     2818,13 – 3461,87

0,997                     2938,83 – 3347,15


  Для признака «Выпуск продукции»

Доверительная

вероятность               0,683                    2814,06 – 3055,44

0,954                     2550,88 – 3318,81

0,997                     2687,54 – 3181,86


         Предельные ошибки выборки

Доверительная                             для 1 признака          для 2 признака

вероятность                0,683          101,17                           120,69

0,954           321,87                           383,96

0,997           207,15                           247,11



Вывод

         1) После удаления аномальных значений коэффициент вариации Vσ признака «Среднегодовая стоимость основных производственных фондов» составляет 17,040%, исходя из оценочной шкалы находится в диапазоне   0%< Vσ≤40%. – колеблемость незначительная.

         Однородность совокупности для нормального и близких к нормальному распределений устанавливается по условию: Vσ≤33%.

         Коэффициент вариации признака «Среднегодовая стоимость основных производственных фондов» составляет 17,0405%, что свидетельствует об однородности изучаемой совокупности.

         Коэффициент вариации признака «Выпуск продукции» составляет 21,7495%, что свидетельствует об однородности изучаемой совокупности.

         Чем однороднее изучаемая совокупность, тем надежнее полученная средняя.

         2) Если /σ < 0,8, так как это условие соблюдается можно сделать вывод об устойчивости индивидуальных значений признака Среднегодовая стоимость основных производственных фондов и признака выпуска продукции, то есть среди них отсутствуют «аномальные» варианты значений, значения признака устойчивы.

         3) полученные значения процентного соотношения рассеяния для наших признаков близки к значениям процентного соотношения признаков, распределенных по нормальному закону, исходя из этого можно сделать вывод о том, что наше распределение близко к к нормальному.

         4) а)Vσ1< Vσ2 (Vσ1 = 17,040   Vσ2 = 21,749) поэтому колеблемость единиц совокупности для первого признака меньше, чем для второго.

         б) количественная однородность единиц выше для второго признака по сравнению с первым, исходя из значений показателя коэффициента вариации

         в) для второго признака средняя арифметическая величина является более надежной характеристикой чем для первого (исходя из значений показателя коэффициента вариации)

         г) поскольку  x < Me < Mo и Asп1 < 0 для первого признака характерна левосторонняя асимметрия (Asп1= -0,210). Поскольку x > Me >Mo и Asп2>0 для второго признака характерна правосторонняя асимметрия Asп = 0,015. Так как для обоих признаков |As| ≤ 0,25 – асимметрия незначительная.

         5) при анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам) .

         Если гистограмма имеет одновершинную форму, есть основания считать выборку по данному признаку.