ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1

«Автоматизированный априорный анализ статистической совокупности

 в среде MS Excel»

Вариант №

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Для демонстрационного примера (ДП) выборочные данные приведены в табл. 1-ДП.

Таблица 1-ДП

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

17000

16223

2

19993

17798

3

20623

19845

4

21725

22050

5

14165

11025

6

22828

18900

7

23458

25515

8

17630

17325

9

21568

20318

10

24875

25358

11

27238

26775

13

20780

21105

14

22828

22995

15

26135

27878

16

29915

29925

17

22355

20160

18

24718

23940

19

19678

14963

20

25033

20475

21

27868

27563

22

19205

15593

23

15268

14648

24

25505

23468

25

22828

20475

26

21253

19373

27

16528

12600

28

22198

19688

29

25663

21578

30

24403

20475

32

17945

18270

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности

1.    Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

2.    Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (), структурный коэффициент асимметрии  К.Пирсона (Asп).

3.    На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым     признакам;

в) устойчивость индивидуальных значений признаков;

                   г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

4.    Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5.    Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

 

Статистический анализ  генеральной совокупности

1.               Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение  и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

2.               Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

3.               Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

Результативные таблицы

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистичемкий анализ генеральной совокупности

 

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12

9440,00

23625,00

31

29915,00

7875,00

 

         Приведенные в табл.2 аномальные единицы наблюдения удалены из изучаемой совокупности с целью повышения степени ее однородности и статистической точности оценок расчетных показателей. Аномальные единицы наблюдения подлежат индивидуальному анализу с точки зрения «законности» причинах появления в совокупности.

Приведенные в таблице аномальные единицы наблюдения удалены из изучаемой совокупности. Корреляционное поле имеет вид:

2. Выборочные показатели в результате расчетов представлены в 2-х таблицах – Таблица 3 и Таблица 5

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

Столбец2

 

 

 

 

 

 

 

 

Среднее

22040

Среднее

20543,25

Стандартная ошибка

695,521666

Стандартная ошибка

829,6976249

Медиана

22276,25

Медиана

20396,25

Мода

22827,5

Мода

20475

Стандартное отклонение

3809,529057

Стандартное отклонение

4544,44105

Дисперсия выборки

14512511,64

Дисперсия выборки

20651944,46

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

15750

Интервал

18900

Минимум

14165

Минимум

11025

Максимум

29915

Максимум

29925

Сумма

661200

Сумма

616297,5

Счет

30

Счет

30

Уровень надежности(95,0%)

1422,501507

Уровень надежности(95,0%)

1696,922151

Таблица 4а

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

 

 

 

 

Уровень надежности(68,3%)

708,184186

Уровень надежности(68,3%)

844,8029239

Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

Столбец2

 

 

 

 

Уровень надежности(99,7%)

2253,079889

Уровень надежности(99,7%)

2687,730841

 

Таблица 5

Выборочные показатели вариации и асимметрии

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

3745,498799

Стандартное отклонение

4468,05845

Дисперсия

14028761,25

Дисперсия

19963546,31

Среднее линейное отклонение

3013,5

Среднее линейное отклонение

3441,9

Коэффициент вариации, %

16,99409618

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091

3. а) после удаления аномальных значений коэффициент вариации Vσ:

1. признака «Среднегодовая стоимость основных производственных фондов» составляет 16,9941%, исходя из оценочной шкалы находится в диапазоне 0%<Vσ≤40%. – колеблемость незначительная;

2. признака «Выпуск продукции» составляет 21,7495%, исходя их оценочной шкалы находится в диапазоне 0%< Vσ≤40%. – колеблемость незначительная.

б) однородность совокупности для нормального и близких к нормальному распределений устанавливается по условию: Vσ≤33%.

Коэффициент вариации признака «Среднегодовая стоимость основных производственных фондов» составляет 16,9941%, что свидетельствует об однородности изучаемой совокупности.

Коэффициент вариации признака «Выпуск продукции» составляет 21,7495%, что свидетельствует об однородности изучаемой совокупности.

Чем однороднее изучаемая совокупность, тем надежнее полученная средняя.

в) Сопоставление средних отклонений – квадратического σ и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

По столбцу «Среднегодовая стоимость основных производственных фондов, млн. руб.»

По столбцу «Выпуск продукции, млн. руб.»

/σ

0,80

/σ

0,77

 

Отношение показателей σ и может служить индикатором устойчивости данных:

если /σ < 0,8, то можно сделать вывод об устойчивости индивидуальных значений признака, среди них отсутствуют «аномальные» выбросы.

Так как это условие соблюдается, то можно сделать вывод об устойчивости индивидуальных значений признака Среднегодовая стоимость основных производственных фондов и признака Выпуск продукции, то есть среди них отсутствуют «аномальные» варианты значений, значения признака устойчивы.

г)

Признаки

Количество значений признака Xi, находящихся в диапазоне

x- σn≤ Xix+ σn

x-2σn≤ Xix+2σn

x-3σn≤ Xix+3σn

1. Среднегодовая стоимость основных производственных фондов

20

18295 Xi25785

28

14549 Xi29531

31

10804≤ Xi33276

2. Выпуск продукции

20

16075 Xi25011

29

11607≤ Xi29479

31

7139≤ Xi33947

По значениям показателей xi и σ можно определить границы интервалов вариации признака, т.е. установить, какая доля единиц совокупности попадает в тот или иной интервал отклонений значений признака от xi.

В нормально распределенных и близких к ним рядах вероятностные оценки границ интервалов таковы:

68,3% значений признака войдет в интервал ;

95,4% значений признака попадет в интервал ;

99,7% значений признака появится в интервале .

Следовательно,

Для признака среднегодовая стоимость основных фондов:

68,3% значений признака войдет в интервал от 18295 до 25785;

95,4% значений признака попадет в интервал от 14549 до 29531;

99,7% значений признака появится в интервале от 10804 до 33276.

Для признака выпуск продукции:

68,3% значений признака войдет в интервал от 16075 до 24289;

95,4% значений признака попадет в интервал от 11607 до 28034;

99,7% значений признака появится в интервале от 7139 до 31780.

Ожидаемые границы вариации выборки для признака «Среднегодовая стоимость основных производственных фондов» соответствует:

±σ  с вероятностью Р = 68,3%, т.е. ±3745;

±2σ с вероятностью Р = 95,4%, т.е. ±7491;

±3σ с вероятностью Р = 99,7%, т.е. ±11236.

Ожидаемые границы вариации выборки для признака «Выпуск продукции» соответствует:

±σ  с вероятностью Р = 68,3%, т.е. ±4468;

±2σ с вероятностью Р = 95,4%, т.е. ±8396;

±3σ с вероятностью Р = 99,7%, т.е. ±13404.

Для обоих признаков рассчитанные значения процентное соотношение рассеяния отличаются на незначительную величину от вероятных оценок диапазонов рассеяния.

4. а) Так как, значение показателя вариации  = 16,9941% для признака «Среднегодовая стоимость основных производственных фондов», а Vσ =  21,7495% для признака «Выпуск продукции», то индивидуальные значения признака «Среднегодовая стоимость основных производственных фондов»,  мало отличаются друг от друга, единицы наблюдения количественно более однородны, чем для признака «Выпуск продукции».                                                         

б) Так как значение для обоих признаков невелико, т.е. Vσ≤33%, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.

в) По таблице 5 видно, что Asп < 0 (Asп = -0,2103) для признака «Среднегодовая стоимость основных производственных фондов», и это означает, что асимметрия левосторонняя, для которой справедливо равенство

xс < Me < Mo, означающее, что в распределении чаще встречаются более низкие значения признака, а для признака «Выпуск продукции» Asп > 0, т.е. 

Asп = 0,0153, и это значит, что асимметрия правосторонняя, для которой справедливо неравенство x > Me >Mo, означающее, что в распределении чаще встречаются более высокие значения признака.

г) Для обеих признаков |As| ≤ 0,25 – асимметрия незначительная, значит основная масса единиц располагается в центральной зоне ряда, но для признака «Выпуск продукции» форма кривой значительнее ближе к распределению нормальной кривой.

         5.

Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группы предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы

14165-17315

4

13%

17315-20465

5

30%

20465-23615

11

67%

23615-26765

7

90%

26765-29915

3

100%

ИТОГО

30

 

 

Для полученного интервального ряда рассчитываем значение моды  Mo:

Mo = XMo + IMo * (fMo - fMo ) / (( fMo – fMo-1) + (fMo + fMo+1)) =

=20465 + 3150 * (11 -5) / (11 – 5) + (11 – 7) = 22355 (млн. руб.)

Расхождения между полученными значениями Мо и значениями моды из таблицы 3, т.е. Мо = 22827,5 млн. руб. объясняется тем, что значение Мо = 22355 млн. руб. получено по фактическим значениям, а для интервального ряда – по центральным значениям.

 

Статистический анализ генеральной совокупности

 

1. Установим степень расхождения между уn2 и yN2 по формуле:

Для признака «Среднегодовая стоимость основных производственных фондов»

σ N2 / σn2 = 14512511,64 / 14028761,25 = 1,03448

Для признака «Выпуск продукции»

  σ N2 / σn2 =  20651944,46 / 19963546,31 = 1,03448

Степень расхождения:  σ N2 / σn2 = n / n-1 = 30 / 29 = 1,034

Степень расхождения между уn2 и yN2 для обоих признаков отсутствует. Рассчитываем прогнозные оценки размаха вариации RN и сравниваем с Rn:

Для признака «Среднегодовая стоимость основных производственных фондов»

RN = 6σ = 6 *                   3 809,5    = 22857

Rn= 6σ = 6 * 3 745,5 = 22473

R = 22857 – 22473 = 384

Для признака «Выпуск продукции»

RN = 6σ = 6 *           4 544,4    = 27266,4

Rn = 6σ = 6 *          4 468,1   = 26806,6

R = 27266,4 – 26806,6 = 457,8

Прогнозные оценки размаха вариации для обоих признаков практически  отсутствуют.

2. а) Для признака «Среднегодовая стоимость основных производственных фондов» - 695,5млн. руб.

Для признака «Выпуск продукции» - 829,7 млн. руб.

    б) Хср-∆Х ≤Хср≤Хср +∆Х

предельную ошибку выборки найдем по формуле

t – коэффициент доверия,

Дове-рительная вероят-

ность Р

Коэффи-

циент

доверия t

Предельные ошибки выборки

Ожидаемые границы для средних

Для первого признака

Для второго признака

Для первого признака

Для второго признака

0,683

1

649

774

21 391

-

22 689

19 769

-

21 317

0,954

2

1 297

1 548

20 743

-

1 297

18 995

-

22 091

0,997

3

1 946

2 322

20 094

-

23 337

18 222

-

22 865

3.  AsN = |0,2102| - указывает на незначительную величину асимметрии, а    EkN = -0,345 указывает на умеренную величину эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по признаку «Среднегодовая стоимость основных производственных фондов», будет близко к нормальному. Распределение единиц генеральной совокупности по признаку «Выпуск продукции» AsN = 0,0152 и EkN = -0,205 указывает на незначительную величину асимметрии и эксцесса соответственно.

Вывод

1) После удаления аномальных значений коэффициент вариации Vσ признака «Среднегодовая стоимость основных производственных фондов» составляет 17,0112%, исходя из оценочной шкалы находится в диапазоне   0%< Vσ≤40%. – колеблемость незначительная.

Однородность совокупности для нормального и близких к нормальному распределений устанавливается по условию: Vσ≤33%.

Коэффициент вариации Vσ признака «Среднегодовая стоимость основных производственных фондов» составляет 17,0112%, что свидетельствует об однородности изучаемой совокупности.

Коэффициент вариации Vσ признака «Выпуск продукции» составляет 16,9941%, что свидетельствует об однородности изучаемой совокупности.

Чем однороднее изучаемая совокупность, тем надежнее полученная средняя.

2) Если /σ < 0,8, так как это условие соблюдается можно сделать вывод об устойчивости индивидуальных значений признака Среднегодовая стоимость основных производственных фондов и признака выпуска продукции, то есть среди них отсутствуют «аномальные» варианты значений, значения признака устойчивы.

3) полученные значения процентного соотношения рассеяния для наших признаков близки к значениям процентного соотношения признаков, распределенных по нормальному закону, исходя из этого можно сделать вывод о том, что наше распределение близко к к нормальному.

4) а)Vσ1< Vσ2 (Vσ1 = 16,9941   Vσ2 = 21,749) поэтому колеблемость единиц совокупности для первого признака меньше, чем для второго.

б) количественная однородность единиц выше для второго признака по сравнению с первым, исходя из значений показателя коэффициента вариации

в) для второго признака средняя арифметическая величина является более надежной характеристикой чем для первого (исходя из значений показателя коэффициента вариации)

г) поскольку  x < Me < Mo и Asп1 < 0 для первого признака характерна левосторонняя асимметрия (Asп1= -0,210). Поскольку x > Me >Mo и Asп2>0 для второго признака характерна правосторонняя асимметрия Asп = 0,0152. Так как для обоих признаков |As| ≤ 0,25 – асимметрия незначительная.

5) при анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам) .