ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1

«Автоматизированный априорный анализ статистической совокупности  в среде MS Excel»

Вариант №344

Выполнил: ст. III курса гр. день

         Ф.И.О.

Проверил: Теймурова Т. Ю.

                            Ф.И.О.

Калуга -2007-

1. Постановка задачи.

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Таблица 1

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

18674,00

17819,00

2

21961,00

19549,00

3

22653,00

21798,00

4

23864,00

24220,00

5

15560,00

12110,00

6

25075,00

20760,00

7

25767,00

28026,00

8

19366,00

19030,00

9

23691,00

22317,00

10

27324,00

27853,00

12

10370,00

25950,00

11

29919,00

29410,00

13

22826,00

23182,00

14

25075,00

25258,00

15

28708,00

30621,00

16

32860,00

32870,00

17

24556,00

22144,00

18

27151,00

26296,00

19

21615,00

16435,00

20

27497,00

22490,00

21

30611,00

30275,00

22

21096,00

17127,00

23

16771,00

16089,00

24

28016,00

25777,00

25

25075,00

22490,00

26

23345,00

21279,00

27

18155,00

13840,00

28

24383,00

21625,00

29

28189,00

23701,00

31

32860,00

8650,00

30

26805,00

22490,00

32

19712,00

20068,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

1.      Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (),  моду (Мо), медиану (Ме), размах вариации (R), дисперсию (), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (Vσ), структурный коэффициент асимметрии  К.Пирсона (Asп).

2.      На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

3.      Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

4. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

1.      Статистический анализ  генеральной совокупности. Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение  и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

2.      Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

2. Выполнение статистических расчетов.

Задание1

1. Построим точечную диаграмму рассеяния изучаемых признаков.

2. Найдем на диаграмме аномальные точки.

Рис.1

В нашем случаи это точки 12(10370,00; 25950,00) и  31 (32860,00; 8650,00)

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12

10370,00

25950,00

31

32860,00

8650,00

3.      Удаляем эти точки из таблицы исходных данных.

После исключения аномальных наблюдений первичные данные принимают вид, представленный в таблице 1а.

                            Таблица 1а

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

18674,00

17819,00

2

21961,00

19549,00

3

22653,00

21798,00

4

23864,00

24220,00

5

15560,00

12110,00

6

25075,00

20760,00

7

25767,00

28026,00

8

19366,00

19030,00

9

23691,00

22317,00

10

27324,00

27853,00

11

29919,00

29410,00

13

22826,00

23182,00

14

25075,00

25258,00

15

28708,00

30621,00

16

32860,00

32870,00

17

24556,00

22144,00

18

27151,00

26296,00

19

21615,00

16435,00

20

27497,00

22490,00

21

30611,00

30275,00

22

21096,00

17127,00

23

16771,00

16089,00

24

28016,00

25777,00

25

25075,00

22490,00

26

23345,00

21279,00

27

18155,00

13840,00

28

24383,00

21625,00

29

28189,00

23701,00

30

26805,00

22490,00

32

19712,00

20068,00

Задание2

1. Произведем расчет описательных параметров выборочной и генеральной совокупности с использованием инструмента описательная статистика.

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

Среднее

24210

Среднее

22564,96667

Стандартная ошибка

763,96983

Стандартная ошибка

911,350407

Медиана

24469,5

Медиана

22403,5

Мода

25075

Мода

22490

Стандартное отклонение

4184,435091

Стандартное отклонение

4991,671757

Дисперсия выборки

17509497,03

Дисперсия выборки

24916786,93

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

17300

Интервал

20760

Минимум

15560

Минимум

12110

Максимум

32860

Максимум

32870

Сумма

726300

Сумма

676949

Счет

30

Счет

30

Уровень надежности(95,4%)

1592,73274

Уровень надежности(95,4%)

1899,993395

Чтобы определить значение признака, характерное для всей изучаемой совокупности единиц, прибегают к расчету средних величин. Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности

Мода МО - значение случайной величины, встречающееся с наибольшей вероятностью, в дискретном вариационном ряду - вариант, имеющий наибольшую частоту. Моды вычисляется по формуле:

Где Хмо - нижняя граница модального интервала;   i мо - модальный интервал;   fMO, fMo-1, fMo+1 - частоты в модальном, предыдущем и следующем за модальным   интервалах (соответственно)

 

Медиана Me - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части - со значениями признака меньше медианы и со значениями признака больше медианы. Медиана определяется по формуле:

Хме - нижняя граница медианного интервала;  i ме - величина медианного интервала;  f ме - частота  медианного интервала;  SMe-1 - накопленная частота интервала предшествующего медианному интервалу

2. Оценим предельные ошибки выборки для различных уровней  надежности в режиме  описательная статистика.

Для уровня надежности 68,3% при р=0,683

Таблица 4а

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

Уровень надежности(68,3%)

777,8785028

Уровень надежности(68,3%)

927,9422593

Для уровня надежности 99,7% при р=0,997

Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

Уровень надежности(99,7%)

2474,811561

Уровень надежности(99,7%)

2952,237686

 

Предельные ошибки выборки  ∆ позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы. Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:

 

3.      Произведем расчеты описательных параметров выборочной совокупности с использованием инструмента мастера функции.

3.1 Расчет выборочного стандартного отклонения σn для признаков Среднегодовой стоимости основных производственных фондов и выпуска продукции;

3.2Расчет выборочной дисперсии  по признакам Среднегодовой стоимости основных производственных фондов и Выпуска продукции;

3.3 Расчет выборочного среднего линейного отклонения по изучаемым признакам;

3.4 Расчет коэффициента вариации Vσ по изучаемым признакам;

3.5 Расчет выборочного коэффициента асимметрии Пирсона Asn  по изучаемым признакам.

Таблица 5

Выборочные показатели вариации и асимметрии

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

4114,103442

Стандартное отклонение

4907,772139

Дисперсия

16925847,13

Дисперсия

24086227,37

Среднее линейное отклонение

3310,066667

Среднее линейное отклонение

3780,626667

Коэффициент вариации, %

16,99340538

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности

Показатели асимметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

Задание3

1. Построение промежуточной таблицы.

Таблица 6

Карман

Частота

1

19020

3

22480

5

25940

11

29400

7

32860

3

 

 

 

2. Генерация выходной таблицы и графиков.

3. Приведение выходной таблицы и диаграммы к виду, принятому в статистике.

Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группа предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы.%

15560-19020

4

13,33%

19020-22480

5

30,00%

22480-25940

11

66,67%

25940-29400

7

90,00%

29400-32860

3

100,00%

 

 

 

Итого

30

 

Рис.2  График – диаграмма распределение предприятий по стоимости основных производственных фондов и выпуску продукции.

Гистограмма – это столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда. На отрезках строят прямоугольники, высота которых в принятом масштабе по оси ординат соответствует частотам.

 

 

Заключение

В совокупности из 32 - х предприятий наблюдается взаимосвязь между стоимостью основных производственных фондов и объемом выпуска продукции. Однако предприятие № 12 и предприятие № 31 резко отличаются от общих тенденций. Так, например, предприятие № 12 имеет наименьшую стоимость основных средств и большой объем выпуска продукции. Следовательно, оно может специализироваться на другой отрасли, этот признак не специфичен. В предприятии № 31 наблюдается обратная ситуация, оно имеет большую стоимость основных средств и небольшой объем выпуска продукции. Следовательно, этот признак специфичен. Таким образом, мы выявили наличие среди исходных данных резко выделяющиеся значения признаков с целью исключения из выборки аномальных единиц наблюдения. Аномальные единицы наблюдения представлены в таблице 2.

Анализ средней показывает, что среднегодовая стоимость основных производственных фондов составляет  24210 млн. руб., а выпуск продукции 22564,96667 млн. руб.

Анализ моды показывает, что наиболее часто встречающийся показатель среднегодовой стоимости основных производственных фондов имеет значение 25075 млн. руб. По столбцу «Выпуск продукции» наиболее часто встречающимся показателем  является значение   22490  млн. руб.

Анализ медианы показывает, что из 30 предприятий 15 имеют среднегодовую стоимость основных  производственных фондов более 24469,5млн. руб., а другие 15 предприятий менее. Также значение медианы говорит о том, что из 30 предприятий 15 имеют выпуск продукции более 22403,5 млн. руб., а другие 15 предприятий менее.

Анализ предельных ошибок выборки определяет ожидаемые границы для средних. С вероятностью 0,683 можно утверждать, что среднегодовая стоимость основных  производственных фондов одного предприятия по всем предприятиям отрасли будет находиться в пределах от 20026,56 до 28394,44;  с вероятностью 0,954 в пределах от  15841,12 до 32578,87;  с вероятностью 0,997 от 11656,69 до 36763,31. Также можно утверждать, что с вероятностью 0,683 средний выпуск продукции одного предприятия по всем предприятиям отрасли будет находиться в пределах от 17573,29 до 27556,64; с вероятностью 0,954 в пределах от 12581,62 до 32548,31;  с вероятностью 0,997 в пределах от 7589,95  до  37539,98.

Анализ коэффициента эксцесса (Еk) определяется следующими показателями:

Для первого признака коэффициент (Еk= -0,344943844) Еk<0, следовательно вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним. Для второго признака  (Еk= -0,205332365) Еk<0, следовательно вершина кривой распределения лежит выше вершины нормальной кривой, а форма кривой более островершинной по сравнению с нормальной.

Анализ коэффициентов вариации определяет, что степень колеблемости значений признаков в совокупности  незначительная, поскольку полученные значения коэффициентов вариации для двух признаков располагаются в пределах 0%<Vσ<40% т.е. для первого признака коэффициент вариации равен 16,99379059% а для второго признака 21,74952089%. Совокупность по изучаемым признакам является количественно однородной, так как выполняется неравенство Vσ<33%, характерное для нормальных и близких к нормальному распределений. Поскольку значение показателя вариации для каждого признака невелико, то индивидуальные значения признака  мало отличаются друг от друга, единицы наблюдения количественно однородны и следовательно, средняя арифметическая величина каждого признака является надежной характеристикой данной совокупности.

Анализ показателей асимметрии говорит о том, что поскольку  < Me < Mo и  Asn1 < 0  для первого признака характерна левосторонняя асимметрия (Asn1 = -0,152503649),  а для второго признака  характерна правостороння асимметрия, т.к.  (Asn2 = 0,042954448)  < Me < Mo и  Asп2 > 0  . Так как для обоих признаков 0,25, то асимметрия незначительная.

Рассматривая таблицу № 7 и график можно сделать вывод, что наибольшее число предприятий 18 или 60% имеют среднегодовую стоимость основных производственных фондов от 22480 до 24975. Наименьшее число предприятий 3 или 10% имеют среднегодовую стоимость основных производственных фондов от 24975 и выше.