ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ



КАФЕДРА СТАТИСТИКИ




О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1


«Автоматизированный априорный анализ статистической совокупности

 в среде MS Excel»


Вариант №   1









                                                                         Выполнил: ст. III курса гр.  1

                                                                                                 Козленко Т.В


           Проверил:      Яценко Г.Н

     







Курск , 2006 г.

 

 

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35.

 

Исходные данные


Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

152,00

154,50

2

180,50

169,50

3

186,50

189,00

4

197,00

210,00

5

125,00

105,00

6

207,50

180,00

7

213,50

243,00

8

158,00

165,00

9

195,50

193,50

10

227,00

241,50

11

249,50

255,00

13

188,00

201,00

14

207,50

219,00

15

239,00

265,50

16

275,00

285,00

17

203,00

192,00

18

225,50

228,00

19

177,50

142,50

20

228,50

195,00

21

255,50

262,50

22

173,00

148,50

23

135,50

139,50

24

233,00

223,50

25

207,50

195,00

26

192,50

184,50

27

147,50

120,00

28

201,50

187,50

29

234,50

205,50

30

222,50

195,00

32

161,00

174,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности

1.    Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

2.    Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(σ²n), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (), структурный коэффициент асимметрии  К.Пирсона (Asn).

3.    На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

4.    Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5.    Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

 

 

 

Статистический анализ  генеральной совокупности

1.               Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение  и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

2.               Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

3.               Рассчитать коэффициенты асимметрии Asn и эксцесса Ek. На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
















Априорный статистический анализ данных.

                                                                                                                                                       Таблица 1


Исходные данные



Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.


1

152,00

154,50


2

180,50

169,50


3

186,50

189,00


4

197,00

210,00


5

125,00

105,00


6

207,50

180,00


7

213,50

243,00


8

158,00

165,00


9

195,50

193,50


10

227,00

241,50


11

249,50

255,00


13

188,00

201,00


14

207,50

219,00


15

239,00

265,50


16

275,00

285,00


17

203,00

192,00


18

225,50

228,00


19

177,50

142,50


20

228,50

195,00


21

255,50

262,50


22

173,00

148,50


23

135,50

139,50


24

233,00

223,50


25

207,50

195,00


26

192,50

184,50


27

147,50

120,00


28

201,50

187,50


29

234,50

205,50


30

222,50

195,00


32

161,00

174,00












Таблица 2


Аномальные единицы наблюдения


Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.


12

80,00

225,00


31

275,00

75,00















Таблица 3

Описательные статистики

Столбец1

 

Столбец2

 

 

 

 

 

Среднее

200

Среднее

195,65

Стандартная ошибка

6,624015867

Стандартная ошибка

7,901882142

Медиана

202,25

Медиана

194,25

Мода

207,5

Мода

195

Стандартное отклонение

36,28122912

Стандартное отклонение

43,28039096

Дисперсия выборки

1316,327586

Дисперсия выборки

1873,192241

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

150

Интервал

180

Минимум

125

Минимум

105

Максимум

275

Максимум

285

Сумма

6000

Сумма

5869,5

Счет

30

Счет

30

Уровень надежности(95.4%)

13,80982755

Уровень надежности(95.4%)

16,47393845

Уровень надежности(95,4%)

 

Уровень надежности(95,4%)

 










 


Таблица 4а


Предельные ошибки выборки

Столбец1

 

Столбец2

 

 

 

 

 

Уровень надежности(68.3%)

6,744609167

Уровень надежности(68.3%)

8,045739593

Уровень надежности(68,3%)

 

Уровень надежности(68,3%)

 












Таблица 4б


Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

 

 

 

 

Уровень надежности(99.7%)

21,45784925

Уровень надежности(99.7%)

25,59737162












Таблица 5


Выборочные показатели вариации и асимметрии


По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

35,67141713

Стандартное отклонение

42,55293762

Дисперсия

1272,45

Дисперсия

1810,7525

Среднее линейное отклонение

28,7

Среднее линейное отклонение

32,78

Коэффициент вариации, %

538,5164807

Коэффициент вариации, %

538,5164807

Коэффициент асимметрии

-0,831399917

Коэффициент асимметрии

-0,831399917






Таблица 6



 

Частота


125

1



155

3



185

5



215

11



245

7


 

275

3



 

 









Таблица 7


Интервальный ряд распределения предприятий  по стоимости основных производственных фондов


Карман

Частота

Интегральный %


155

4

13,33%


185

5

30,00%


215

11

66,67%


245

7

90,00%


275

3

100,00%


Итого

30

 











 Анализ выборочной совокупности.


1.    В результате проведенного исследования и данных таблицы 3 выявлено две аномальных  единицы наблюдения.

2.     С учетом данных таблиц 3 и 5 сформируем единую таблицу значений выборочных показателей табл. 8

 

«Описательные статистики выборочной совокупности.»

                                                                                                           Таблица 8                                   

Показатели

По столбцу

«Среднегодовая стоимость основных производственных фондов»

По столбцу

 « Выпуск продукции»

Ср. арифм.   Χ  ̃̃

200,000

195,650

Мода МO

207,500

195,000

Медиана Ме

202,250

194,250

Размах вариации R

150,000

180,000

Диспрсия  σ²n

1272,450

1810,752

Ср.линейное отклонение d

28,700

32,780

Стандар. отклонение σn

35,671

42,553

Коэф-т вариации Vσ ¯

538,516

538,516

Коэф-т  ассиметрии ASn

-0,831

-0,831


3.а) Т.к. степень колеблемости признака определяется по значению коэффициента вариации Vσ , то исходя из оценочной шкалы Vσ > 60% мы можем сделать вывод, что колеблемость значений признаков в совокупности  значительная, т.к. и по первому, и по второму признакам мы имеем 538,51 >60%.


б) Т.К. 538,51  > 33%, то совокупность является количественно не однородной по данному признаку.


в) Сопоставление средних отклонений -  квадратического σ и линейного d позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

Имеют место равенства :    σ = 1,25d    d = 0,8 σ.

σ =1,25*28,7=35,875;                  σ = 1,25*32,78=40,975;

d = 0,8*35,875=28,7;                    d = 0,8*40,975=32,78.

Отношение показателей может служить индикатором устойчивости данных :

d/σ =28,7/35,875=0,8 – для первого признака

     d/σ =32,78/40,975=0,8 - для второго признака.

     Т.к. соотношения равны 0,8, то значения признаков устойчивы, в них не   имеются « аномальные выбросы».    

     

г)Для нахождения количества попаданий индивидуальных значений признаков в диапазоны ( х±σ ),(х±2σ),(х±3σ) составим таблицу 9.


Распределение значений признака по диапазонам рассеяния признака относительно х.

                                                                                                                  Таблица 9


Границы диапазона

Количество значений хi находящихся в диапазоне


Для признака «Среднегодовая стоимость основных произ-ных фондов»

Для признака  « Выпуск продукции»

Для признака «Среднегодовая стоимость основных произ-ных фондов»

Для признака  « Выпуск продукции»

х -σn ≤хi≤х+σn

164,329≤х≤235,671

159,979≤х≤231,321

71

71

х-2σn≤хi≤х+2σn

128,658≤х≤271,671

123,979≤х≤266,992

143

143

х -3σ ≤хi ≤х+3σ

92,987≤х≤307,013

88,637≤х≤302,663

214

214


Из таблицы видно, что количество значений хi находящихся в данных диапазонах одинаково по обоим признакам и процентное соотношение равно: для (х±σn) – 71%, (х±2σn)  – 143%, (х±3σ) – 214 %.

4.а) Т.к. коэффициент вариации Vσ показывает интенсивность колеблемости признака, то на основе таблицы 5 сделаем вывод, что  Vσ  обоих признаков имеет одинаковое значение Vσ=538,516, следовательно Vσ>60%, следовательно колеблемость признака значительная.

б) Показатель Vσ служит индикатором совокупности, следовательно при выполнении условия Vσ<33% совокупность является количественно однородной , в нашем случае совокупность является не однородной .т.к. Vσ=538,513 >33%.


в) Так как оценка Vσ достаточно высока ,т.е. Vσ>40% (Vσ=538,513), то наблюдается значительное расхождение между значениями хi , т.е. средняя х ненадежная характеристика совокупности и ее практическое применение становится проблематичным.


г) Коэффициент К.Пирсона для признака «Среднегодовая стоимость основных произ-ных фондов» ASn  = -0,831,т.е. ASn <0, следовательно, здесь присутствует левосторонняя ассиметрия. Для  признака «Выпуск продукции»

ASn = -0,831 , т.е. ASn <0,следовательно ассиметрия – левосторонняя.


д) Значение моды М0  полученного интервального ряда данных находится дальше от значения средней арифметической , чем значение моды не сгруппированного ряда (207,5-200=7,5 ; 195-200=5).Это говорит о том , что кривая распределения полученного интервального ряда данных менее симметрична относительно оси симметрии , чем кривая распределения не сгруппированного ряда.



Анализ генеральной совокупности.


1.     На основе таблицы 3 сформируем отдельную таблицу для генеральных показателей σ²N,  σN, As, Eк .


                     « Описательная статистика генеральной совокупности »

                                                                                                                   Таблица 10.

Показатели

По столбцу

«Среднегодовая стоимость основных производственных фондов»

По столбцу

 « Выпуск продукции»

Генеральн. дисперсия σ²N

1316,328

1873,792

Стандар. отклонение σN

36,281

43,280

Коэф-нт ассиметрии As

-0,153

0,043

Коэф-нт экспресса  Eк .

-0,345

-0,205


Установим степень расхождения между σ²N  и  σ²n  по формуле :

σ²N  = n/n-1 * σ²n  

σ²N  =30/30-1*1272,45=1316,328             σ²N =30-30-1*1810,75=1873,792.

Рассчитаем прогнозные оценки вариации  RN  по следующей формуле:

                                                 RN =6σ.

RN =6*36,28=217,68

RN =6*43,28=259,68

Сравнивая прогнозные значения с Rn =150 , получим  150 < 217,68; 

180 <259,68 , т.е. RN > Rn.

По двум признакам прогнозная оценка размаха вариации в генеральной совокупности больше, чем в выборочной.


а) Средняя ошибка выборки  µx  рассчитана в таблице 3:

Для признака «Среднегодовая стоимость основных производственных фондов» µx = 6,624;

Для признака « Выпуск продукции» µx = 7,902.


б)Оценки предельных ошибок выборки имеются в таблицах 3,4а, 4б.На основе этих оценок и следующей формулы х-Δx≤ x ≤x+Δx сформируем следующую таблицу 11.


«Предельные ошибки выборки и ожидаемые границы для генеральных средних»

                                                                                                                                        Таблица 11

Довер.вероятность р

Коэф-т доверия t

Предельная ошибка выборки

Ожидаемые границы для средних х

0,683

1

6,745

8,046

193,225x206,745

187,604≤х≤203,696

0,954

2

13,810

16,474

186,19≤х≤213,810

179,176≤х≤212,124

0,997

3

21,458

25,597

178,542≤х≤221,458

170,053≤х≤221,247


Для первого признака    200-6,745≤х≤200+6,745

                                             193,255≤х ≤ 206,745 и так далее.

Коэффициенты ассиметрии  Аs и процесса Ек имеются в таблице 10:

   

Аs = - 0,153                          Аs = 0,043

Ек = -0,345                           Ек =-0,205


Т.к    -0,153<0,25;       0,043<0,25,то ассиметрия распределения незначительная.

Т.к. -0,345<0 и -0,205<0, то это говорит о том, что вершина кривой распределения лежит ниже вершины нормальной кривой, в форма кривой более пологая по сравнению с нормальной. Это значит, что прямые формируются в центральной части и достаточно равномерно располагаются по всему диапазону от хмах до хмин..