ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

О Т Ч Е Т

о результатах выполнения

компьютерной лабораторной работы №1

«Автоматизированный априорный анализ статистической совокупности

 в среде MS Excel»

Вариант № 173

                                                                                                                   

                                                                        Выполнила: Кирюхина Ю. О., 3 курс, вечер,                                        

                                                                                               финансы и кредит, 05ффд13662

                                                                                            

                                                                 Проверила: Демидова Л. Н.   

Калуга, 2007 г.

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Для демонстрационного примера (ДП) выборочные данные приведены в табл. 1-ДП.
 Таблица 1-ДП

Исходные данные демонстрационного примера

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

9440,00

9012,50

2

11102,50

9887,50

3

11452,50

11025,00

4

12065,00

12250,00

5

7865,00

6125,00

6

12677,50

10500,00

7

13027,50

14175,00

8

9790,00

9625,00

9

11977,50

11287,50

10

13815,00

14087,50

11

15127,50

14875,00

13

11540,00

11725,00

14

12677,50

12775,00

15

14515,00

15487,50

16

16615,00

16625,00

17

12415,00

11200,00

18

13727,50

13300,00

19

10927,50

8312,50

20

13902,50

11375,00

21

15477,50

15312,50

22

10665,00

8662,50

23

8477,50

8137,50

24

14165,00

13037,50

25

12677,50

11375,00

26

11802,50

10762,50

27

9177,50

7000,00

28

12327,50

10937,50

29

14252,50

11987,50

30

13552,50

11375,00

32

9965,00

10150,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности

1.    Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

2.    Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (Vσ), структурный коэффициент асимметрии  К.Пирсона (Asп).

3.    На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:

 а) степень колеблемости значений признаков в совокупности;

 б) степень однородности совокупности по изучаемым признакам;

 в) устойчивость индивидуальных значений признаков;

г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().

4.    Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений в центральной части ряда.

5.    Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

 

 

Статистический анализ  генеральной совокупности

1.               Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение  и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

2.               Для изучаемых признаков рассчитать:

    а) среднюю ошибку выборки;

  б) предельные ошибки выборки для уровней надежности P=0,683, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.

3.               Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

Результативные таблицы и графики

Таблица 2

Аномальные единицы наблюдения

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12

5240,00

13125,00

31

16615,00

4375,00

Таблица 3

Описательные статистики

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

Столбец2

Среднее

12240

Среднее

11412,91667

Стандартная ошибка

386,4009256

Стандартная ошибка

460,9431249

Медиана

12371,25

Медиана

11331,25

Мода

12677,5

Мода

11375

Стандартное отклонение

2116,405032

Стандартное отклонение

2524,689472

Дисперсия выборки

4479170,259

Дисперсия выборки

6374056,932

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,04295448

Интервал

8750

Интервал

10500

Минимум

7865

Минимум

6125

Максимум

16615

Максимум

16625

Сумма

367200

Сумма

342378,5

Счет

30

Счет

30

Таблица 4а

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

Уровень надежности(68,3%)

393,4355347

Уровень надежности(68,3%)

469,3348096

Таблица 4б

Предельные ошибки выборки

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 

Уровень надежности(99,7%)

1251,7073

Уровень надежности(99,7%)

1493,180011

Таблица 5

Выборочные показатели вариации и асимметрии

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

2080,832666

Стандартное отклонение

2080,832666

Дисперсия

4329864,583

Дисперсия

4329864,583

Среднее линейное отклонение

1674,166667

Среднее линейное отклонение

1912,166667

Коэффициент вариации, %

17,00026688

Коэффициент вариации, %

18,23226022

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,018221872

Таблица 6

Карман

Частота

Интегральный %

7865

1

3,33%

9615

3

13,33%

11365

5

30,00%

13115

11

66,67%

14865

7

90,00%

Свыше 14865

3

100,00%

Таблица 7

Интервальный ряд распределения предприятий  по стоимости основных производственных фондов

Группа предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы.%

7865-9615

4

13,33%

9615-11365

5

30,00%

11365-13115

11

66,67%

13115-14865

7

90,00%

Свыше 14865

3

100,00%

Итого

30

График 1. Диаграмма рассеяния

График 2. Аномальные значения признаков на диаграмме рассеяния

График 3. Гистограмма и куммулята интервального ряда распределения

Статистические свойства изучаемой совокупности

(условия задач определены в п. Постановка задачи)

Экономическая интерпретация результатов статистического

исследования предприятий

Анализ выборочной совокупности

             Задача 1. При проведении статистического исследования однородности совокупности среди исходных данных были выявлены два резко выделяющихся значения признаков («выбросов данных»). Это 12 и 31 единицы наблюдения (см. табл. 2 и граф.). Диаграмма рассеяния (см. граф.1) в целом обладает положительной динамикой, т.е. связь между значениями признаков стоимости основных фондов и выпуска продукции прямая. Согласно графику 1 образующие выборку предприятия по значениям изучаемых экономических показателей типичны, наблюдается прямая корреляционная зависимость, т.е. с увеличением стоимости основных фондов увеличивается и выпуск продукции предприятий. Но для предприятий 12 и 31 такая зависимость отсутствует, т.е стоимость основных фондов не соответствует выпуску продукции. У предприятия 12 выпуск продукции не требует высокой стоимости основных средств (напр. из-за специфической специализации предприятия). На балансе предприятия 31 содержится слишком много основных средств, которые не используются.

 Задача 2. Для представления полученных результатов объединяем описательные статистики (табл. 3) и выборочные показатели вариации и асимметрии (табл. 5) в одну таблицу.

Таблица 8

Описательные статистики выборочной совокупности

По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

Столбец2

 

 

 

 

Среднее

12240

Среднее

11412,91667

Стандартная ошибка

386,4009256

Стандартная ошибка

460,9431249

Медиана

12371,25

Медиана

11331,25

Мода

12677,5

Мода

11375

Стандартное отклонение

2116,405032

Стандартное отклонение

2524,689472

Дисперсия выборки

4479170,259

Дисперсия выборки

6374056,932

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

8750

Интервал

10500

Минимум

7865

Минимум

6125

Максимум

16615

Максимум

16625

Сумма

367200

Сумма

342387,5

Счет

30

Счет

30

Стандартное отклонение

2116,405032

Стандартное отклонение

2524,689472

Дисперсия

4329864,583

Дисперсия

4329864,583

Среднее линейное отклонение

1674,166667

Среднее линейное отклонение

1912,166667

Коэффициент вариации, %

17,00026688

Коэффициент вариации, %

18,23226022

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,018221872

По выборочным данным по 32 предприятиям установлено, что средняя стоимость основных производственных фондов составила 122400 млн. руб., а средний выпуск продукции составил 11412,91667 млн. руб. Стандартная ошибка стоимости основных производственных фондов составила 386,4009256 млн. руб., а  стандартная ошибка  выпуска продукции составила 460,9431249 млн. руб.

Медиана стоимости основных производственных фондов равна 12371,25 млн. руб., означает что половина предприятий выборочной совокупности имеет стоимость больше 12371,25 млн. руб., а другая половина меньше этой величины. Аналогично, по выпуску продукции 50% вариантов больше 11375 млн. руб., 50% – меньше.

Модальное значение стоимости основных производственных фондов составляет 12170 млн. руб., т.е. больше среднего значения, следовательно, в выборке чаще встречаются значения основных производственных фондов выше средней величины. По выпуску продукции мода меньше среднего значения, следовательно, в выборке чаще встречаются значения выпуска продукции ниже средней величины.

По основным производственным фондам имеет место левосторонняя ассиметрия, т.к. <Ме< Мо. Коэффициент ассиметрии равен  -0,21025237, |As| = 0,21025237 (см. табл. 5), т.е. |As|0,21. Имеет место незначительная левосторонняя асимметрия. По выпуску продукции имеет место незначительная правосторонняя ассиметрия (|As|0,21, As=0,018221872).

Коэффициент вариации по основным производственным фондам равен 17,00026688%, т.к. Vs33%, совокупность является количественно однородной

по данному признаку. Коэффициент вариации по выпуску продукции равен 18,23226022%, то  совокупность является количественно однородной по данному признаку. По основным фондам и выпуску продукции Vs не превышает 40%, следовательно, колеблемость незначительная.

Эксцесс по основным производственным фондам равен -0,344943844, т.е. меньше 0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Эксцесс по выпуску продукции равен -0,205332365, т.е. аналогично как в первом признаке.

Задача 3.

а). Степень колеблемости значений признаков относительно их средней величины определяется по значению коэффициента вариации Vs. Коэффициент вариации основных фондов составляет примерно 17% (см. табл. 5). В соответствии с принятой оценочной шкалой колеблемости признака, показатель больше 0% и меньше 40%, т.е. колеблемость незначительная. Коэффициент вариации выпуска продукции равен 18,2% (см. табл. 5), т.е. колеблемость значений выпуска продукции относительно своей средней также незначительная.

б). Для нормальных и близких к нормальному распределений коэффициент вариации Vs служит индикатором  однородности  совокупности. И по стоимости основных фондов, и по выпуску продукции коэффициент вариации ниже 33%, т.е. совокупность является количественно однородной по этим двум признакам. Однако по выпуску продукции совокупность является менее однородной, чем по стоимости основных фондов (18,2%>17%). Чем однороднее изучаемая совокупность, тем надежнее полученная средняя .

в). Сопоставление средних отклонений – квадратического s и линейного  позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

В условиях симметричного и нормального, а также близких к ним распределений между показателями s и  имеют место равенства

s1,25,       0,8s,                           

поэтому отношение показателей  и s может служить индикатором устойчивости данных.

По стоимости основных фондов =1674,166667/2080,832666=0,804566 по выпуску продукции =1912,166667/2080,832666=0,918943. В обоих случаях неравенство >0,8 не выполняется, т.е.  индивидуальные значения среднегодовой стоимости  и выпуска продукции устойчивы и в них нет «аномальных» выбросов, хотя оба признака к этому близки.

г). По значениям показателей  и s можно определить границы диапазонов рассеяния значений признака относительно средней , т.е. установить, какая доля значений признака попадает в тот или иной диапазон отклонений от .

Согласно вероятностной теореме П.Л.Чебышева следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в диапазоне (), а 89% значений - в диапазоне ().

В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:

68,3% войдет в диапазон     ();

99,7% появится в диапазон  ().

Последнее соотношение известно как правило «трех сигм».

Для выборочной совокупности значения  и σn рассчитаны в табл. 3 и табл.5 и являются точными, поэтому, основываясь на правиле «трех сигм», можно точно оценить границы всех трех диапазонов рассеяния признака и определить, сколько значений xi попадает в каждый из диапазонов.

Для стоимости основных фондов:

       

12240-2116,405032 xi 12240+2116,405032

10123,594968≤ xi14356,405032

12240-4063,497662≤ xi12240+4063,497662

8176,502338≤ xi16303,497662

12240-6095,246493≤ xi12240+6095,246493

6144,753507≤ xi18335,246493

Для выпуска продукции:

11412,91667-2524,689472≤ xi11412,91667+2524,689472

8888,227198≤ xi13937,606142

11412,91667-4847,403788≤ xi11412,91667+4847,403788

6565,512882≤ xi16260,320458

11412,91667-7271,105682≤ xi11412,91667+7271,105682

4141,810988≤ xi18684,022352

По данным расчетов формируется таблица с конкретными числовыми значениями границ диапазонов (табл. 8).

                                                                                                                           Таблица 9

Распределение значений признака по диапазонам

рассеяния признака относительно

Границы диапазонов

Количество значений xi, находящихся в диапазоне

Первый признак

Второй признак

Первый признак

Второй признак

10123,594968≤ xi14356,405032

8888,227198≤ xi13937,606142

          20

          21

8176,502338≤ xi16303,497662

6565,512882≤ xi16260,320458

          28

          29

6144,753507≤ xi18335,246493

4141,810988≤ xi18684,022352

          30

          30

Где среднегодовая стоимость основных производственных фондов, млн. руб. это – первый признак, а выпуск продукции, млн. руб. – второй.

66,6% исследуемых единиц войдет в диапазон () по первому признаку и

63,3% по второму;

93,3%  попадет в диапазон ();

100%  появится в диапазоне ().

Полученные процентные отношения близки к эталонным (правилу «трех сигм»), что позволяет сделать вывод о том, что имеет место нормальное распределение или близкий  к нему ряд.

Задача 4. Для проведения сравнительной характеристики распределений единиц совокупности необходимо воспользоваться данными табл. 3 и 5.

а) Показатель вариации Vs используется и для сравнительной оценки вариации в различных рядах распределений, когда сравнивается вариация разных признаков в одной и той же совокупности. Интенсивность колебаний вариантов основных фондов и выпуска продукции незначительна (см. п. 3а), однако коэффициент вариации по второму признаку на 4,8% выше, т.е. варианты значений выпуска продукции рассеяны больше относительно своего центра (среднего значения), чем варианты значений основных фондов.

б) По стоимости основных фондов, и по выпуску продукции коэффициент вариации Vs ниже 33%, т.е. совокупность является качественно однородной по этим двум признакам (см п.3б). Но по первому признаку Vs ниже, чем по второму, т.е. расхождения между значениями по стоимости основных фондов меньше, чем по выпуску продукции. Подтверждением может служить, что размах вариации выборки по первому признаку ниже, чем по второму признаку (см. таб. 3 и 5). Можно сделать вывод, что различия в экономических характеристиках предприятий незначительны, выборка сформирована  из предприятий с достаточно близкими значениями по каждому из показателей. Размах вариации может служить базой расчета возможных резервов предприятия. Таких резервов больше у выпуска продукции, т.е. предприятия загружены не полностью и могут дать больше при максимальной загруженности.

в). Для оценки надежности (типичности) средней величины  можно воспользоваться значением показателя вариации, Vs. Если его значение невелико, то индивидуальные значения признака xi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина  является надежной характеристикой данной совокупности. Если же оценка Vs. достаточно высока (превышает 40%), т.е. наблюдается значительное расхождение между значениями xi, то средняя  будет ненадежной характеристикой совокупности и ее практическое применение становится проблематичным. По основным фондам и выпуску продукции Vs не превышает 40%, т.е. наблюдается значительное расхождение между значениями xi, то средняя  будет ненадежной характеристикой совокупности и ее практическое применение становится проблематичным.

По основным фондам и выпуску продукции Vs не превышает 40%, т.е. средняя арифметическая величина  является надежной характеристикой  совокупности по каждому признаку, но Vs стоимости основных фондов ниже, чем по выпуску продукции, т.е. ее средняя арифметическая величина  является более надежной характеристикой.

г). Мода Мо - наиболее часто встречающаяся величина значений признака или та величина, которая соответствует максимальной ординате эмпирической кривой распределения. Для неоднородной совокупности роль центра распределения обычно выполняет медиана Ме. Т.к. среднее значение, мода и медиана каждого из двух признаков не равны между собой, имеет место смещение ряда распределения (асимметрия). Наиболее точным показателем асимметрии распределения является коэффициент асимметрии As. При As>0 имеет место правосторонняя  асимметрия при As<0 – левосторонняя. В симметричных распределениях As=0.

Чем больше величина |As|, тем более асимметрично распределение. Установлена следующая оценочная шкала асимметричности:

|As|0,25            - асимметрия незначительная;

0,25<|As|0,5     - асимметрия заметная (умеренная);      

|As|>0,5               - асимметрия существенная.

Для среднегодовой стоимости основных производственных фондов асимметрия отрицательная  и |As| = 0,21025237 (см табл. 5), имеет место незначительная левосторонняя асимметрия, т.е. в распределении чаще встречаются более низкие значения признака. Для выпуска продукции асимметрия больше нуля и |As| =0,018221872, т.е. существует правосторонняя незначительная симметрия, преимущественное появление в распределении более высоких значений признака.

Задача 5. Интервальный ряд распределения предприятий по стоимости основных фондов и гистограмма распределения этого ряда приведены в табл. 7 и на графике 3.

Для наглядного представления интервального ряда используют его графическое изображение в виде гистограммы и куммуляты. Форма гистограммы и ее характеристики несут наглядную информацию о распределении единиц совокупности по изучаемому признаку. Вместе с тем, следует иметь в виду, что при незначительном объеме выборки (n<50) слишком углубленный анализ гистограммы может привести к неверным выводам, поскольку слабо выраженные “горбики и ямы” частот могут быть обусловлены не основными факторами, определяющими распределение единиц  по группам, а просто случайными отклонениями вариантов от .

При анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам). Гистограмма имеет одновершинную форму (см граф. 3), есть основания предполагать, что выборка является однородной по данному признаку.

По форме гистограммы можно установить и характер закономерности распределения, т.е. тип функции, описывающей распределение. Так форма гистограммы на графике 3, дает основания предполагать, что распределение эмпирических данных близко к нормальному (наблюдается незначительная асимметрия).

Для интервального ряда (см. табл. 7) значение моды Мо рассчитывается по формуле:

,

где: хМо – нижняя граница модального интервала;

h – величина модального интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+1 – частота интервала, следующего за модальным.

Модальный интервал определяется по наибольшей частоте. В качестве модального интервала берется интервал от 10910 млн. руб. до 12590 млн. руб. (см. граф. 3). Тогда мода интервального ряда распределения будет равна:

Мо=9615 + 1750 * (11 – 5/(11 – 5) + (11 – 7)) = 9615+ 1750 *0,6 = 10665

Итак, модальным значением стоимости основных фондов предприятий совокупности является стоимость, равная 10665 млн. руб. Значение моды несгруппированного ряда данных  составляет 12677,5 млн. руб. Расхождение в значениях  двух мод может быть обусловлено различием методов исчисления, а т. появлением в интервальном вариационном ряду новых неучетных факторов, не зависящих от признака-фактора, положенного в основание группировки.

Анализ генеральной совокупности

Задача 1. Генеральные показатели  рассчитаны с помощью инструмента Описательная статистика и их значения приведены в табл.3. Величина дисперсии генеральной совокупности σ2N, может быть оценена непосредственно по выборочной дисперсии σ2n.

В математической статистике доказано, что при малом числе наблюдений (особенно при n40-50) для вычисления генеральной дисперсии σ2N  по выборочной дисперсии σ2n следует использовать формулу

Отсюда для стоимости основных фондов и для выпуска    продукции поправочный коэффициент составляет 1,0344. Это расхождение существует, т.к. объем выборки составляет всего 10% (n = 32 – 30). Однако расхождение невелико, что позволяет сделать вывод о репрезентативности выборки.

Для нормального распределения справедливо равенство:

R=6s                                            

В условиях близости распределения единиц генеральной совокупности к нормальному, это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.

Так по стоимости основных фондов размах вариации RN составляет 12698,430192, в то время как Rn равен 8750. По выпуску продукции RN равен 15148,136832, а Rn10500, т.е. предельное значение амплитуды колебаний значений признаков в генеральной совокупности выше, т.к. объем выборки мал, распределение единиц близко к нормальному, но таковым не является, а утверждение R=6s справедливо только для нормального распределения.

Среднеквадратическое отклонение является мерой вариации признаков. Для сравнения степени вариации одноименных признаков в разных совокупностях используется коэффициент вариации.  

Таблица 10

Описательные статистики генеральной совокупности

По столбцу "Среднегодовая стоимость основных производственных фондов, млн. руб."

По столбцу "Выпуск продукции, млн. руб."

Стандартное отклонение

2116,405032

Стандартное отклонение

2524,689472

Дисперсия выборки

4479170,259

Дисперсия выборки

6374056,932

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

8750

Интервал

10500

Задача 2. а). Средние ошибки выборки рассчитаны и приведены в табл. 3 (параметр Стандартная ошибка). Для стоимости основных фондов ошибка составляет 386,4009256 млн. руб., а для выпуска продукции 460,9431249 млн. руб. Средняя ошибка выборки находится в обратной зависимости от величины выборки и в прямой от степени варьирования признака, которая характеризуются дисперсией или выборочной долей для альтернативного признака.

б). Средние значения  приведены в табл. 3. Оценки предельных ошибок выборки имеются в табл.3, табл. 4а, табл. 4б. Предельная ошибка выборки  позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы. Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:

,

 

На основе этих данных формируется таблица с абсолютными значениями признаков табл. 10                                                                              

                                                                                     

                        Таблица 11

Предельные ошибки выборки

и ожидаемые границы для генеральных средних

Доверительная

вероятность

       Р

Коэффициент

доверия

     t

Предельные ошибки выборки

Ожидаемые границы для средних

для первого

признака

для второго

признака

для первого

признака

для второго

признака

0,683

1

393,4355347

469,3348096

11862,301767412617,6982326

10962,355110611863,4782294

0,997

3

1251,707873

1493,180011

11038,357392

13441,642608

9979,460221

12846,373119

Таким образом, с вероятностью 0,683 можно утверждать, что средняя стоимость основных фондов предприятий генеральной совокупности колеблется в пределах от 11862,3017674 млн. руб. до 12617,6982326 млн. руб., а средний выпуск продукции – от 10962,3551106 млн. руб. до 11863,4782294 млн. руб.

Аналогично, с вероятностью 0,997 средняя стоимость основных фондоф предприятий генеральной совокупности колеблется в пределах от 11038,357392 млн. руб. до 13441,642608 млн. руб. Средний выпуск продукции с вероятностью 0,997 колеблется в пределах от 9979,460221 млн. руб. до 12846,373119 млн. руб.

В случае генеральной совокупности точно известна только величина σn (табл. 3), а для средней  рассчитаны лишь предельные ошибки выборки (табл.3, табл.4), поэтому для генеральной совокупности оценки рассеяния  значений признака по трем диапазонам являются прогнозными и обычно задаются по правилу «трех сигм» с конкретным числовым значением параметра σn.

Задача 3. Согласно решению задачи 1 анализа генеральной совокупности расхождение значений показателей σNи σn близко к единице,  асимметричность по модулю меньше 0,25 (см. значения табл. 10), что дает основания говорить о незначительной асимметрии. Для оценки расхождений в степени крутизны кривых (при одинаковой силе вариации) применяется коэффициент эксцесса Ek. Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений. Это объясняется тем, что за базу сравнения принята кривая нормального распределения, являющаяся симметричной. Относительно вершины нормальной кривой и определяется выпад вверх или вниз вершины теоретической кривой эмпирического распределения.

И для среднегодовой стоимости основных фондов и для выпуска продукции Ek<0, т.е. вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

Для нормального распределения Ek=0, поэтому чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального. В   частности  отрицательная  величина  Ek  больше    по    первому      признаку   (-0,344943844), чем по второму (-0,205332365), что означает большее преобладание у  первого признака  крайних значений, причем одновременно и более низких, и более высоких. При этом в центральной части распределения может образоваться «впадина», превращающая распределение в двухвершинное (U– образной формы), что является индикатором неоднородности совокупности. Однако величины коэффициента эксцесса по обоим признакам по модулю довольно малы.

  Если распределение единиц выборочной совокупности близко к нормальному, то выборка является репрезентативной (значение показателей σN2 и σn2 расходятся незначительно), и при этом коэффициенты AsN, EkN  указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.