ПРИЛОЖЕНИЕ 1
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант №__3__
Выполнил: ст. III курса гр.________
_____________________
Ф.И.О.
Проверил:________ ___________
Должность Ф.И.О.
Москва,
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35.
|
|
Таблица 1 |
|
Исходные данные |
|
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
1 |
98,00 |
103,00 |
2 |
117,00 |
113,00 |
3 |
121,00 |
126,00 |
4 |
128,00 |
140,00 |
5 |
80,00 |
70,00 |
6 |
135,00 |
120,00 |
7 |
139,00 |
162,00 |
8 |
102,00 |
110,00 |
9 |
127,00 |
129,00 |
10 |
148,00 |
161,00 |
12 |
50,00 |
150,00 |
11 |
163,00 |
170,00 |
13 |
122,00 |
134,00 |
14 |
135,00 |
146,00 |
15 |
156,00 |
177,00 |
16 |
180,00 |
190,00 |
17 |
132,00 |
128,00 |
18 |
147,00 |
152,00 |
19 |
115,00 |
95,00 |
20 |
149,00 |
130,00 |
21 |
167,00 |
175,00 |
22 |
112,00 |
99,00 |
23 |
87,00 |
93,00 |
24 |
152,00 |
149,00 |
25 |
135,00 |
130,00 |
26 |
125,00 |
123,00 |
27 |
95,00 |
80,00 |
28 |
131,00 |
125,00 |
29 |
153,00 |
137,00 |
31 |
180,00 |
50,00 |
30 |
145,00 |
130,00 |
32 |
104,00 |
116,00 |
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения – линейное () и квадратическое (σn), коэффициент вариации (Vσ), структурный коэффициент асимметрии К.Пирсона (Asп).
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценим:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().
4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Статистический анализ генеральной совокупности
1. Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
2. Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
3. Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Распечатка рабочего файла с результативными таблицами и графиками
|
|
Таблица 1 |
|
Исходные данные |
|
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
1 |
260,00 |
257,50 |
2 |
307,50 |
282,50 |
3 |
317,50 |
315,00 |
4 |
335,00 |
350,00 |
5 |
215,00 |
175,00 |
6 |
352,50 |
300,00 |
7 |
362,50 |
405,00 |
8 |
270,00 |
275,00 |
9 |
332,50 |
322,50 |
10 |
385,00 |
402,50 |
11 |
422,50 |
425,00 |
13 |
320,00 |
335,00 |
14 |
352,50 |
365,00 |
15 |
405,00 |
442,50 |
16 |
465,00 |
475,00 |
17 |
345,00 |
320,00 |
18 |
382,50 |
380,00 |
19 |
302,50 |
237,50 |
20 |
387,50 |
325,00 |
21 |
432,50 |
437,50 |
22 |
295,00 |
247,50 |
23 |
232,50 |
232,50 |
24 |
395,00 |
372,50 |
25 |
352,50 |
325,00 |
26 |
327,50 |
307,50 |
27 |
252,50 |
200,00 |
28 |
342,50 |
312,50 |
29 |
397,50 |
342,50 |
30 |
377,50 |
325,00 |
32 |
275,00 |
290,00 |
Рис. 1. Аномальные значения признаков на диаграмме рассеяния.
|
|
Таблица 2 |
Аномальные единицы наблюдения |
||
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
12 |
140,00 |
375,00 |
31 |
465,00 |
125,00 |
|
|
|
Таблица 3 |
Описательные статистики |
|||
Среднегодовая стоимость основных производственных фондов, млн.руб. |
|
Выпуск продукции, млн. руб. |
|
Столбец1 |
|
Столбец2 |
|
|
|
|
|
Среднее |
340 |
Среднее |
326,0833333 |
Стандартная ошибка |
11,04002645 |
Стандартная ошибка |
13,16980357 |
Медиана |
343,75 |
Медиана |
323,75 |
Мода |
352,5 |
Мода |
325 |
Стандартное отклонение |
60,46871519 |
Стандартное отклонение |
72,13398493 |
Дисперсия выборки |
3656,465517 |
Дисперсия выборки |
5203,311782 |
Эксцесс |
-0,344943844 |
Эксцесс |
-0,205332365 |
Асимметричность |
-0,152503649 |
Асимметричность |
0,042954448 |
Интервал |
250 |
Интервал |
300 |
Минимум |
215 |
Минимум |
175 |
Максимум |
465 |
Максимум |
475 |
Сумма |
10200 |
Сумма |
9782,5 |
Счет |
30 |
Счет |
30 |
Уровень надежности(95,4%) |
23,01636907 |
Уровень надежности(95,4%) |
27,45655194 |
|
|
|
Таблица 4а |
Предельные ошибки выборки |
|||
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Столбец1 |
|
Столбец2 |
|
|
|
|
|
Уровень надежности(68,3%) |
11,24101883 |
Уровень надежности(68,3%) |
13,40957022 |
|
|
|
Таблица 4б |
Предельные ошибки выборки |
|||
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Столбец1 |
|
Столбец2 |
|
|
|
|
|
Уровень надежности(99,7%) |
35,76317284 |
Уровень надежности(99,7%) |
42,66239431 |
|
|
|
Таблица 5 |
|
Выборочные показатели вариации и асимметрии |
|
|
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Стандартное отклонение |
60,46871519 |
Стандартное отклонение |
72,21747227 |
Дисперсия |
3428,165874 |
Дисперсия |
5035,523187 |
Среднее линейное отклонение |
46,45659929 |
Среднее линейное отклонение |
54,56004756 |
Коэффициент вариации, % |
17,78491623 |
Коэффициент вариации, % |
22,14693757 |
Коэффициент асимметрии |
-0,206718465 |
Коэффициент асимметрии |
0,015000987 |
|
Таблица 6 |
Карман |
Частота |
|
1 |
265 |
3 |
315 |
5 |
365 |
11 |
415 |
7 |
465 |
3 |
|
|
|
|
Таблица 7 |
Интервальный ряд распределения предприятий по стоимости основных производственных фондов |
||
Группа предприятий по стоимости основных фондов |
Число предприятий в группе |
Накопленная частость группы.% |
215-265 |
4 |
13,33% |
265-315 |
5 |
30,00% |
315-365 |
11 |
66,67% |
365-415 |
7 |
90,00% |
415-465 |
3 |
100,00% |
Итого |
30 |
100,00% |
Выводы о статистических свойствах изучаемой совокупности
Анализ выборочной совокупности.
Задача 1. Выявлено 2 аномальные единицы наблюдения предприя тия № 12 и 31(см табл.2).
Задача 2. Рассчитанные выборочные показатели представлены в двух таблицах - табл.3 и табл.5. На основе этих таблиц сформируем единую таблицу значений выборочных показателей, перечисленных в условии Задачи 2 (табл.8)
|
|
Таблица 8 |
Описательные статистики выборочной совокупности |
||
|
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
Среднее |
340 |
326,0833333 |
Медиана Ме |
343,75 |
323,75 |
Мода Мо |
352,5 |
325 |
Стандартное отклонение σn |
60,46871519 |
72,21747227 |
Дисперсия |
3428,165874 |
5035,523187 |
Среднее линейное отклонение |
46,45659929 |
54,56004756 |
Коэффициент вариации, % Vσ |
17,78491623 |
22,14693757 |
Коэффициент асимметрии Asп |
-0,206718465 |
0,015000987 |
Задача 3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценим:
3а) Степень колеблемости признака определяем по значению коэффициента вариации Vs, исходя из оценочной шкалы.
0%<Vs40% - колеблемость незначительная;
40%< Vs60% - колеблемость средняя (умеренная);
Vs>60% - колеблемость значительная.
В нашем случае по двум признакам колеблемость незначительная.
3б) Совокупность однородная, так как выполняется условие Vs33%.
3в) Сопоставление средних отклонений – квадратического s и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.
В условиях симметричного и нормального, а также близких к ним распределений между показателями s и имеют место равенства
s1,25, 0,8s,
поэтому отношение показателей и s может служить индикатором устойчивости данных: если
>0,8, (21)
то значения признака неустойчивы, в них имеются «аномальные» выбросы.
По признаку Среднегодовая стоимость основных производственных фондов, млн.руб =0,76, по признаку Выпуск продукции, млн.руб =0,75.
Следовательно, данные устойчивы.
3г) Определим количество попаданий индивидуальных значений признаков в диапазоны (), (), ()
Таблица 9
Распределение значений признака по диапазонам
рассеяния признака относительно
|
Границы диапазонов |
Количество значений xi, находящихся в диапазоне |
||
|
Первый признак |
Второй признак |
Первый признак |
Второй признак |
(279.53; 400.47) |
(253.86;398.30) |
20 (66,6%) |
19 (63,3%) |
|
(219.06;460.94) |
(181.64;470.51) |
28 (93.3%) |
28 (93,3%) |
|
(158.59;512.40) |
(109.43;542.73) |
30 (100%) |
30 (100%) |
По правилу «трех сигм». В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:
68,3% войдет в диапазон ();
95,4% попадет в диапазон ();
99,7% появится в диапазон ()
Сравнивая с найденным распределением, правило трех сигм не выполняется.
Задача 4. Дадим сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
Колеблемость первого признака меньше коллеблемости второго признака. Единицы совокупности распределены однороднее по первому признаку. Средние значения признаков надежнее определены по первому признаку. Коэффициент асимметрии отрицателен по первому признакам, следовательно, наблюдается скос влево от нормального распределения, по второму признаку наблюдаем противоположную ситуацию – скос вправо.
Задача 5. Построим интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов (таб. 7) и установим характер (тип) этого распределения.
Если гистограмма имеет одновершинную форму, есть основания предполагать, что выборка является однородной по данному признаку Гистограмма не симметрична, ее “хвосты” большие ( более 5% вариантов лежат за пределами интервала []), значит она представляет распределение, не достаточно близкое к нормальному
Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.
Для полученного интервального ряда значение моды Мо рассчитывается по формуле:
где: хМо – нижняя граница модального интервала;
h – величина модального интервала;
fMo – частота модального интервала;
fMo-1 – частота интервала, предшествующего модальному;
fMo+1 – частота интервала, следующего за модальным.
Полученные значения Мо=345 следует сравним со значениями моды из табл. 3 352.Причина расхождения, в первом случае мы рассчитываем по сгруппированным данным, а не по самим значениям..
Анализ генеральной совокупности.
Задача 1.
|
|
Таблица108 |
Описательные статистики генеральной совокупности |
||
|
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
Стандартное отклонение |
60,46871519 |
72,13398493 |
Дисперсия выборки |
3656,465517 |
5203,311782 |
Эксцесс |
-0,344943844 |
-0,205332365 |
Асимметричность |
-0,152503649 |
0,042954448 |
Установим степень расхождения между по формуле . расхождение на 1%.
расхождение на 0,7%.
Расхождение незначительное.
Прогнозные оценки размаха вариации RN рассчитаем по формуле
Для Среднегодовая стоимость основных производственных фондов, млн.руб. RN =6sN=6*60,46=362,76 Rn=250
.Для Выпуск продукции, млн. руб. RN =6sN=6*72,13=432,78 Rn=300
Для каждого признака прогнозное значение RN отличается от Rn., это объясняется не достаточной близостью распределения единиц генеральной совокупности к нормальному.
Задача 2. Средние ошибки выборки рассчитаны и приведены в табл.3 (параметр Стандартная ошибка).
. |
Среднегодовая стоимость основных производственных фондов, млн.руб |
Выпуск продукции, млн. руб. |
Стандартная ошибка |
23,01636907 |
27,45655194 |
Предельные ошибки выборки
Таблица 11
Предельные ошибки выборки
и ожидаемые границы для генеральных средних
Доверительная вероятность Р |
Коэффициент доверия t |
Предельные ошибки выборки |
Ожидаемые границы для средних |
||
для первого признака |
для второго признака |
для первого признака |
для второго признака |
||
0,683 |
1 |
11,24101883 |
13,40957022 |
328351 |
312339 |
0,954 |
2 |
23,01636907 |
27,45655194 |
316363 |
298353 |
0,997 |
3 |
35,76317284 |
42,66239431 |
304375 |
283368 |
Задача 3 Значения коэффициентов асимметрии As и эксцесса Ek имеются в табл.10.
Значение показателей σN2 и σn2 расходятся незначительно.
| AsN |0,25 - асимметрия незначительная
EkN<0, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin |EkN| незначительно отличается от нуля.
Коэффициенты, AsN и EkN указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.
Экономическая интерпретация результатов статистического исследования предприятий
Среднее значение среднегодовой стоимости основных производственных фондов 340 млн.руб. С вероятностью 0,954 среднее значение ОПФ буден находиться в пределах от 316 до 363 млн.руб. При этом средний выпуск продукции 326 млн.руб., с той же вероятностью он будет находиться в пределах от 298 до 353 млн.руб.
С увеличением Основных производственных фондов, выпуск продукции увеличивается.