ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
«Автоматизированный априорный анализ статистической совокупности
в среде MS Excel»
Вариант № 223
Выполнила: ст. III курса гр. Экономика труда
Ф-т: Менеджмента и маркетинга
Проверила: преподаватель Теймурова Т.Ю.
Калуга, 2007г.
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35.
|
Исходные данные |
||||
|
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
||
|
1 |
12140,00 |
11587,50 |
||
|
2 |
14277,50 |
12712,50 |
||
|
3 |
14727,50 |
14175,00 |
||
|
4 |
15515,00 |
15750,00 |
||
|
5 |
10115,00 |
7875,00 |
||
|
6 |
16302,50 |
13500,00 |
||
|
7 |
16752,50 |
18225,00 |
||
|
8 |
12590,00 |
12375,00 |
||
|
9 |
15402,50 |
14512,50 |
||
|
10 |
17765,00 |
18112,50 |
||
|
11 |
19452,50 |
19125,00 |
||
12 |
6740,00 |
16875,00 |
|||
|
13 |
14840,00 |
15075,00 |
||
|
14 |
16302,50 |
16425,00 |
||
|
15 |
18665,00 |
19912,50 |
||
|
16 |
21365,00 |
21375,00 |
||
|
17 |
15965,00 |
14400,00 |
||
|
18 |
17652,50 |
17100,00 |
||
|
19 |
14052,50 |
10687,50 |
||
|
20 |
17877,50 |
14625,00 |
||
|
21 |
19902,50 |
19687,50 |
||
|
22 |
13715,00 |
11137,50 |
||
|
23 |
10902,50 |
10462,50 |
||
|
24 |
18215,00 |
16762,50 |
||
|
25 |
16302,50 |
14625,00 |
||
|
26 |
15177,50 |
13837,50 |
||
|
27 |
11802,50 |
9000,00 |
||
|
28 |
15852,50 |
14062,50 |
||
|
29 |
18327,50 |
15412,50 |
||
|
30 |
17427,50 |
14625,00 |
||
|
31 |
21365,00 |
5625,00 |
||
|
32 |
12815,00 |
13050,00 |
||
Рис.1. Таблица исходных данных
Задание 1. Выявление и удаление из выборки аномальных единиц наблюдения.
Задание 2. Оценка описательных статистических параметров совокупности.
Задание 3. Построение и графическое изображение интервального вариационного ряда распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов.
Задание 1
1. Исходные данные после удаления «аномальных» значений представлены в табл.1
Таблица 1
Исходные данные после удаления «аномальных» значений
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
1 |
12140,00 |
11587,50 |
2 |
14277,50 |
12712,50 |
3 |
14727,50 |
14175,00 |
4 |
15515,00 |
15750,00 |
5 |
10115,00 |
7875,00 |
6 |
16302,50 |
13500,00 |
7 |
16752,50 |
18225,00 |
8 |
12590,00 |
12375,00 |
9 |
15402,50 |
14512,50 |
10 |
17765,00 |
18112,50 |
11 |
19452,50 |
19125,00 |
13 |
14840,00 |
15075,00 |
14 |
16302,50 |
16425,00 |
15 |
18665,00 |
19912,50 |
16 |
21365,00 |
21375,00 |
17 |
15965,00 |
14400,00 |
18 |
17652,50 |
17100,00 |
19 |
14052,50 |
10687,50 |
20 |
17877,50 |
14625,00 |
21 |
19902,50 |
19687,50 |
22 |
13715,00 |
11137,50 |
23 |
10902,50 |
10462,50 |
24 |
18215,00 |
16762,50 |
25 |
16302,50 |
14625,00 |
26 |
15177,50 |
13837,50 |
27 |
11802,50 |
9000,00 |
28 |
15852,50 |
14062,50 |
29 |
18327,50 |
15412,50 |
30 |
17427,50 |
14625,00 |
32 |
12815,00 |
13050,00 |
С целью исключения из выборки аномальных единиц наблюдения среди исходных данных были найдены два резко выделяющихся значения признаков («выбросов» данных). Они представлены в (Табл.2)
Таблица 2
Аномальные единицы наблюдения
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
12 |
6740,00 |
16875,00 |
31 |
21365,00 |
5625,00 |
Так как между среднегодовой стоимостью основных производственных фондов и выпуском продукции прямая корреляционная зависимость (рис.2),то для предприятий №12 и 31 такая зависимость не наблюдается. Следовательно, это могут быть предприятия, которые имеют другую специализацию или среднегодовая стоимость основных производственных фондов не соответствует данным предприятиям, т.о. аномальные значения показателей являются предметом отдельного исследования.
Рис. 2. Диаграмма рассеяния после исключения аномальных значений
Задание 2
Используя, инструмент Описательная статистика можно рассчитать многие из обобщающих статистических показателей совокупности. Описательные статистики представлены в (Табл. 3 – 4б).
Таблица 3
Описательные статистики
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Столбец1 |
Столбец2 |
||
|
|
|
|
Среднее |
15740 |
Среднее |
14673,75 |
Стандартная ошибка |
496,80119 |
Стандартная ошибка |
592,6411606 |
Медиана |
15908,75 |
Медиана |
14568,75 |
Мода |
16302,5 |
Мода |
14625 |
Стандартное отклонение |
2721,092184 |
Стандартное отклонение |
3246,029322 |
Дисперсия выборки |
7404342,672 |
Дисперсия выборки |
10536706,36 |
Эксцесс |
-0,344943844 |
Эксцесс |
-0,205332365 |
Асимметричность |
-0,152503649 |
Асимметричность |
0,042954448 |
Интервал |
11250 |
Интервал |
13500 |
Минимум |
10115 |
Минимум |
7875 |
Максимум |
21365 |
Максимум |
21375 |
Сумма |
472200 |
Сумма |
440212,5 |
Счет |
30 |
Счет |
30 |
Уровень надежности(95,4%) |
1035,737066 |
Уровень надежности(95,4%) |
1235,545384 |
Таблица 4а
Предельные ошибки выборки
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Столбец1 |
|
Столбец2 |
|
|
|
|
|
Уровень надежности(68,3%) |
505,8456875 |
Уровень надежности(68,3%) |
603,4304695 |
Таблица 4б
Предельные ошибки выборки
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Столбец1 |
Столбец2 |
||
|
|
|
|
Уровень надежности(99,7%) |
1609,338694 |
Уровень надежности(99,7%) |
1919,802871 |
Для анализа статистических свойств некоторых дополнительных выборочных показателей используется инструмент Мастер функций
Таблица 5
Выборочные показатели вариации и асимметрии
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." |
По столбцу "Выпуск продукции, млн.руб" |
||
Стандартное отклонение |
2675,356285 |
Стандартное отклонение |
3191,470321 |
Дисперсия |
7157531,25 |
Дисперсия |
10185482,81 |
Среднее линейное отклонение |
2152,5 |
Среднее линейное отклонение |
2458,5 |
Коэффициент вариации, % |
16,99718097 |
Коэффициент вариации, % |
21,74952089 |
Коэффициент асимметрии |
-0,21025237 |
Коэффициент асимметрии |
0,015275091 |
Задание 3
Для выявления структуры совокупности и типа закономерности распределения её единиц по варьирующему признаку, строят и анализируют интервальный вариационный ряд распределения и его гистограмму.
Для этого необходимо произвести разбиение единиц совокупности на интервалы:
Таблица 6
Карман |
Частота |
10115 |
1 |
12365 |
3 |
14615 |
5 |
16865 |
11 |
19115 |
7 |
Ещё |
3 |
Карман |
Частота |
|
1 |
12365 |
3 |
14615 |
5 |
16865 |
11 |
19115 |
7 |
21365 |
3 |
а) первичная б) итоговая
Таблица 7
Интервальный ряд распределения предприятий по стоимости основных производственных фондов
Карман |
Частота |
Интегральный % |
12365 |
4 |
13,33% |
14615 |
5 |
30,00% |
16865 |
11 |
66,67% |
19115 |
7 |
90,00% |
21365 |
3 |
100,00% |
Еще |
0 |
100,00% |
Таблица 8
Интервальный ряд распределения предприятий по стоимости основных производственных фондов
Группы предприятий по стоимости основных фондов |
Число предприятий в группе |
Накопленная частость группы |
10115-12365 |
4 |
13,33% |
12365-14615 |
5 |
30,00% |
14615-16865 |
11 |
66,67% |
16865-19115 |
7 |
90,00% |
19115-21365 |
3 |
100,00% |
Итого |
30 |
100% |
Для наглядного представления интервальных рядов распределения используют их графическое представление в виде гистограммы и кумуляты.
Рис. 3. Гистограмма и кумулята интервального ряда распределения
Анализ к задаче
1) У наибольшего числа предприятий 18 или 60% среднегодовая стоимость основных средств составляет от 14615 до 19115 млн.руб. Остальные три группы предприятий по величине среднегодовой стоимости основных средств распределены равномерно: у наименьшего числа предприятий 3 или 10% - составляет от 19115 до 21365 млн.руб.; 4 предприятия или 13,33% располагают основными средствами со среднегодовой стоимостью от 10115 до 12365 млн.руб.; 5 предприятий или 16,67% - от 12365 до 14615 млн.руб.
2) Среднее значение среднегодовой стоимости основных производственных фондов составляет 15740 млн.руб., а среднее выпуска продукции – 14673,75 млн.руб.
Значение моды 16302,5 млн.руб. показывает, что в большинстве предприятий среднегодовая стоимость основных средств в среднем на одно предприятие составляет 16302,5 млн.руб. Значение моды 14625 млн.руб. показывает, что в большинстве предприятий выпуск продукции в среднем на одно предприятие составляет 14625 млн.руб. Мода совокупности по среднегодовой стоимости основных производственных фондов, больше её средней величины следовательно в распределении чаще встречаются более низкие значения признака. А мода совокупности по выпуску продукции меньше её средней величины, что означает преимущественное появление в распределении более высоких значений признака.
Значение медианы 15908,75 показывает, что примерно половина предприятий с размером среднегодовой стоимости основных средств на одном предприятии не более 15908,75 млн. руб., а другая половина – не меньше 15908,75 млн. руб. Значение медианы 14568,75 показывает, что примерно половина предприятий с размером выпуска продукции на одном предприятии не более 14568,75 млн. руб., а другая половина – не меньше 14568,75 млн. руб.
Так как коэффициент вариации равен 16,99718097% по столбцу «Среднегодовая стоимость основных средств, млн.руб.», а по столбцу «Выпуск продукции, млн.руб.» - 21,74952089% (т.е. меньше 40%), следовательно колеблемость признака незначительная в обоих случаях. Кроме того, совокупности являются количественно однородными по своим признакам (Среднегодовая стоимость основных средств, млн.руб. в одном случае и Выпуск продукции, млн.руб. – в другом), т.к. коэффициент вариации меньше 33%. Колеблемость признака в первой совокупности незначительнее, чем во второй. Так как Vs первой совокупности меньше второй то можно предположить, что она однороднее по своему признаку, следовательно её средняя надёжнее, чем у другой совокупности.
Так как коэффициент асимметрии по признаку среднегодовая стоимость основных средств меньше нуля (-0,21025237), то наблюдается левосторонняя асимметрия, а по признаку выпуск продукции больше нуля (0,015275091) – правосторонняя асимметрия. В обоих случаях асимметрия незначительная ().
Так как коэффициент эксцесса в обоих случаях меньше нуля (-0,344943844 и -0,205332365), следовательно вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от хmax до xmin.
3) Ожидаемые средние величины среднегодовой стоимости основных фондов:
15234,15432 16245,84568 с доверительной вероятностью 68,3%;
(с вероятностью 0,683 можно утверждать, что расхождение между выборочной и генеральной средними не превысит величины средней ошибки выборки).
14704,26294 16775,73706 с доверительной вероятностью 95,4%;
(с вероятностью 0,954 можно утверждать, что расхождение между выборочной и генеральной средними не превысит двукратной величины средней ошибки выборки).
14130,66131 17349,33869 с доверительной вероятностью 99,7%.
(с вероятностью 0,997 можно утверждать, что расхождение между выборочной и генеральной средними не превысит трёхкратной величины средней ошибки выборки).
4) Ожидаемые средние величины выпуска продукции на предприятиях:
114070,3195415277,18046 с доверительной вероятностью 68,3%;
(с вероятностью 0,683 можно утверждать, что расхождение между выборочной и генеральной средними не превысит величины средней ошибки выборки).
13438,20462 15909,29538 с доверительной вероятностью 95,4%;
(с вероятностью 0,954 можно утверждать, что расхождение между выборочной и генеральной средними не превысит двукратной величины средней ошибки выборки).
12753,94713 16593,55287 с доверительной вероятностью 99,7%.
(с вероятностью 0,997 можно утверждать, что расхождение между выборочной и генеральной средними не превысит трёхкратной величины средней ошибки выборки).