Принципы и этапы построения группировок
РЕФЕРАТ
По дисциплине «Статистика»
Тема: «Принципы и этапы построения группировок»
СОДЕРЖАНИЕ
Введение
Виды группировок
Принцип построения статистических группировок
Комбинированная группировка на примере рейтинга Forbes
Заключение
Список использованных источников
ВВЕДЕНИЕ
Как известно, одним из важнейших понятий статистики является группировка. Группировкой называется расчленение изучаемой совокупности на однородные группы по определенным существенным признакам.
На основе метода группировок решаются центральные задачи исследования, обеспечивается правильное применение других методов статистического и статистико-математического анализа.
Работа по составлению группировок сложная и трудная. Приемы группировок разнообразны, что обусловлено разнообразием группировочных признаков и различными задачами исследования. К основным задачам, решаемым с помощью группировок относятся:
выделение социально -экономических типов;
изучение структуры совокупности, структурных сдвигов в ней;
выявление связи между явлениями и взаимозависимости.
В данной работе мы рассмотрим виды группировок, принципы их построения, а также пример группировки на основе интересующей нас отрасли шоу-бизнеса.
1. виды группировок
В зависимости от задач, решаемых с помощью группировок, выделяют 3 типа группировок: типологические, структурные и аналитические.
Типологическая группировка решает задачу выявления социально-экономических типов. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Исходят при этом из сущности изучаемого явления.
Структурная группировка решает задачу изучения состава отдельных типических групп по какому-то признаку. Например, распределение постоянного населения по возрастным группам.
Аналитическая группировка позволяет выявить взаимосвязи между явлениями и их признаками, т.е. выявить влияние одних признаков (факторных) на другие (результативные). Взаимосвязь проявляется в том, что с возрастанием факторного признака возрастает или убывает значение результативного признака. В основе аналитической группировки всегда лежит факторный признак, а каждая группа характеризуется средними величинами результативного признака.
Например, зависимость объема розничного товарооборота от величины торговой площади магазина. Здесь факторный (группировочный) признак - торговая площадь, а результативный - средний на 1 магазин объем товарооборота.
По сложности группировка бывает простой и сложной (комбинированной).
В простой группировке в основании один признак, а в сложной - два и более в сочетании (в комбинации). В этом случае сначала группы образуются по одному (основному) признаку, а затем каждая из них делится на подгруппы по второму признаку и т.д. Это позволяет изучить совокупность сразу по нескольким признакам. (таблица 1.1.)
Таблица 1.1.
Группировка сельхозпредприятий по наличию сельхозугодий и основных фондов на 1 работника по области за отчетный период.
№ групп |
Группы сельхозпредприятий |
Количество сельхозпред-приятий |
Получено валовой продукции на 100 га сельхозугодий, тыс.руб |
|
по наличию сельхозугодий на 1 работника, га |
По размеру основных фондов на 1 работника, тыс.руб (фондовооружен-ность) |
|||
1 |
7,1-11,0 |
до 2,0 2,0-2,5 2,5 и более |
36 25 19 |
15,5 18,3 19,3 |
Всего по группе |
80 |
17,1 |
||
2 |
11,1-15,0 |
до 2,0 2,0-2,5 2,5 и более |
7 38 24 |
14,8 14,9 17,6 |
Всего по группе |
69 |
15,8 |
||
3 |
15,1-19,0 |
до 2,0 2,0-2,5 2,5 и более |
3 11 7 |
12,8 12,9 12,9 |
Всего по группе |
21 |
12,9 |
||
Итого |
170 |
15,8 |
Группировка показывает, что с ростом фондовооруженности труда увеличивается выпуск продукции на 100 га сельхозугодий, а с увеличением наличия сельхозугодий на 1 работника выпуск продукции на 100 га сельхозугодий уменьшается.
Комбинационные группировки очень важны в экономических исследованиях. Однако в них по мере увеличения группировочных признаков растет число групп и таблица становится малообозримой. Многофакторный анализ способна дать лишь система простых и комбинированных группировок
2. Принцип построения статистических группировок
При проведении любой группировки сначала определяется группировочный признак, т.е. по которому расчленяется совокупность на группы. Группировочный признак может иметь количественное выражение, либо быть атрибутивным (качественным). Первые имеют числовое выражение (объем товарооборота, возраст человека, доход семьи и т.д.), а вторые отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, профессия рабочего, форма собственности и т.д.).
Следующим этапом группировки является определение числа групп. В группировках с атрибутивным признаком в основании число групп зависит от количества типов, а интервал соответствует переходу явления из одного качества в другое. В группировках с количественным признаком в основании число групп рекомендуется брать с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц совокупности. Интервалы таких группировок могут быть равными и неравными, а неравные в свою очередь - возрастающими и убывающими.
В группировках с равным интервалом число групп можно рассчитать математическим путем. С использованием, например, формулы Стерджесса: n=1+3.322lgN, где n - число групп, а N - число единиц совокупности. Согласно этой формуле выбор числа групп зависит от объема совокупности. Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и если распределение единиц по группировочному признаку близко к нормальному. Поэтому есть ряд других формул, но каждая имеет свои недостатки.
Если размах вариации группировочного признака (разность между максимальным и минимальным его значениями в совокупности) велик и значения признака изменяются (варьируют) неравномерно, то надо использовать группировку с неравным интервалом. (таблица 2.1.).
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна. Возрастающий интервал может возрастать в арифметической прогрессии, а может - в геометрической. Использование неравного интервала более обосновано, но представляет большую трудность. Такую группировку можно составить только на основе знания исходного материала, его анализа и личного опыта специалиста. Главное условие и в этом случае, чтобы не было “пустых” или малочисленных групп.
Когда определено число групп, то следует определить интервалы группировки. Величина интервала - это разность между верхними или нижними его границами. Величину равновеликого интервала можно определить по формуле
, где xmax - максимальное значение группировочного признака в совокупности, а xmin- минимальное. При образовании интервалов необходимо точно обозначить границы групп. По непрерывно варьирующим признакам образуют непрерывный интервал, т.е. такой, в котором верхняя граница предыдущего интервала равна нижней границе последующего интервала (таблица 2.1.). По прерывно варьирующим признакам образуют прерывный интервал, где верхняя граница предыдущего интервала не равна нижней границе последующего интервала (таблица 1.1.).
Интервалы группировки могут быть закрытыми и открытыми. Закрытые интервалы имеют обе (верхнюю и нижнюю) границы (таблица 2.1. по основному признаку). Открытые - только одну из низ (таблица 2.1. и таблица 1.1. по второму признаку).
Таблица 2.1.
Распределение персонала строительной фирмы по уровню среднемесячного дохода.
Группы работающих по уровню среднемесячного дохода, руб. |
Число работающих, чел. |
В % к итогу |
А |
1 |
2 |
До 500 500-1000 |
16 20 |
14,5 18,2 |
А |
1 |
2 |
1000-2000 2000-4000 4000 и более |
44 21 9 |
40,0 19,1 8,2 |
Итого |
110 |
100,0 |
При непрерывном интервале встает вопрос в какую группу, например в таблице 2.1. включить работников с уровнем дохода в 1000 рублей во вторую или первую?
Это зависит от применяемого принципа включения. Можно по принципу "до" - тогда во вторую группу, если же по принципу "включительно" - то в первую. Главное чтобы это соблюдалось во всех группах без исключения. Однако, принято в случае "включительно" оговариваться, т.е. указывать на это в примечании.
Величину интервала в расчетах можно, а порою и нужно, округлять. При этом следует помнить, что по непрерывно варьирующим признакам, если величина интервала получилась целой без округления или округление произведено в меньшую сторону, последнюю группу необходимо делать с открытым интервалом, иначе максимальное значение (по принципу "до") не войдет в группу.
Группировка, в которой известна только численность групп или удельный вес группы в общем итоге называется рядом распределения. Ряды распределения как и всякие другие группировки могут быть по количественному и атрибутивному признаку. Ряд распределения по количественному признаку может быть дискретным и интервальным. В дискретных рядах распределения варианты признака имеют значения целых чисел, т.е. между ними не может быть никаких промежуточных значений. Например, распределение рабочих по тарифному разряду, когда группировочный признак в каждой группе конкретное число 2 разряд, 3, 4, 5, 6. В интервальных же рядах распределения группировочный признак может принимать любые значения в некотором промежутке (таблицы 1.1. и 2.1.).
От группировок следует отличать классификации. Классификация - это систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основе их сходства и различия. В основе классификации всегда атрибутивный (качественный) признак. Классификации стандартны, устойчивы и неизменны в течение длительного периода времени. Например, классификация отраслей народного хозяйства, классификация затрат на производство по экономическим элементам, классификация основных фондов и т.д.
3. комбинированная группировка на примере рейтинга forbes
Чтобы понять, как работают группировки, рассмотрим рейтинг звезд шоу-бизнеса, ежегодно составляемый журналом Forbes, в котором одновременно учитываются три фактора доходы артиста, количество упоминаний в СМИ и запросы в поисковике «Яндекс». То есть данная группировка комбинированная.
Таблица 3.1. Топ-50 звезд 2011 года по данным Forbes
Место |
Имя |
Кто это |
Доход, $ млн |
Упоминания в бумажной прессе |
Запросы в «Яндексе» |
1 |
Стас Михайлов |
Эстрадный певец |
20 |
77 |
14400000 |
2 |
Мария Шарапова |
Теннисистка |
24.8 |
153 |
420000 |
3 |
Алла Пугачева |
Эстрадная певица |
4.8 |
426 |
5140000 |
4 |
Александр Овечкин |
Хоккеист |
14 |
995 |
510000 |
5 |
Григорий Лепс |
Эстрадный певец |
12 |
75 |
4480000 |
6 |
Филипп Киркоров |
Эстрадный певец |
5.8 |
398 |
5300000 |
7 |
Николай Басков |
Эстрадный певец |
8.4 |
208 |
1870000 |
8 |
Ксения Собчак |
Телеведущая |
2.8 |
329 |
2360000 |
9 |
Елена Ваенга |
Эстрадная певица |
6.4 |
77 |
8220000 |
10 |
Дима Билан |
Эстрадный певец |
4.3 |
232 |
3780000 |
11 |
Андрей Аршавин |
Футболист |
8 |
167 |
920000 |
12 |
Максим Галкин |
Телеведущий |
6.3 |
194 |
1340000 |
13 |
Никита Михалков |
Режиссер, сценарист, продюсер, актер |
2.2 |
397 |
1140000 |
14 |
Валерия |
Эстрадная певица |
4.7 |
85 |
3310000 |
15 |
Иван Ургант |
Телеведущий, актер, эстрадный певец |
2.5 |
206 |
780000 |
16 |
Кристина Орбакайте |
Эстрадная певица |
2.7 |
197 |
1810000 |
17 |
Валерий Меладзе |
Эстрадный певец |
5.2 |
80 |
2810000 |
18 |
Илья Ковальчук |
Хоккеист |
7 |
59 |
430000 |
19 |
Ранетки |
Рок-группа |
0.7 |
52 |
13280000 |
20 |
Жанна Фриске |
Эстрадная певица, телеведущая, актриса |
1.1 |
135 |
2580000 |
21 |
Тина Канделаки |
Телеведущая, продюсер |
2 |
169 |
820000 |
22 |
Анастасия Заворотнюк |
Актриса, телеведущая |
2 |
120 |
1580000 |
23 |
Анастасия Волочкова |
Балерина |
0.8 |
171 |
3970000 |
24 |
Андрей Малахов |
Телеведущий |
1.5 |
186 |
1430000 |
25 |
Эдгард и Аскольд Запашные |
Дрессировщики |
4.4 |
71 |
3330000 |
26 |
Мумий Тролль |
Рок-группа |
3.8 |
82 |
1500000 |
27 |
Гарик Мартиросян |
Продюсер, телеведущий, сценарист |
2.8 |
80 |
430000 |
28 |
Сергей Светлаков |
Телеведущий, актер, сценарист |
3 |
87 |
230000 |
29 |
Тимати |
Эстрадный певец |
1.5 |
104 |
3530000 |
30 |
Валерий Леонтьев |
Эстрадный певец |
3.8 |
61 |
1130000 |
31 |
Игорь Акинфеев |
Футболист |
3.8 |
97 |
450000 |
32 |
Александр Цекало |
Продюсер, телеведущий, актер |
2.5 |
107 |
160000 |
33 |
Земфира |
Рок-музыкант |
2.3 |
117 |
2820000 |
34 |
Сергей Лазарев |
Эстрадный певец, актер |
1.1 |
119 |
1960000 |
35 |
Евгений Плющенко |
Фигурист |
1.4 |
119 |
260000 |
36 |
Михаил Галустян |
Актер |
2.7 |
61 |
820000 |
37 |
Валерий Гергиев |
Дирижер |
3.2 |
53 |
50000 |
38 |
Сергей Трофимов |
Эстрадный певец |
2.6 |
16 |
2610000 |
39 |
Максим Аверин |
Актер, телеведущий |
0.8 |
120 |
480000 |
40 |
Роман Павлюченко |
Футболист |
2.9 |
108 |
200000 |
41 |
Юрий Антонов |
Эстрадный певец |
2.8 |
48 |
1450000 |
42 |
Федор Бондарчук |
Режиссер, сценарист, продюсер, актер, телеведущий |
1 |
116 |
210000 |
43 |
Павел Воля |
Телеведущий, актер, эстрадный певец |
2.1 |
54 |
1190000 |
44 |
Олег Газманов |
Эстрадный певец |
2 |
61 |
1090000 |
45 |
Юрий Шевчук |
Рок-музыкант |
1 |
91 |
2790000 |
46 |
Андрей Кончаловский |
Режиссер, сценарист, продюсер |
1.6 |
72 |
340000 |
47 |
Гоша Куценко |
Актер |
1.4 |
71 |
380000 |
48 |
Дарья Донцова |
Писатель, телеведущая |
1.5 |
54 |
1220000 |
49 |
Сергей Шнуров |
Рок-музыкант, композитор, телеведущий, актер |
1.2 |
104 |
670000 |
50 |
Лариса Долина |
Эстрадная певица |
0.8 |
101 |
900000 |
Как можно заметить из таблицы, все три фактора рассматриваются одновременно, к примеру Николай Басков зарабатывает больше Филиппа Киркорова, но количество запросов в «Яндексе» и статей в прессе про него гораздо меньше, потому он и ниже в списке, Александр Цекало и Иван Ургант имеют одинаковый уровень дохода, но между их популярностью большая разница, потому их разделяют аж 17 пунктов рейтинга и т.д.
Заключение
Подводя итоги, скажем, что сложный на первый взгляд метод группировок используется в огромном количестве сфер нашей жизни, и хотя некоторые группировки, публикуемые в разных источниках, не всегда корректно составлены, заметим, что данный метод универсален и невероятно удобен для систематизации информации, с уменьшением у людей количества свободного времени группировки, составленные профессионалами, дают возможность человеку сэкономить большой запас времени, который он мог потратить на самостоятельное изучение признаков, по которым группировка составлялась. Данный факт еще раз подчеркивает удивительную пользу, которую приносит человечеству статистика.
Список использованных источников
Герчук Я.П. Графики в математическо-статистическом анализе. М.: Статистика, 1972.
Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. М.:ИНФРА-М, 1996.
http://www.forbes.ru/rating/50-zvezd-2011/2011#pages-1
Принципы и этапы построения группировок