Зведення і групування статистичних даних
Практичні заняття до теми 3: Зведення і групування статистичних даних
Мета: Закріпити теоретичні знання та виробити практичні навички щодо побудови статистичних групувань різного виду, представлення результатів групування у виді рядів розподілу, статистичних таблиць, графіків.
План заняття
- Статистичні групування за однією, двома і більше групувальними ознаками, побудова дискретних та інтервальних рядів розподілу
- Графічне зображення результатів групування
- Побудова аналітичних групувань
- Побудова вторинних групувань
Методичні рекомендації
Статистичні групування за однією, двома і більше групувальними ознаками, побудова дискретних та інтервальних рядів розподілу
У результаті статистичного спостереження отримують матеріали, що містять дані про кожну одиницю сукупності. Цей матеріал потребує спеціальної обробки, зведення розрізнених даних докупи.
Зведення це науково організована попередня обробка матеріалів спостереження, комплекс дій щодо узагальнення конкретних індивідуальних даних щодо одиниць, які утворюють сукупність.
За глибиною узагальнення статистичних даних зведення може бути простим або складним. Просте зведення передбачає визначення підсумкових даних у цілому по сукупності. Складне зведення передбачає спочатку розподіл сукупності на окремі однорідні групи за групувальною ознакою.
Групування це розподіл сукупності на групи за істотними для них ознаками. З точки зору окремих одиниць сукупності, групування це обєднання окремих одиниць сукупності у групи, що є однорідними за якоюсь ознакою. Класифікація групувань представлена на рис. 3.3. Більш детально необхідно розглянути теоретичні питання до теми 3 за курсом лекцій [5].
У системі статистичних методів пізнання масових суспільних явищ групування посідає особливе місце, бо на відміну від інших методів, групування виконує дві функції: по-перше, розподіляє сукупності на однорідні групи по-друге, визначає межі й можливості застосування інших методів статистики, використання яких потребує однорідності статистичних сукупностей.
Рис 3.3
Метод групувань використовують для вивчення структури та структурних зрушень визначення типів соціально-економічних явищ, виокремлення однорідних груп і підгруп виявлення взаємозвязків між ознаками. Для розвязання цих задач використовують відповідні види групувань: структурні, типологічні та аналітичні.
Структурне групування характеризує склад однорідної сукупності за певними ознаками. Різновидом структурних групувань є ряди розподілу. Залежно від групувальної ознаки вони поділяються на атрибутивні та варіаційні. Значення групувальної ознаки називається варіантою. Кожній варіанті відповідає певна частота або частка. Частоти показують, скільки разів повторюються окремі варіанти, а частки характеризують їх питому вагу в сукупності і за суттю є відносними частотами. Варіаційні ряди є базою поглибленого аналізу закономірностей розподілу.
Типологічне групування це розподіл якісно неоднорідної сукупності на класи, соціально-економічні типи, однорідні групи. Для виявлення наявності та напряму звязку між ознаками використовуються аналітичні групування. При вивченні взаємозвязків розглядаються щонайменше дві ознаки. При цьому одна ознака розглядається як результат (результативна ознака), а інша (або інші) розглядаються як фактор, що впливає на результат (факторна ознака або факторні ознаки). Висновок про наявність звязку можна зробити на основі розподілу за двома взаємоповязаними ознаками згідно з характером розміщення частот. Якщо результативна ознака кількісна, для кожної групи за факторною ознакою можна визначити середнє значення результативної ознаки. За наявності звязку між ознаками групові середні результативної ознаки систематично змінюються від групи до групи в бік збільшення чи зменшення.
Групування проводять за однією або кількома ознаками. Групування за однією ознакою є простим, за кількома складним. Складне групування може бути комбінаційним, якщо в його основі послідовно скомбіновано дві та більше ознак, або багатомірним, якщо воно проводиться за кількома ознаками одночасно.
Метод групування базується на двох категоріях групувальній ознаці та інтервалі.
Групувальна ознака це ознака, за якою відбувається обєднання окремих одиниць сукупності в однорідні групи.
Інтервал встановлює кількісні межі груп. Як правило, він являє собою проміжок між максимальним та мінімальним значенням ознаки у групі.
Інтервали бувають:
- рівними, коли різниця між максимальним та мінімальним значенням у кожному з інтервалів однакова. Цю різницю прийнято називати шириною інтервалу
- нерівними, коли ширина інтервалів відрізняється одна від одної
- закритими, коли є нижня та верхня межа
- відкритими, коли є якась одна межа лише верхня або лише нижня.
У численних сукупностях з близьким до нормального розподілом кількість груп (m) орієнтовно можна визначити за формулою Стерджеса:
m = 1 + log2 n, (3.1)
де n обсяг сукупності.
Оскільки кількість інтервалів може бути лише цілим числом, то величина m округлюється або з надлишком (у більший бік незалежно від того, яка цифра стоїть після коми: 1, 3 чи 6 тощо), або за правилами округлення (якщо менше пяти, число округлюється в менший бік, тобто все, що стоїть після коми, відкидається; якщо більше пяти, наприклад, 2,51 або 2,6, число округлюється в більший бік m = 3; якщо після коми стоїть рівно пять, наприклад, 6,5 або 7,5, число округлюється до парного числа, тобто відповідно буде m = 6 або m = 8). Який принцип округлення обрати, залежить від дослідника.
На практиці використовують чотири принципи формування груп:
- рівність інтервалів
- кратність інтервалів
- рівність частот
- якісну сутність ознаки.
Принцип рівних інтервалів, як правило, використовують у структурних і аналітичних групуваннях, а також тоді, коли розподіл ознаки більш менш рівномірний.
Ширина рівного інтервалу (h) розраховується за формулою:
h = (xmax xmin) : m, (3.2)
де xmax максимальне значення ознаки
xmin мінімальне значення ознаки
m число інтервалів.
Якщо діапазон варіації ознаки надто широкий і розподіл значень нерівномірний, але при цьому простежується збільшення або зменшення щільності між варіантами, то використовується принцип кратності інтервалів. При цьому ширина кожного наступного інтервалу в k разів більша або менша попереднього.
Всі інші принципи побудови рядів розподілу розглянути за курсом лекцій [5] підпункт 3.3. «Методологічні засади побудови статистичних групувань».
Графічне зображення результатів групування
Для графічного зображення рядів розподілу використовуються такі види графіків, як:
полігон ламану лінію, що сполучає сукупність ізольованих точок на площині для зображення дискретного ряду розподілу;
гістограма сходинковий лінійний графік - для зображення інтервального варіаційного ряду розподілу;
кумулятивний полігон (або кумулята), кумулятивна гістограма крива або сходинковий графік нагромаджених частот;
огіва тощо.
Правила побудови цих графіків більш детально розглянути за [6, с.74 78; 9, с. 66 68; 13, с. 33 37].
Побудова вторинних групувань
Іноді доводиться перегруповувати дані, тобто перегруповувати статистичні матеріали, раніше зведені в групи. Це дає змогу забезпечити порівнянність структур двох сукупностей за однією й тією ж самою ознакою у часі або просторі.
Перегрупування здійснюється зменшенням або збільшенням кількості раніше утворених груп. Розрізняють два способи вторинного групування:
- просте укрупнення інтервалів;
- перегрупування за часткою окремих груп в загальному їх підсумку (пропорційний дольовий перерозподіл).
Якщо межі інтервалів первинного і вторинного групування збігаються, то частоти інтервалів, що обєднуються, просто підсумовуються.
Вважається, що в межах інтервалу розподіл частот (або часток) підпорядковується рівномірному закону розподілу. Це припущення дає можливість розбивати інтервал первинного групування пропорційно співвідношенню частин ширини розбитого інтервалу і обчислювати відповідні значення частот.
Типовий варіант завдання щодо використання різних методів побудови вторинних групувань наведено у Прикладі 4 розвязання типових задач.
Розробка макетів статистичних таблиць. Аналіз таблиць
Невідємним елементом зведення та групування є статистична таблиця. За логічним змістом статистична таблиця розглядається як “статистичне речення”, тому вона має підмет та присудок. Підмет це обєкт дослідження: перелік елементів сукупності, їх групи, окремі територіальні одиниці або часові інтервали. Як правило, підмет розміщують у лівій частині таблиці у назві рядків, але не обовязково, все залежить від наявної інформації та зручності розташування. Присудок таблиці це система показників, що характеризують підмет як обєкт дослідження. Як правило, присудок формує в логічній послідовності верхні заголовки таблиці. Нижче наведено загальну схему статистичної таблиці, її макет.
Як підмет таблиці, так і її присудок можуть мати різну розробку: просту, групову чи комбінаційну. Залежно від розробки підмета таблиця також може бути простою (простий перелік одиниць сукупності, підмет не ділиться на групи), груповою (групування одиниць за однією ознакою, підмет ділиться на групи за однією ознакою) та комбінаційною (підмет ділиться на групи за декількома ознаками). Розробка присудка на вид таблиці не впливає.
Назва таблиці
Зміст рядків |
Верхні заголовки |
|||
Назви граф (стовпців) (верхні заголовки) |
Підсумкова графа |
|||
А |
1 |
2 |
3 |
|
Найменування рядків (бокові заголовки) |
||||
Підсумковий рядок |
Приклади побудови різних видів таблиць наведені в табл. 3.1 3.4.
Таблиця 3.1
Випуск продукції підприємствами регіону
Ступінь виконання плану,% |
Кількість підприємств |
Випуск валової продукції, млн.. грн.. |
Виконання плану, % |
|
план |
факт |
|||
Не виконали (до 100%) |
4 |
29 |
23,4 |
80,7 |
Виконали (100 -110%) |
7 |
59,4 |
62,5 |
105,2 |
Перевиконали (110 і понад) |
4 |
26,6 |
31,9 |
119,9 |
Разом |
15 |
115 |
117,8 |
102,4 |
Таблиця 3.2
Розподіл промислових підприємств України
за формами власності, 1995 р.
Тип підприємства |
Кількість підприємств, од. |
Питома вага підприємств, (відносна частота), % |
1 |
2 |
3 |
Продовження таблиці 3.2 |
||
1 |
2 |
3 |
1. Приватні підприємства |
1 |
0,01 |
2. Підприємства колективної форми власності |
5030 |
56,32 |
3. Підприємства державної форми власності |
3882 |
43,47 |
4.Інші підприємства |
18 |
0,20 |
Разом підприємств |
8931 |
100,00 |
Таблиця 3.3
Розподіл працівників ВАТ „Захід” за рівнем заробітної плати
Заробітна плата, грн.. |
Кількість робітників, чол.. |
Частота (питома вага), % |
до 1000 |
1 |
1,33 |
від 1000 до 1200 |
6 |
8,00 |
від 1200 до 1400 |
10 |
13,33 |
від 1400 до 1600 |
15 |
20,00 |
від 1600 до 1800 |
18 |
24,00 |
від 1800 до 2000 |
20 |
26,67 |
більше 2000 |
5 |
6,67 |
Разом |
75 |
100,00 |
Таблиця 3.4
Розподіл робітників ЗАТ „Схід” за рівнем кваліфікації
Значення ознаки, хі |
Частота, fі |
Відносна частота, dі |
Нагро-маджена (накопичена, кумулятивна) частота, Sf |
Нагро-маджена відносна частота, Sd |
Кваліфікаційний розряд |
Кількість робітників, чол.. |
Питома вага робітників,% |
||
1 |
3 |
5,2 |
3 |
5,2 |
2 |
6 |
10,4 |
9 |
15,6 |
3 |
8 |
13,8 |
17 |
29,4 |
4 |
13 |
22,4 |
30 |
51,8 |
5 |
22 |
37,9 |
52 |
89,7 |
6 |
6 |
10,3 |
58 |
100,0 |
Разом |
58 |
100,0 |
- |
- |
Задачі для розвязання
Задача 1
Дані про розподіл робітників підприємства за рівнем освіти наведені у таблиці (дані умовні):
Освіта |
2005 р. |
2011 р. |
Вища |
120 |
140 |
Незакінчена вища |
96 |
82 |
Середня спеціальна |
64 |
68 |
Середня |
80 |
70 |
Разом |
360 |
360 |
Визначити: вид групування за функцією та кількістю ознак; вид статистичної таблиці.
Задача 2
Розподіл студентів регіону (тис. осіб) за місцем проживання та навчання наведений у таблиці (дані умовні).
Місце проживання |
Місце навчання |
Разом |
||
Університет |
Інститут |
Академія |
||
Місто |
254 |
835 |
182 |
1271 |
Сільська місцевість |
135 |
367 |
84 |
586 |
Разом |
389 |
1202 |
266 |
1857 |
Визначити: вид групування за функцією та кількістю ознак; вид статистичної таблиці.
Задача 3
Групування робітників цеху за стажем роботи наведено в таблиці (дані умовні). Визначити: вид групування за функцією та кількістю ознак; вид статистичної таблиці.
Розряд робіт-ника |
Групи робітників за стажем роботи, роки |
Чисельність робітників |
Середній стаж роботи, роки |
Місячний випуск продукції, грн. |
|
Разом |
на 1 робітника |
||||
І |
1 4 |
7 |
2,0 |
1534 |
219,14 |
ІІ |
4 7 |
10 |
5,6 |
2532 |
253,20 |
ІІІ |
7 10 |
6 |
8,3 |
1599 |
266,50 |
ІV |
10 13 |
4 |
10,9 |
1112 |
278,00 |
V |
13 16 |
3 |
14,4 |
914 |
304,67 |
Разом |
30 |
6,9 |
7691 |
256,37 |
Завдання 1
Побудувати макет таблиці розподілу населення регіону за статтю, віком та освітою.
Завдання 2
Побудувати макет таблиці, яка б відображала склад населення регіону за працездатністю.
Завдання 3
Побудувати макет таблиці, яка б відображала склад населення регіону за місцем проживання та освітою.
Завдання 4
Наведені дані, що характеризують одиниці сукупності за ознакою Х:
1, 2, 2, 4, 8, 8, 9, 32, 32, 32, 33, 33, 34, 128, 128, 129, 129, 130, 131, 132, 140, 160, 256, 256, 257, 257, 258, 258, 270, 290, 295, 310, 320, 325, 330, 330.
Визначити кількість інтервалів та побудувати інтервальний варіаційний ряд у табличному та графічному вигляді.
Задача 4
За даними обстеження 50 сімей число дітей в них становить:
2 3 1 1 0 4 2 2 1 1
3 4 0 1 0 1 2 1 2 2
1 0 3 1 2 4 5 2 6 3
2 1 7 4 2 0 1 3 2 1
4 1 2 6 3 5 0 2 1 4
Побудувати дискретний варіаційний ряд розподілу сімей за числом дітей і подати його у виді таблиці та графіка.
Задача 5
Заробітна плата працівників фірми має такі значення:
1660 1780 1833 1623 1537 1548 1676 1766 1806 1941
1905 1658 1919 1809 1923 1914 1752 1690 1708 1843
1825 1725 1826 1918 1620 1775 1824 1938 2032 1938
2023 1830 1906 1949 1873 1898 1990 1912 1927 2074
2482 2058 2003 1970 2058 1953 1864 1940 2100 1881
Здійснити групування працівників фірми за рівнем заробітної плати, утворивши такі групи: до 1640; від 1640 до 1740; від 1740 до 1840; від 1840 до 2040; 2040 і більше. Подати його у виді таблиці та графіка.
Задача 6
За результатами спостереження, що проводилося у 50 малих підприємствах регіону, отримані дані про чисельність працівників. Побудувати інтервальний ряд розподілу з трьома рівними інтервалами, результати представити у вигляді таблиці та за результатами групування побудувати графік. Надати необхідні пояснення та зробити висновки.
10 |
11 |
13 |
21 |
22 |
25 |
32 |
24 |
14 |
31 |
21 |
31 |
16 |
27 |
11 |
14 |
19 |
25 |
12 |
32 |
32 |
14 |
17 |
35 |
31 |
12 |
28 |
28 |
26 |
12 |
13 |
17 |
19 |
29 |
40 |
10 |
38 |
34 |
15 |
33 |
11 |
13 |
11 |
11 |
12 |
14 |
28 |
23 |
16 |
37 |
Задача 7
За даними вибіркового обстеження розмір земельної площі у 30 фермерських господарствах одного з регіонів представлена даними таблиці, га.
Побудувати інтервальний ряд розподілу фермерських господарств за розміром земельної площі, утворивши чотири рівних інтервали, результати представити у вигляді таблиці та за результатами групування побудувати графік.
4,0 |
6,8 |
6,4 |
6,0 |
4,2 |
7,5 |
16,0 |
4,5 |
7,1 |
7,4 |
6,5 |
14,8 |
4,4 |
11.4 |
6,8 |
8,0 |
12,9 |
13,1 |
8,5 |
9,4 |
10,6 |
11,5 |
9,5 |
7,2 |
12,7 |
9,5 |
10,7 |
6,5 |
6,1 |
11,2 |
Задача 8
Інформація стосовно стажу роботи робітників підприємства та місячним виробництвом продукції наведена у таблиці.
Побудувати аналітичну таблицю, яка відображала б залежність між стажем роботи та обсягом виробництва продукції, розбивши робітників за стажем роботи на пять груп із рівними інтервалами.
№ з/п |
Стаж роботи, років |
Місячний обсяг виробництва продукції, грн. |
№ з/п |
Стаж роботи, років |
Місячний обсяг виробництва продукції, грн |
||
1 |
1,0 |
220 |
13 |
10,5 |
306 |
||
2 |
6,5 |
310 |
14 |
1,0 |
252 |
||
3 |
9,2 |
327 |
15 |
9,0 |
290 |
||
4 |
4,5 |
275 |
16 |
5,0 |
265 |
||
5 |
6,0 |
280 |
17 |
6,0 |
282 |
||
6 |
2,5 |
253 |
18 |
10,2 |
288 |
||
7 |
2,7 |
245 |
19 |
5,0 |
240 |
||
8 |
16,0 |
340 |
20 |
5,4 |
270 |
||
9 |
13,2 |
312 |
21 |
7,5 |
278 |
||
10 |
14,0 |
352 |
22 |
8,0 |
288 |
||
11 |
11,0 |
325 |
23 |
8,5 |
295 |
||
12 |
12,0 |
308 |
24 |
15,4 |
350 |
Задача 9
Дані про розподіл підприємств двох регіонів за чисельністю працівників наведені у таблиці (дані умовні).
Провести перегрупування підприємств за чисельністю працівників, утворивши такі групи: до 30; від 30 до 60; від 60 до 90; від 90 до 120; від 120 до 150.
І регіон |
ІІ регіон |
||
Чисельність працюючих |
Кількість підприємств |
Чисельність працюючих |
Кількість підприємств |
До 10 |
12 |
До 20 |
17 |
10 20 |
18 |
20 40 |
12 |
20 30 |
16 |
40 50 |
27 |
30 40 |
24 |
50 60 |
32 |
40 50 |
21 |
60 80 |
52 |
50 60 |
18 |
80 100 |
66 |
60 70 |
26 |
100 110 |
58 |
70 80 |
32 |
110 120 |
37 |
80 90 |
40 |
120 140 |
26 |
90 100 |
34 |
140 150 |
33 |
100 110 |
38 |
||
110 120 |
36 |
||
120 130 |
29 |
||
130 140 |
34 |
||
140 150 |
25 |
||
Разом: |
403 |
Разом: |
360 |
Задача 10
Вибіркове дослідження домогосподарств регіону за кількістю членів, середньодушовим доходом та загальними витратами на продукти харчування наведені в таблиці.
Згрупувати домогосподарства окремо за кожною з таких ознак: за кількістю членів домогосподарства; за середньодушовим доходом; за витратами на продукти харчування. Результати групувань подати у табличному вигляді.
Зробити узагальнюючі висновки.
№ з/п |
Кількість членів |
Середньо-душовий дохід, грн. |
Загальні витрати на продукти харчування, грн. |
№ з/п |
Кількість членів |
Середньо-душовий дохід, грн. |
Загальні витрати на продукти харчування, грн. |
|
1 |
5 |
1160 |
1345,6 |
17 |
4 |
1190 |
1368,1 |
|
2 |
3 |
1300 |
1254,1 |
18 |
3 |
1280 |
1297,4 |
|
3 |
4 |
1250 |
1289,7 |
19 |
2 |
1520 |
1398,4 |
|
4 |
4 |
1270 |
1310,2 |
20 |
4 |
1190 |
1152,7 |
|
5 |
3 |
1230 |
1215,3 |
21 |
3 |
1150 |
1196,2 |
|
6 |
2 |
1450 |
1180,6 |
22 |
5 |
1120 |
1299,8 |
|
7 |
4 |
1320 |
1350,8 |
23 |
2 |
1470 |
1264,3 |
|
8 |
3 |
1130, |
1190,2 |
24 |
2 |
1380 |
1183,2 |
|
9 |
3 |
1170 |
1212,5 |
25 |
3 |
1140 |
1205,7 |
|
10 |
2 |
1250, |
1274,9 |
26 |
4 |
1130 |
1223,4 |
|
11 |
3 |
1420, |
1418,7 |
27 |
3 |
1220 |
1265,7 |
|
12 |
2 |
1540 |
1319,4 |
28 |
2 |
1210 |
1167,3 |
|
13 |
4 |
1180 |
1297,6 |
29 |
2 |
1370 |
1197,4 |
|
14 |
2 |
1350 |
1316,9 |
30 |
3 |
1180 |
1192,6 |
|
15 |
3 |
1110 |
1194,6 |
31 |
4 |
1150 |
1231,7 |
|
16 |
3 |
1260 |
1317,4 |
32 |
5 |
1430 |
1396,5 |
Задача 11
За умовами завдання 7 побудувати групування за такими ознаками: за кількістю членів домогосподарства та середньодушовим доходом; за середньодушовим доходом та загальними витратами на продукти харчування; за кількістю членів домогосподарств та загальними витратами на продукти харчування.
Результати групування навести у таблицях. Зробити узагальнюючі висновки.
Приклади розвязання типових задач
Приклад 1
Робочі складального цеху мають таку кваліфікацію (за розрядами): І, V, ІV, ІІ, ІІ, V, ІV, ІІІ, V, VІ, ІІІ, ІV, ІV, ІІІ, ІV, ІІ, ІІІ, ІV, V, VІ, ІV, ІІІ, І, ІІІ, ІV, V, ІІІ, VІ.
Згрупувати робочих за рівнем кваліфікації, результати подати у вигляді таблиці.
Розвязання
Будуємо таблицю, яка складається з двох рядків. У верхньому рядку наводимо розряди, а потім підраховуємо, скільки робітників мають відповідний розряд, і наводимо ці величини у нижньому рядку.
Таблиця має вигляд:
Розподіл робітників складального цеху за кваліфікацією