Зведення і групування статистичних даних

Практичні заняття до теми 3: Зведення і групування статистичних даних

Мета: Закріпити теоретичні знання та виробити практичні навички щодо побудови статистичних групувань різного виду, представлення результатів групування у виді рядів розподілу, статистичних таблиць, графіків.

План заняття

  1. Статистичні групування за однією, двома і більше групувальними ознаками, побудова дискретних та інтервальних рядів розподілу
  2. Графічне зображення результатів групування
  3. Побудова аналітичних групувань
  4. Побудова вторинних групувань

Методичні рекомендації

Статистичні групування за однією, двома і більше групувальними ознаками, побудова дискретних та інтервальних рядів розподілу

У результаті статистичного спостереження отримують матеріали, що містять дані про кожну одиницю сукупності. Цей матеріал потребує спеціальної обробки, зведення розрізнених даних докупи.

Зведення – це науково організована попередня обробка матеріалів спостереження, комплекс дій щодо узагальнення конкретних індивідуальних даних щодо одиниць, які утворюють сукупність.

За глибиною узагальнення статистичних даних зведення може бути простим або складним. Просте зведення передбачає визначення підсумкових даних у цілому по сукупності. Складне зведення передбачає спочатку розподіл сукупності на окремі однорідні групи за групувальною ознакою.

Групування – це розподіл сукупності на групи за істотними для них ознаками. З точки зору окремих одиниць сукупності, групування – це об’єднання окремих одиниць сукупності у групи, що є однорідними за якоюсь ознакою. Класифікація групувань представлена на рис. 3.3. Більш детально необхідно розглянути теоретичні питання до теми 3 за курсом лекцій [5].

У системі статистичних методів пізнання масових суспільних явищ групування посідає особливе місце, бо на відміну від інших методів, групування виконує дві функції: по-перше, розподіляє сукупності на однорідні групи по-друге, визначає межі й можливості застосування інших методів статистики, використання яких потребує однорідності статистичних сукупностей.


Рис 3.3


Метод групувань використовують для вивчення структури та структурних зрушень визначення типів соціально-економічних явищ, виокремлення однорідних груп і підгруп виявлення взаємозв’язків між ознаками. Для розв’язання цих задач використовують відповідні види групувань: структурні, типологічні та аналітичні.

Структурне групування характеризує склад однорідної сукупності за певними ознаками. Різновидом структурних групувань є ряди розподілу. Залежно від групувальної ознаки вони поділяються на атрибутивні та варіаційні. Значення групувальної ознаки називається варіантою. Кожній варіанті відповідає певна частота або частка. Частоти показують, скільки разів повторюються окремі варіанти, а частки характеризують їх питому вагу в сукупності і за суттю є відносними частотами. Варіаційні ряди є базою поглибленого аналізу закономірностей розподілу.

Типологічне групування – це розподіл якісно неоднорідної сукупності на класи, соціально-економічні типи, однорідні групи. Для виявлення наявності та напряму зв’язку між ознаками використовуються аналітичні групування. При вивченні взаємозв’язків розглядаються щонайменше дві ознаки. При цьому одна ознака розглядається як результат (результативна ознака), а інша (або інші) розглядаються як фактор, що впливає на результат (факторна ознака або факторні ознаки). Висновок про наявність зв’язку можна зробити на основі розподілу за двома взаємопов’язаними ознаками згідно з характером розміщення частот. Якщо результативна ознака кількісна, для кожної групи за факторною ознакою можна визначити середнє значення результативної ознаки. За наявності зв’язку між ознаками групові середні результативної ознаки систематично змінюються від групи до групи в бік збільшення чи зменшення.

Групування проводять за однією або кількома ознаками. Групування за однією ознакою є простим, за кількома – складним. Складне групування може бути комбінаційним, якщо в його основі послідовно скомбіновано дві та більше ознак, або багатомірним, якщо воно проводиться за кількома ознаками одночасно.

Метод групування базується на двох категоріях – групувальній ознаці та інтервалі.

Групувальна ознака – це ознака, за якою відбувається об’єднання окремих одиниць сукупності в однорідні групи.

Інтервал встановлює кількісні межі груп. Як правило, він являє собою проміжок між максимальним та мінімальним значенням ознаки у групі.

Інтервали бувають:

  • рівними, коли різниця між максимальним та мінімальним значенням у кожному з інтервалів однакова. Цю різницю прийнято називати шириною інтервалу
  • нерівними, коли ширина інтервалів відрізняється одна від одної
  • закритими, коли є нижня та верхня межа
  • відкритими, коли є якась одна межа – лише верхня або лише нижня.

У численних сукупностях з близьким до нормального розподілом кількість груп (m) орієнтовно можна визначити за формулою Стерджеса:

m = 1 + log2 n, (3.1)

де n – обсяг сукупності.

Оскільки кількість інтервалів може бути лише цілим числом, то величина m округлюється або з надлишком (у більший бік незалежно від того, яка цифра стоїть після коми: 1, 3 чи 6 тощо), або за правилами округлення (якщо менше п’яти, число округлюється в менший бік, тобто все, що стоїть після коми, відкидається; якщо більше п’яти, наприклад, 2,51 або 2,6, число округлюється в більший бік – m = 3; якщо після коми стоїть рівно п’ять, наприклад, 6,5 або 7,5, число округлюється до парного числа, тобто відповідно буде m = 6 або m = 8). Який принцип округлення обрати, залежить від дослідника.

На практиці використовують чотири принципи формування груп:

  • рівність інтервалів
  • кратність інтервалів
  • рівність частот
  • якісну сутність ознаки.

Принцип рівних інтервалів, як правило, використовують у структурних і аналітичних групуваннях, а також тоді, коли розподіл ознаки більш менш рівномірний.

Ширина рівного інтервалу (h) розраховується за формулою:

h = (xmax – xmin) : m, (3.2)

де xmax – максимальне значення ознаки

xmin – мінімальне значення ознаки

m – число інтервалів.

Якщо діапазон варіації ознаки надто широкий і розподіл значень нерівномірний, але при цьому простежується збільшення або зменшення щільності між варіантами, то використовується принцип кратності інтервалів. При цьому ширина кожного наступного інтервалу в k разів більша або менша попереднього.

Всі інші принципи побудови рядів розподілу розглянути за курсом лекцій [5] підпункт 3.3. «Методологічні засади побудови статистичних групувань».

Графічне зображення результатів групування

Для графічного зображення рядів розподілу використовуються такі види графіків, як:

полігон – ламану лінію, що сполучає сукупність ізольованих точок на площині – для зображення дискретного ряду розподілу;

гістограма – сходинковий лінійний графік - для зображення інтервального варіаційного ряду розподілу;

кумулятивний полігон (або кумулята), кумулятивна гістограма – крива або сходинковий графік нагромаджених частот;

огіва тощо.

Правила побудови цих графіків більш детально розглянути за [6, с.74 – 78; 9, с. 66 – 68; 13, с. 33 – 37].

Побудова вторинних групувань

Іноді доводиться перегруповувати дані, тобто перегруповувати статистичні матеріали, раніше зведені в групи. Це дає змогу забезпечити порівнянність структур двох сукупностей за однією й тією ж самою ознакою у часі або просторі.

Перегрупування здійснюється зменшенням або збільшенням кількості раніше утворених груп. Розрізняють два способи вторинного групування:

  • просте укрупнення інтервалів;
  • перегрупування за часткою окремих груп в загальному їх підсумку (пропорційний дольовий перерозподіл).

Якщо межі інтервалів первинного і вторинного групування збігаються, то частоти інтервалів, що об’єднуються, просто підсумовуються.

Вважається, що в межах інтервалу розподіл частот (або часток) підпорядковується рівномірному закону розподілу. Це припущення дає можливість розбивати інтервал первинного групування пропорційно співвідношенню частин ширини розбитого інтервалу і обчислювати відповідні значення частот.

Типовий варіант завдання щодо використання різних методів побудови вторинних групувань наведено у Прикладі 4 розв’язання типових задач.

Розробка макетів статистичних таблиць. Аналіз таблиць

Невід’ємним елементом зведення та групування є статистична таблиця. За логічним змістом статистична таблиця розглядається як “статистичне речення”, тому вона має підмет та присудок. Підмет – це об’єкт дослідження: перелік елементів сукупності, їх групи, окремі територіальні одиниці або часові інтервали. Як правило, підмет розміщують у лівій частині таблиці у назві рядків, але не обов’язково, все залежить від наявної інформації та зручності розташування. Присудок таблиці – це система показників, що характеризують підмет як об’єкт дослідження. Як правило, присудок формує в логічній послідовності верхні заголовки таблиці. Нижче наведено загальну схему статистичної таблиці, її макет.

Як підмет таблиці, так і її присудок можуть мати різну розробку: просту, групову чи комбінаційну. Залежно від розробки підмета таблиця також може бути простою (простий перелік одиниць сукупності, підмет не ділиться на групи), груповою (групування одиниць за однією ознакою, підмет ділиться на групи за однією ознакою) та комбінаційною (підмет ділиться на групи за декількома ознаками). Розробка присудка на вид таблиці не впливає.

Назва таблиці

Зміст рядків

Верхні заголовки

Назви граф (стовпців)

(верхні заголовки)

Підсумкова графа

А

1

2

3

Найменування рядків

(бокові заголовки)

Підсумковий рядок

Приклади побудови різних видів таблиць наведені в табл. 3.1 – 3.4.

Таблиця 3.1

Випуск продукції підприємствами регіону

Ступінь виконання плану,%

Кількість підприємств

Випуск валової продукції, млн.. грн..

Виконання плану, %

план

факт

Не виконали

(до 100%)

4

29

23,4

80,7

Виконали (100 -110%)

7

59,4

62,5

105,2

Перевиконали

(110 і понад)

4

26,6

31,9

119,9

Разом

15

115

117,8

102,4

Таблиця 3.2

Розподіл промислових підприємств України

за формами власності, 1995 р.

Тип підприємства

Кількість підприємств, од.

Питома вага підприємств, (відносна частота), %

1

2

3

Продовження таблиці 3.2

1

2

3

1. Приватні підприємства

1

0,01

2. Підприємства колективної форми власності

5030

56,32

3. Підприємства державної форми власності

3882

43,47

4.Інші підприємства

18

0,20

Разом підприємств

8931

100,00

Таблиця 3.3

Розподіл працівників ВАТ „Захід” за рівнем заробітної плати

Заробітна плата,

грн..

Кількість робітників, чол..

Частота (питома вага), %

до 1000

1

1,33

від 1000 до 1200

6

8,00

від 1200 до 1400

10

13,33

від 1400 до 1600

15

20,00

від 1600 до 1800

18

24,00

від 1800 до 2000

20

26,67

більше 2000

5

6,67

Разом

75

100,00

Таблиця 3.4

Розподіл робітників ЗАТ „Схід” за рівнем кваліфікації

Значення ознаки, хі

Частота, fі

Відносна частота, dі

Нагро-маджена (накопичена, кумулятивна) частота, Sf

Нагро-маджена відносна частота, Sd

Кваліфікаційний розряд

Кількість робітників,

чол..

Питома

вага робітників,%

1

3

5,2

3

5,2

2

6

10,4

9

15,6

3

8

13,8

17

29,4

4

13

22,4

30

51,8

5

22

37,9

52

89,7

6

6

10,3

58

100,0

Разом

58

100,0

-

-

Задачі для розв’язання

Задача 1

Дані про розподіл робітників підприємства за рівнем освіти наведені у таблиці (дані умовні):

Освіта

2005 р.

2011 р.

Вища

120

140

Незакінчена вища

96

82

Середня спеціальна

64

68

Середня

80

70

Разом

360

360

Визначити: вид групування за функцією та кількістю ознак; вид статистичної таблиці.

Задача 2

Розподіл студентів регіону (тис. осіб) за місцем проживання та навчання наведений у таблиці (дані умовні).

Місце проживання

Місце навчання

Разом

Університет

Інститут

Академія

Місто

254

835

182

1271

Сільська місцевість

135

367

84

586

Разом

389

1202

266

1857

Визначити: вид групування за функцією та кількістю ознак; вид статистичної таблиці.

Задача 3

Групування робітників цеху за стажем роботи наведено в таблиці (дані умовні). Визначити: вид групування за функцією та кількістю ознак; вид статистичної таблиці.

Розряд робіт-ника

Групи робітників за стажем роботи, роки

Чисельність робітників

Середній стаж роботи, роки

Місячний випуск продукції, грн.

Разом

на 1 робітника

І

1 – 4

7

2,0

1534

219,14

ІІ

4 – 7

10

5,6

2532

253,20

ІІІ

7 – 10

6

8,3

1599

266,50

ІV

10 – 13

4

10,9

1112

278,00

V

13 – 16

3

14,4

914

304,67

Разом

30

6,9

7691

256,37

Завдання 1

Побудувати макет таблиці розподілу населення регіону за статтю, віком та освітою.

Завдання 2

Побудувати макет таблиці, яка б відображала склад населення регіону за працездатністю.

Завдання 3

Побудувати макет таблиці, яка б відображала склад населення регіону за місцем проживання та освітою.

Завдання 4

Наведені дані, що характеризують одиниці сукупності за ознакою Х:

1, 2, 2, 4, 8, 8, 9, 32, 32, 32, 33, 33, 34, 128, 128, 129, 129, 130, 131, 132, 140, 160, 256, 256, 257, 257, 258, 258, 270, 290, 295, 310, 320, 325, 330, 330.

Визначити кількість інтервалів та побудувати інтервальний варіаційний ряд у табличному та графічному вигляді.

Задача 4

За даними обстеження 50 сімей число дітей в них становить:

2 3 1 1 0 4 2 2 1 1

3 4 0 1 0 1 2 1 2 2

1 0 3 1 2 4 5 2 6 3

2 1 7 4 2 0 1 3 2 1

4 1 2 6 3 5 0 2 1 4

Побудувати дискретний варіаційний ряд розподілу сімей за числом дітей і подати його у виді таблиці та графіка.

Задача 5

Заробітна плата працівників фірми має такі значення:

1660 1780 1833 1623 1537 1548 1676 1766 1806 1941

1905 1658 1919 1809 1923 1914 1752 1690 1708 1843

1825 1725 1826 1918 1620 1775 1824 1938 2032 1938

2023 1830 1906 1949 1873 1898 1990 1912 1927 2074

2482 2058 2003 1970 2058 1953 1864 1940 2100 1881

Здійснити групування працівників фірми за рівнем заробітної плати, утворивши такі групи: до 1640; від 1640 до 1740; від 1740 до 1840; від 1840 до 2040; 2040 і більше. Подати його у виді таблиці та графіка.

Задача 6

За результатами спостереження, що проводилося у 50 малих підприємствах регіону, отримані дані про чисельність працівників. Побудувати інтервальний ряд розподілу з трьома рівними інтервалами, результати представити у вигляді таблиці та за результатами групування побудувати графік. Надати необхідні пояснення та зробити висновки.

10

11

13

21

22

25

32

24

14

31

21

31

16

27

11

14

19

25

12

32

32

14

17

35

31

12

28

28

26

12

13

17

19

29

40

10

38

34

15

33

11

13

11

11

12

14

28

23

16

37

Задача 7

За даними вибіркового обстеження розмір земельної площі у 30 фермерських господарствах одного з регіонів представлена даними таблиці, га.

Побудувати інтервальний ряд розподілу фермерських господарств за розміром земельної площі, утворивши чотири рівних інтервали, результати представити у вигляді таблиці та за результатами групування побудувати графік.

4,0

6,8

6,4

6,0

4,2

7,5

16,0

4,5

7,1

7,4

6,5

14,8

4,4

11.4

6,8

8,0

12,9

13,1

8,5

9,4

10,6

11,5

9,5

7,2

12,7

9,5

10,7

6,5

6,1

11,2

Задача 8

Інформація стосовно стажу роботи робітників підприємства та місячним виробництвом продукції наведена у таблиці.

Побудувати аналітичну таблицю, яка відображала б залежність між стажем роботи та обсягом виробництва продукції, розбивши робітників за стажем роботи на п’ять груп із рівними інтервалами.

№ з/п

Стаж роботи, років

Місячний обсяг виробництва продукції, грн.

№ з/п

Стаж роботи, років

Місячний обсяг виробництва продукції, грн

1

1,0

220

13

10,5

306

2

6,5

310

14

1,0

252

3

9,2

327

15

9,0

290

4

4,5

275

16

5,0

265

5

6,0

280

17

6,0

282

6

2,5

253

18

10,2

288

7

2,7

245

19

5,0

240

8

16,0

340

20

5,4

270

9

13,2

312

21

7,5

278

10

14,0

352

22

8,0

288

11

11,0

325

23

8,5

295

12

12,0

308

24

15,4

350

Задача 9

Дані про розподіл підприємств двох регіонів за чисельністю працівників наведені у таблиці (дані умовні).

Провести перегрупування підприємств за чисельністю працівників, утворивши такі групи: до 30; від 30 до 60; від 60 до 90; від 90 до 120; від 120 до 150.

І регіон

ІІ регіон

Чисельність працюючих

Кількість підприємств

Чисельність працюючих

Кількість підприємств

До 10

12

До 20

17

10 – 20

18

20 – 40

12

20 – 30

16

40 – 50

27

30 – 40

24

50 – 60

32

40 – 50

21

60 – 80

52

50 – 60

18

80 – 100

66

60 – 70

26

100 – 110

58

70 – 80

32

110 – 120

37

80 – 90

40

120 – 140

26

90 – 100

34

140 – 150

33

100 – 110

38

110 – 120

36

120 – 130

29

130 – 140

34

140 – 150

25

Разом:

403

Разом:

360

Задача 10

Вибіркове дослідження домогосподарств регіону за кількістю членів, середньодушовим доходом та загальними витратами на продукти харчування наведені в таблиці.

Згрупувати домогосподарства окремо за кожною з таких ознак: за кількістю членів домогосподарства; за середньодушовим доходом; за витратами на продукти харчування. Результати групувань подати у табличному вигляді.

Зробити узагальнюючі висновки.

№ з/п

Кількість членів

Середньо-душовий дохід, грн.

Загальні витрати на продукти харчування, грн.

№ з/п

Кількість членів

Середньо-душовий дохід, грн.

Загальні витрати на продукти харчування, грн.

1

5

1160

1345,6

17

4

1190

1368,1

2

3

1300

1254,1

18

3

1280

1297,4

3

4

1250

1289,7

19

2

1520

1398,4

4

4

1270

1310,2

20

4

1190

1152,7

5

3

1230

1215,3

21

3

1150

1196,2

6

2

1450

1180,6

22

5

1120

1299,8

7

4

1320

1350,8

23

2

1470

1264,3

8

3

1130,

1190,2

24

2

1380

1183,2

9

3

1170

1212,5

25

3

1140

1205,7

10

2

1250,

1274,9

26

4

1130

1223,4

11

3

1420,

1418,7

27

3

1220

1265,7

12

2

1540

1319,4

28

2

1210

1167,3

13

4

1180

1297,6

29

2

1370

1197,4

14

2

1350

1316,9

30

3

1180

1192,6

15

3

1110

1194,6

31

4

1150

1231,7

16

3

1260

1317,4

32

5

1430

1396,5

Задача 11

За умовами завдання 7 побудувати групування за такими ознаками: за кількістю членів домогосподарства та середньодушовим доходом; за середньодушовим доходом та загальними витратами на продукти харчування; за кількістю членів домогосподарств та загальними витратами на продукти харчування.

Результати групування навести у таблицях. Зробити узагальнюючі висновки.

Приклади розв’язання типових задач

Приклад 1

Робочі складального цеху мають таку кваліфікацію (за розрядами): І, V, ІV, ІІ, ІІ, V, ІV, ІІІ, V, VІ, ІІІ, ІV, ІV, ІІІ, ІV, ІІ, ІІІ, ІV, V, VІ, ІV, ІІІ, І, ІІІ, ІV, V, ІІІ, VІ.

Згрупувати робочих за рівнем кваліфікації, результати подати у вигляді таблиці.

Розв’язання

Будуємо таблицю, яка складається з двох рядків. У верхньому рядку наводимо розряди, а потім підраховуємо, скільки робітників мають відповідний розряд, і наводимо ці величини у нижньому рядку.

Таблиця має вигляд:

Розподіл робітників складального цеху за кваліфікацією