Методи аналізу рядів розподілу

Практичні заняття до теми 6: Методи аналізу рядів розподілу

Мета: Закріпити теоретичні знання та виробити практичні навички щодо визначення центру розподілу, рівня варіації (оцінка однорідності сукупності) та форми розподілу, визначення характеристик концентрації, диференціації та подібності розподілів.

План заняття

  1. Аналіз закономірностей розподілу за допомогою характеристик центру розподілу (середньої, моди, медіани) та порядкових характеристик (квартилів, квінтилів).
  2. Вимірювання варіації ознак за допомогою абсолютних і відносних мір варіації: розмаху варіації, середніх лінійного та квадратичного відхилень, коефіцієнтів варіації.
  3. Характеристики форми розподілу: коефіцієнти асиметрії та ексцесу.
  4. Визначення характеристик концентрації, диференціації та подібності розподілів.

Методичні рекомендації

Аналіз закономірностей розподілу за допомогою характеристик центру розподілу (середньої, моди, медіани) та порядкових характеристик (квартилів, квінтилів)

Виявлення закономірностей зміни частот залежно від зміни варіюючої ознаки, що покладена в основу групування і є основою аналізу варіаційних рядів розподілу. При такому аналізі найчастіше використовують такі групи показників:

  • характеристики центру розподілу;
  • характеристики розміру варіації;
  • характеристики форми розподілу.

Центром розподілу називається значення варіюючої ознаки, навколо якого групуються інші варіанти. До характеристик центру розподілу належать середня, мода, медіана, чверть (квартиль) і десята частина (дециль).

Види та методика визначення середньої величини детально розглянуто у методичних рекомендаціях до теми №5 "Узагальнюючі статистичні показники". Перевага середньої величини як узагальнюючого для сукупності показника є одночасно і її недоліком – у середній знищуються індивідуальні відмінності варіантів. Наприклад, середнє значення між 18 та 22 дорівнює 20, також 20 дорівнює середнє значення між 2 і 38.

Для повнішого розкриття властивостей ряду розподілу визначають моду Мо, медіану Ме, квартилі Qu1, Qu2, Qu3 та децилі – від D1 до D9.

Мода (Мо) – значення варіанти, яке найчастіше повторюється в ряду розподілу. У дискретних рядах моду легко відшукати візуально, безпосередньо за найбільшим значенням частоти або частки.

В інтервальному ряду за тим самим принципом визначається модальний інтервал, тобто інтервал, частота якого має найбільше значення. Якщо треба більш точно встановити модальний рівень, його обчислюють за формулою:

, (3.11)

де Мо – мода

х Мо – нижня межа модального інтервалу

h Mo – ширина модального інтервалу

f Mo – частота модального інтервалу

f Mo – 1 – частота попереднього (перед модального) інтервалу

f Mo + 1 – частота наступного (після модального) інтервалу.

Слід зауважити, що ця формула використовується для інтервальних варіаційних рядів з рівними інтервалами.

Значення моди можна також визначити графічним способом за допомогою гістограми (див. рис. 3.12.).

f

50

40 В С

30 //////

А

20 D

D

10

0

50 100 Мо 150 200 250 Х

Рисунок 3.5. Визначення моди графічним методом

Графічним методом мода визначається так: на гістограмі (рис. 3.5) беремо прямокутник з найбільшою висотою, лівий верхній кут цього прямокутника (точка B) з’єднуємо з лівим верхнім кутом прямокутника, розташованого праворуч (точка D), а верхній правий кут найбільшого прямокутника (точка С) з’єднуємо з правим верхнім кутом прямокутника, розташованого ліворуч (точка А); з перетину прямих АС і BD (точка М) на вісь абсцис опускаємо перпендикуляр, який і визначить значення моди.

Для визначення моди за інтервальним варіаційним рядом з нерівними інтервалами в аналітичному вираженні перегруповують вихідний варіаційний ряд на ряд з рівними інтервалами або замість частот використовують відносні частоти. Для визначення моди графічним способом будують гістограму відносних частот. Основу прямокутників становлять розміри інтервалів, а висоту – відношення відповідної частоти до ширини інтервалу. Для кожного інтервалу визначається відносна частота за формулою:

, (3.12)

де wi – відносна частота i–го інтервалу;

fi – частота i–го інтервалу;

hi – ширина i–го інтервалу.

Принцип визначення моди лишається тим самим, що й для інтервального варіаційного ряду з рівними інтервалами.

Медіана (Ме) – варіанта, що ділить упорядкований варіаційний ряд на дві, рівні за обсягом частини. Наприклад, якщо в ряді розподілу робітників за віком Ме = 30, це означає, що половина робітників мають вік менше 30 років, половина – старші за цей вік.

Визначаючи медіану, використовують кумулятивні частоти Sfi або частки Sdi. У дискретному ряду медіанним буде значення ознаки, кумулятивна частота якого перевищує половину сукупності, тобто Sfi 0,5 fi (для кумулятивної частки Sdi 0,5).

Кумулятивні частоти визначаються доданням наступного значення частоти до суми значень попередніх частот. При цьому не має значення які інтервали у варіаційному ряді розподілу: рівномірні чи нерівномірні.

В інтервальному ряду за цим принципом визначають медіанний інтервал.

Значення медіани, як і значення моди, обчислюють за інтерполяційною формулою:

, (3.13)

де Ме – медіана

хМе – нижня межа медіанного інтервалу

hMe – ширина медіанного інтервалу

0,5 f i – половина сукупності

S fMe - 1 – сума накопичених частот до медіанного інтервалу

f Ме – частота медіанного інтервалу.

Медіану можна визначити й графічним способом, використовуючи для цього кумулятивний полігон. Медіана визначається так: на осі ординат відкладають точку, що дорівнює половині суми частот. З цієї точки проводять лінію, паралельну осі абсцис до її перетину з лінією кумулятивного полігону (точка А). З точки А на вісь абсцис опускають перпендикуляр, координата якого і буде медіаною (детальніше в прикладі 2 розв’язання завдань за даною темою).

В аналізі закономірностей розподілу крім медіани використовуються також й інші структурні (або порядкові) характеристики, які ділять всі одиниці розподілу на рівні за чисельністю групи. Вони отримали загальну назву квантилі. Частинним випадком квантилів є, насамперед, квартилі (ділять сукупність на чотири рівних частини), квінтилі (ділять сукупність на п’ять рівних частин), децилі (ділять сукупність на десять рівних частин) та перцентилі (ділять сукупність на сто рівних частин). Методика визначення квартилів і децилів наведена у курсі лекцій [5, тема 6].

Вимірювання варіації ознак за допомогою абсолютних і відносних мір варіації: розмаху варіації, середніх лінійного та квадратичного відхилень, коефіцієнтів варіації

Варіація, тобто коливання, мінливість будь-якої ознаки є властивістю статистичної сукупності. Здатність ознаки змінювати індивідуальні значення називається варіабельністю. Вона зумовлена дією безлічі взаємопов’язаних причин, серед яких є основні та другорядні. Основні причини формують центр розподілу. Другорядні причини впливають на форму розподілу.

Для виміру та оцінки варіації використовують систему абсолютних та відносних характеристик. До абсолютних характеристик належать: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення та дисперсія. До відносних характеристик варіації належать різноманітні коефіцієнти, найбільш поширене використання серед яких мають коефіцієнти варіації, що побудовані на відношенні абсолютних характеристик з середньою арифметичною. Кожна з названих характеристик має певні аналітичні переваги під час вирішення тих чи інших завдань статистичного аналізу.

Методика обчислення характеристик варіації залежить від виду ознаки Х та наявних даних (первинні чи похідні, згруповані чи ні).

Розмах варіації – різниця між найбільшим і найменшим значеннями ознаки, розраховується за формулою:

R = X max – X min, (3.14)

де X max – максимальне значення ознаки

X min – мінімальне значення ознаки.

Розмах варіації характеризує межі, в яких змінюється кількісне значення ознаки. Цей показник встановлює крайні числові значення варіант, що складають досліджувану сукупність.

В інтервальному ряду розподілу розмах варіації визначають як різницю між верхньою межею останнього інтервалу та нижньою межею першого. Проте, якщо інтервал відкритий, для обчислення розмаху варіації використовується середина інтервалу. Звичайно, спочатку інтервал має бути закритим згідно з відповідними правилами.

Крім розмаху варіації, у практиці статистичного аналізу широко застосовують інші абсолютні характеристики варіації, що ґрунтуються на відхиленнях індивідуальних значень ознаки від середньої арифметичної.

Оскільки відповідно до першої властивості середньої арифметичної ( Х і – ) = 0, то при розрахунку такого роду характеристик використовують або модулі, або квадрати відхилень. У результаті маємо такі характеристики варіації: середнє лінійне відхилення, середнє квадратичне відхилення та дисперсію. Розрахункові формули цих показників наведені в табл. 3.6.

Якщо статистична сукупність надана у вигляді інтервального варіаційного ряду, то для розрахунку показників варіації використовуються розрахункові формули за зваженою формою. При цьому замість індивідуального значення ознаки обирається середина відповідного інтервалу.

Середнє лінійне відхилення являє собою середню відстань між середньою арифметичною величиною та відповідними індивідуальними значеннями окремих ознак, а це завжди додатна величина. Саме тому у формулах відхилення кожної варіанти від середньої арифметичної береться за модулем.

Дисперсія являє собою середній квадрат відхилень і пов’язана з середнім квадратичним відхиленням таким співвідношенням:

, (3.15)

де – середнє квадратичне відхилення

D = 2 – дисперсія.

Таблиця 3.6.

Показники варіації та формули для їх розрахунку

Назва показника

Розрахункова формула

Проста форма

Зважена форма

Середнє лінійне відхилення

Середнє квадратичне відхилення

Дисперсія

хі – індивідуальні значення окремої ознаки, варіанти

– середня арифметична (середнє значення ознаки)

n – обсяг сукупності, кількість ознак у сукупності

fi – частота відповідної ознаки.

Чим менше середнє відхилення, тим більш типова середня, тим більш однорідна сукупність. Середнє квадратичне відхилення також пов’язане з середнім лінійним відхиленням. За правилом мажорантності середніх > . Якщо обсяг сукупності досить великий і розподіл ознаки наближається до нормального, то між середнім квадратичним та середнім лінійним відхиленнями існує такий взаємозв’язок:

= 1,25, або = 0,8. (3.16)

Для нормального розподілу варіативної ознаки справедливе також твердження, що R = 6. Значення ознаки в межах ( ) мають 68,3 % обсягу сукупності, у межах ( 2) – 95,4 %, а в межах ( 3) – 99,7 %. Це відоме “правило трьох сигм”.

При порівнянні варіації різних ознак використовуються відносні характеристики: коефіцієнти варіації. До них належать:

  • лінійний коефіцієнт варіації, який обчислюється за формулою:

, або ·100 %, (3.17)

де – середнє лінійне відхилення

– середня арифметична;

  • квадратичний коефіцієнт варіації, який обчислюється за формулою:

, або ·100 %, (3.18)

де – середнє квадратичне відхилення

  • коефіцієнт осциляції, який обчислюється за формулою:

, або ·100 %, (3.19)

де R – розмах варіації.

Чим менше середнє відхилення, тим більш типова середня, тим більш однорідна сукупність. Найчастіше квадратичний коефіцієнт варіації використовують як критерій однорідності сукупності. У симетричному, близькому до нормального, розподілі V = 0,33.

Розрізняють такі значення відносних коливань:

V < 10% - незначне коливання, сукупність однорідна, значення середньої є типовим рівнем ознаки в даній сукупності;

10 % V 33% - середнє коливання, сукупність в межах однорідності, значення середньої можна вважати типовим рівнем ознаки в даній сукупності;

V > 33% - високий рівень варіації, сукупність неоднорідна, значення середньої неможна вважати типовим рівнем ознаки в даній сукупності.

Характеристики форми розподілу: коефіцієнти асиметрії та ексцесу

Різноманітність статистичних сукупностей – передумова різних форм співвідношення частот і значень варіативної ознаки. За своєю формою роз-поділи поділяються на одновершинні та багатовершинні (коли розподіл має дві, три та більше вершин). Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній груп з різними рівнями ознаки. У такому разі необхідно більш ретельно проаналізувати наявну вихідну інформацію, перегрупувати дані, виділивши однорідні групи. Розподіли якісно однорідних сукупностей, як правило, одновершинні. Серед одновершинних розподілів є симетричні та асиметричні (скошені), гостровершинні та плосковершинні.

У симетричному розподілі рівновіддалені від центра значення ознаки мають однакові частоти, при цьому середня, мода та медіана мають однакові значення = Мо = Ме в асиметричному – вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена вліво, то це правостороння асиметрія. У цьому випадку > Me > Mo. Якщо вершина зміщена вправо, то це лівостороння асиметрія. В цьому випадку < Me < Mo.

Асиметрія виникає внаслідок обмеженої варіації в одному напрямі або під впливом домінуючої причини розвитку, яка веде до зміщення центру розподілу. Очевидно, що в симетричному розподілі А=0, при правосторонній асиметрії A>0, при лівосторонній – A<0.

Рис. 3.6 . Види розподілу:

  • симетричний розподіл (Мо = Ме = );
  • правостороння асиметрія (Мо > Ме > );
  • лівостороння асиметрія (Мо < Ме <).

Найпростішою мірою асиметрії є відхилення від середньої арифметичної медіани чи моди. В симетричному розподілі характеристики центра мають однакові значення = Мо = Ме в асиметричному – між ними існують певні розбіжності. Стандартизовані відхилення, які мають назву коефіцієнта асиметрії, характеризують напрям та міру скошеності розподілу і розраховуються за формулами:

; або . (3.20)

Якщо має місце відхилення коефіцієнта асиметрії від нуля в той чи інший бік, то можна вести мову про більшу чи меншу асиметрію. Вважають, що при 0,25 асиметрія низька при 0,25<0,5 - помірна, або середня при >0,5 - асиметрія висока.

Характеристики центру розподілу ґрунтуються на моментах розподілу. Момент розподілу – це середня k-го ступеня відхилень . Залежно від величини а моменти поділяють на первинні (а = 0), центральні і умовні (a = const). Ступінь k визначає порядок моменту. В загальному вигляді центральний момент k-го порядку розраховується за формулою:

, (3.21)

де хі – значення окремої варіанти;

– середня арифметична;

k – ступінь моменту;

fi – частота окремої варіанти.

Для того, щоб характеристика скошеності не залежала від масштабу вимірювання ознаки для порівняння ступеня асиметрії різних розподілів, використовують стандартизований момент третього ступеня. В такому разі коефіцієнт асиметрії визначається за формулою:

, (3.22)

де М3 – центральний момент третього порядку;

– середнє квадратичне відхилення.

Гостровершинність розподілу відображає скупченість значень ознаки навколо середньої величини та називається ексцесом. Для вимірювання ексцесу використовують коефіцієнт, побудований за допомогою стандартизованого моменту четвертого порядку, який розраховується за формулою:

, (3.23)

де М4 – центральний момент четвертого порядку.

Якщо Е = 3, то розподіл уважається нормальним, при E < 3 – плосковершинний, при E > 3 - розподіл має гостровершинну форму.

Рис. 3.7. Види розподілу:

нормальний (Е = 3);

  • гостровершинний (Е > 3);
  • плосковершинний (Е < 3).

На практиці часто в одному розподілі поєднуються всі названі особливості, а саме: одновершинний розподіл може бути симетричним та гостровершинним, або плосковершинним з лівосторонньою асиметрією, або гостровершинним з правосторонньою асиметрією тощо.

Визначення характеристик концентрації, диференціації

та подібності розподілів

Процеси і явища в промисловому і сільськогосподарському виробництві, фінансовій та комерційній діяльності, демографічній, соціальній або політичній галузях, що вивчаються статистикою, як правило, характеризуються внутрішньою структурою, яка із часом може змінюватися. Динаміка структури викликає зміну внутрішнього змісту досліджуваних об’єктів і їх економічну інтерпретацію, приводить до змін встановлених причинно-наслідкових зв’язків. Тому вивчення структури і структурних зрушень займає дуже важливе місце в курсі статистики.

У статистиці під структурою розуміють сукупність одиниць, яким притаманна певна стійкість внутрішньо групових зв’язків при збереженні основних ознак, що характеризують цю сукупність як ціле.

Основні напрямки вивчення структури:

  • характеристика структурних зрушень окремих частин сукупності за два або більше періодів часу;
  • узагальнююча характеристика структурних зрушень в цілому по сукупності;
  • оцінка ступеня концентрації, локалізації та децильної диференціації [5, 6, 15, 19].

Оцінювання інтенсивності структурних зрушень

Визначення структурних зрушень окремих частин сукупності та узагальнюючих характеристик структурних зрушень в цілому по сукупності базується на відносних показниках структури (див. методичні рекомендації до практичних занять за темою №5), що являють собою співвідношення окремих частин і цілого. При цьому вони можуть бути представлені як частка (коефіцієнт) або питома вага (%). Як часткові, так і узагальнюючі показники структурних зрушень можуть відображати або “абсолютну” зміну структури у процентних пунктах чи долях одиниці, або її відносну зміну у процентах чи коефіцієнтах. “Абсолютна” зміна показана в лапках, тому що цей показник є абсолютним за методологією розрахунку, а не за суттю та одиницями виміру.

“Абсолютний” приріст питомої ваги і - ої частини сукупності показує на скільки процентних пунктів збільшилася (+) або зменшилася (-) ця структурна частина в j – ий період часу порівняно із (j – 1) періодом:

(3.24)

де dij - питома вага (частка) і - ої частини сукупності в j – ий період часу;

dij-1 - питома вага (частка) і - ої частини сукупності в (j – 1) період часу.

Темп зростання питомої ваги ( відносна зміна) і - ої частини сукупності є співвідношенням :

(3.25)

Темп зростання питомої ваги представляють у %, це завжди додатна величина. Але, якщо в сукупності мали місце якісь структурні зрушення, то частина темпів зростання буде більшою за 100%, а частина - меншою.

Якщо сукупність, що досліджується, представлена даними не за два, а за три і більше періодів, то з’являється необхідність у визначенні середніх показників структурних зрушень. Так, середній “абсолютний” приріст питомої ваги і - ої частини сукупності визначають як середню арифметичну просту із послідовно визначених абсолютних приростів за кожен період часу. При цьому слід пам'ятати, що сума середніх абсолютних приростів питомої ваги для всіх k структурних частин сукупності, так як і сума їх приростів за один часовий інтервал, завжди повинна дорівнювати нулю.

Середній темп зростання питомої ваги ( відносна зміна) і - ої частини сукупності за кілька періодів часу визначається за формулою середньої геометричної простої.

Узагальнюючими показниками структурних зрушень у випадках, коли виникає необхідність оцінити структурні зрушення у соціально-економічному явищі в цілому за якісь окремі часові періоди або у кількох структур, що відносяться до окремих об’єктів за один і той же часовий період, є лінійний та квадратичний коефіцієнти “абсолютних” структурних зрушень, які визначають за формулами:

лінійний коефіцієнт “абсолютних” структурних зрушень

, (3.26)

де k – кількість структурних частин сукупності;

dij - питома вага (частка) і - ої частини сукупності в j – ий період часу;

dij-1 - питома вага (частка) і - ої частини сукупності в (j – 1) період часу.

квадратичний коефіцієнт “абсолютних” структурних зрушень

. (3.27)

Лінійний та квадратичний коефіцієнти “абсолютних” структурних зрушень (у процентних пунктах) дозволяють отримати зведену оцінку швидкості зміни питомої ваги окремих частин сукупності. Для зведеної характеристики інтенсивності зміни питомої ваги окремих частин сукупності використовують квадратичний коефіцієнт відносних структурних зрушень:

, (3.28)

Цей показник відображає той середній відносний приріст питомої ваги (у відсотках), який спостерігався за період, що досліджується.

Для зведеної оцінки структурних зрушень у досліджуваній сукупності в цілому за весь часовий інтервал, що охоплює кілька тижнів, місяців, кварталів чи років, найбільш доцільно використовувати лінійний коефіцієнт “абсолютних” структурних зрушень за n періодів (у процентних пунктах):

, (3.29)

де din - питома вага (частка) і - ої частини сукупності в останній період часу;

di1 - питома вага (частка) і - ої частини сукупності в 1 - ий період часу.

Цей показник може використовуватися як для порівняння динаміки двох і більше структур, так і для аналізу динаміки однієї і тієї ж структури за різні за тривалістю періоди часу.

При порівнянні структури одного об’єкта за двома ознаками або структур двох об’єктів розраховують коефіцієнт подібності (схожості) структур:

. (3.30)

де dj та dk - питома вага (частка) складових частин j – ої і k- ої сукупностей.

Якщо структури однакові, Р = 1. Чим більші відхилення структур, тим менше значення коефіцієнта Р.

Аналіз рівномірності розподілу за допомогою коефіцієнтів локалізації, концентрації, децильної диференціації

Ще однією особливістю аналізу структури сукупностей є оцінка рівномірності або нерівномірності розподілу за досліджуваною ознакою між окремими складовими сукупності (наприклад, розподіл доходів чи майна між окремими групами населення, житлової площі між окремими групами домогосподарств, прибутку між групами підприємств, розшарування населення за рівнем середньодушового доходу і т. ін.).

Ступінь нерівномірності розподілу досліджуваної ознаки, не пов’язаний ні з обсягом сукупності, ні з чисельністю окремих груп, називають концентрацією. При дослідженні нерівномірності розподілу досліджуваної ознаки за територією поняття “концентрація” замінюють поняттям “локалізація”. Централізація означає зосередженість (скупченість) обсягу ознаки у окремих одиниць (наприклад, капіталу в окремих комерційних банках, продукції якогось виду на окремих підприємствах і т. ін.).

Оцінка нерівномірності розподілу між окремими складовими сукупності ґрунтується на порівнянні часток двох розподілів – за кількістю елементів сукупності di і обсягом значень ознаки Di.. Якщо розподіл значень ознаки рівномірний, то di = Di, а відхилення часток свідчать про певну нерівномірність, яка вимірюється коефіцієнтами локалізації та концентрації.

Коефіцієнт локалізації визначається для кожної складової сукупності за формулою:

,. (3.31)

де di - частка i-ої групи розподілу за кількістю елементів сукупності;

Di - частка i-ої групи розподілу за обсягом значень ознаки..

Коефіцієнт концентрації (коефіцієнт Лоренца) є узагальнюючою для сукупності характеристикою відхилення розподілу від рівномірного і визначається за формулою:

. (3.32)

Чим ближче значення цього показника до 1 (100%), тим вищий рівень концентрації, при значенні К=0 розподіл ознаки за всіма одиницями сукупності є рівномірним. При визначенні цього коефіцієнта можна оперувати як частками одиниці, так і відсотками. Порівняння структур на основі відхилень часток дозволяє вимірювати диференціацію сукупності за даними інтервальних рядів із нерівними інтервалами та атрибутивних рядів розподілу.

Оцінка рівня концентрації при вивченні економічних явищ дуже часто здійснюється по кривій концентрації Лоренца. Для її побудови необхідно мати частотний розподіл одиниць досліджуваної сукупності та відповідний до нього частотний розподіл ознаки, що вивчається. При цьому для зручності розрахунків і підвищення рівня аналітичності даних одиниці сукупності, як правило, розбиваються на рівні групи – 10 груп по 10% одиниць в кожній групі, або – 5 груп по 20% одиниць і т.д.

Найбільш відомим показником концентрації є коефіцієнт Джині, який зазвичай використовують для вимірювання диференціації або соціального розшарування. У загальному вигляді його розраховують за формулою:

, (3.33)

де di - частка i-ої групи розподілу за кількістю елементів сукупності;

Di - частка i-ої групи розподілу за обсягом значень ознаки;

Dні – накопичена частка i-ої групи розподілу за обсягом значень ознаки..

Коефіцієнт Джині змінюється в тих же межах, що і коефіцієнт Лоренца.

Мірою оцінки розшарування сукупності слугує також коефіцієнт децильної диференціації. Децилі – це варіанти, які ділять обсяги сукупності на десять рівних частин. Існує дев’ять децилів, що визначаються за формулою, яка в загальному вигляді має таке вираження:

, (3.34)

де і – порядковий номер дециля;

xDe i – нижня межа і-го дециля;

h De i – ширина інтервалу, де розташований і-й дециль;

fi – сума всіх частот сукупності;

SDe i – 1 – сума накопичених частот до інтервалу, де розташований і-й дециль;

fDe i – частота інтервалу, де розташований і-й дециль.

Тоді коефіцієнт децильної диференціації, що є відношенням розмірів дев’ятого і першого дециля (наприклад, відношення мінімального середньодушового доходу 10% найбагатшого населення до максимального середньодушового доходу 10% найменш забезпеченого населення), дорівнює:

, або ·100 %, (3.35)

де D9 – дев’ятий дециль

D1 – перший дециль.

Задачі для розв’язання

Задача 1

Визначити моду та медіану ціни книг, що продаються на книжковому базарі, аналітичним та графічним методами, за наведеними у таблиці даними (дані умовні). Зробити висновки.

Ціна, грн.

до 30

30 - 50

50 - 70

70 - 90

90 і більше

Разом

Обсяг, шт.

65

220

180

98

27

590

Задача 2

Розподіл жіночого взуття в магазині за його ціною (дані умовні), наведений у таблиці:

Ціна, грн.

до 300

300-400

400-500

500-600

600 і більше

Разом

Кількість, пар

30

150

80

40

20

320

Визначити моду, медіану та квартилі аналітичним та графічним методами. Зробити висновки.

Завдання 3

Інформація щодо розподілу комплектів посуду на складі магазину за їх ціною наведена в таблиці:

Ціна, грн.

10-50

50-100

100-150

150-200

200-250

Разом

Обсяг, шт.

150

120

120

100

60

550

Визначити моду, медіану та 1 і 9 децилі аналітичним та графічним методами. Зробити висновки.

Задача 4

Оцінити розмах варіації ціни порцелянових виробів, що продаються у крамниці, загальну дисперсію та дисперсію частки виробів, ціна яких перевищує 500 грн., за наведеними в таблиці умовними даними:

Ціна, грн.

100-150

150-300

300-500

500-800

800-2000

Разом

Обсяг, шт.

28

25

42

15

5

115

Задача 5

Розподіл працівників підприємства за віком наведений у таблиці. Розрахувати такі показники варіації: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення віку робітників, лінійний та квадратичний коефіцієнти варіації. Зробити висновки щодо однорідності сукупності. Визначити дисперсію для працівників, вік яких менший за 30 р.

Оцінити форму розподілу на асиметричність та плосковершинність. Зробити висновки.

Вік

до 20

20 – 30

30 – 40

40 – 50

50 і більше

Разом

Число робітників, осіб

15

55

60

50

40

220

Задача 6

Використовуючи ряд розподілу автомобілів автопідприємства за величиною добового пробігу, проаналізувати сукупність на однорідність, форму розподілу на асиметричність та плосковершинність. Визначити дисперсію для автомобілів, добовий пробіг яких перевищує180 км. Зробити висновки.

Добовий пробіг автомобіля, км

до 160

160-180

180-200

200 і більше

Разом

Всього автомобілів

20

28

36

16

100

Задача 7

Результати обстеження 100 сімей, які перебувають у шлюбі 10 років, на наявність та кількість дітей наведені у таблиці:

Число дітей

0

1

2

3

4

5

Разом

Число сімей

12

38

26

15

8

1

100

Визначити загальну дисперсію кількості дітей у сім’ї та проаналізувати наведену сукупність на однорідність. Проаналізувати форму розподілу на асиметричність і плосковершинність. Визначити дисперсію для частки сімей, в яких троє і більше дітей. Зробити висновки.

Задача 8

Є дані щодо розподілу сімей за їх розміром, які наведені в таблиці.

Число членів сім’ї

1

2

3

4

5

Разом

Число сімей

2

7

23

15

3

50

Визначити загальну дисперсію двома способами. Проаналізувати сукупність на однорідність та оцінити форму розподілу на асиметричність та плосковершинність. Зробити висновки.

Задача 9

За наведеними даними про віковий розподіл автомобільного парку регіону (дані умовні), визначити структурні зрушення та оцінити їх інтенсивність для кожного типу рухомого складу за допомогою лінійного та квадратичного коефіцієнтів структурних зрушень; провести порівняльний аналіз; зробити висновки.

Вікова група

автомобілів (років)

Вантажні автомобілі, од.

Автобуси, од.

2000 р.

2010 р.

2000 р.

2010 р.

до 5

5 – 10

10 – 15

більше 15

300

300

450

450

800

600

750

350

100

125

360

315

450

350

250

200

Разом

1500

2500

900

1250

Задача 10

Розподіл обсягів продаж взуття в магазині (дані умовні) наведений у таблиці: Оцініть інтенсивність структурних зрушень за допомогою лінійного коефіцієнту. Проведіть порівняльний аналіз структур за окремі періоди часу і в цілому за весь час. Зробіть висновки.

Тип взуття

Питома вага, % до підсумку

2007 рік

2009 рік

2011 рік

Жіноче

Чоловіче

Дитяче

40

35

25

30

45

25

50

30

20

Разом

100

100

100

Задача 11

Розподіл працівників підприємства за віком наведений у таблиці. Оцінити ступінь концентрації фонду заробітної плати робітників. Зробити висновки.

Вік робітників, років

Частка, % до підсумку

Кількість робітників

Фонд заробітної плати

До 20 років

20 – 30

30 – 45

45 і старші

5,8

25,2

44,6

24,4

3,2

21,4

51,6

23,8

Разом

100,0

100,0

Задача 12

Використовуючи ряд розподілу автомобілів автопідприємства за величиною добового пробігу, зробити порівняльний аналіз структури автомобілів за інтенсивністю експлуатації. Зробити висновки.

Добовий пробіг автомобіля, км

до 160

160 - 180

180-200

200 і більше

Разом

Всього автомобілів, у % до підсумка

-на підприємстві А

- на підприємстві В

12

5

28

15

36

36

24

44

100

100

Ситуаційне завдання 1

Виникла необхідність проаналізувати забезпеченість магазинів одного із районів міста торгівельними площами. Були зібрані дані про розмір торгівельних площ магазинів міста (м), що представлені далі у таблиці.

Побудувавши інтервальний варіаційний ряд розподілу із 4 груп з однаковими інтервалами, провести аналіз із оцінкою:

а) середнього рівня забезпеченості магазинів одного із районів міста торгівельними площами та його типовості;

б) найбільш характерного значення торгівельної площі (моди) та значення, що поділяє магазини за торгівельною площею на дві рівні частини (медіани);

в) симетричності утвореного ряду розподілу (через співвідношення між середньою, модою та медіаною).

Результати аналізу представити у табличному і графічному вигляді, зробити узагальнюючі висновки стосовно забезпеченості одного із районів міста торгівельними площами.

258,7

259,8

286,5

272,3

290,1

276,9

283,4

247,7

252,9

330,8

275,3

269,3

285,0

308,3

273,6

230,0

250,5

251,7

289,1

257,5

335,5

269,3

281,4

286,9

287,4

298,8

250,8

262,4

246,8

285,6

278,7

275,4

239,2

272,5

267,0

292,0

246,1

301,0

279,6

268,5

254,8

292,6

285,3

340,7

299,7

314,5

311,0

350,0

303,2

Ситуаційне завдання 2

Виникла необхідність провести моніторинг ціни кондитерського виробу «А» у супермаркетах міста. Були зібрані дані щодо цін за 1 кг даного кондитерського виробу у відділах супермаркетів міста (грн..), що представлені далі у таблиці.

Побудувавши інтервальний варіаційний ряд розподілу із 4 груп з рівними інтервалами, провести аналіз із оцінкою:

а) середнього рівня ціни кондитерського виробу «А» у супермаркетах міста та його типовості;

б) найбільш характерного значення ціни кондитерського виробу «А» у супермаркетах міста (моди) та значення, що поділяє супермаркети за ціною кондитерського виробу «А» на дві рівні частини (медіани);

в) симетричності утвореного ряду розподілу (через співвідношення між середньою, модою та медіаною).

Результати аналізу представити у табличному і графічному вигляді, зробити узагальнюючі висновки стосовно рівня коливання ціни кондитерського виробу «А» у супермаркетах міста.

31,00

32,40

39,60

31,40

36,90

33,50

35,20

34,80

35,20

49,80

36,70

38,90

32,40

34,00

32,80

33,60

31,40

30,80

31,60

51,00

38,55

50,00

44,70

35,20

42,90

49,00

48,90

34,00

36,90

33,60

33,40

34,80

42,80

32,60

41,00

39,20

40,25

42,85

37,80

47,80

44,50

42,25

Ситуаційне завдання 3

Виникла необхідність проаналізувати забезпеченість площею офісних приміщень фірм одного із районів міста. Були зібрані дані про розмір площ офісних приміщень (м), що представлені далі у таблиці.

Побудувавши інтервальний варіаційний ряд розподілу із 4 груп з однаковими інтервалами, провести аналіз із оцінкою:

а) середнього рівня забезпеченості площами офісних приміщень фірм одного із районів міста та його типовості;

б) найбільш характерного значення площі офісних приміщень (моди) та значення, що поділяє фірми за площею офісних приміщень на дві рівні частини (медіани);

в) симетричності утвореного ряду розподілу (через співвідношення між середньою, модою та медіаною).

Результати аналізу представити у табличному і графічному вигляді.

Зробити узагальнюючі висновки стосовно забезпеченості площею офісних приміщень фірм одного із районів міста.

158,7

159,8

186,5

172,3

190,1

180,8

200,7

176,9

185,0

157,5

150,8

205,9

168,5

172,5

146,1

203,2

211,0

250,0

147,7

152,9

230,8

175,3

169,3

189,4

173,6

130,0

150,5

151,7

189,1

179,6

169,3

181,4

186,9

187,4

198,8

183,5

146,8

185,6

178,7

175,4

139,2

212,4

199,7

154,8

192,0

214,5

192,6

215,9

Приклади розв’язання типових задач

Приклад 1

Обчислити розмах варіації, середню, моду та медіану (з точністю до першого знака після коми) аналітичним та графічним методами за наведеними у таблиці даними:

Ціна товару, грн

Кількість товару,од.

До 10

12

10 – 20

18

20 – 40

40

40 – 60

50

60 – 70

30

70 – 80

20

Разом

170

Розв’язання

Для визначення розмаху варіації закриваємо перший інтервал, враховуючи, що його ширина дорівнює ширині сусіднього інтервалу, і беремо його середину. Ширина другого інтервалу:

h = 20 – 10 = 10,

тоді нижня межа першого інтервалу:

хmin = 10 – 10 = 0,

а середина: х 1 = (0+10) / 2 = 5.

Тоді розмах варіації:

R = 80 – 5 = 75.

Визначимо середини інтервалів:

х 1 = 0,5 (0 + 10) = 5; х 2 = 0,5 (10 + 20) = 15; х 3 = 0,5 (20 + 40) = 30;

х 4 = 0,5 (40 + 60) = 50; х 5 = 0,5 (60 + 70) = 65; х 6 = 0,5 (70 + 80) = 75.

Середню арифметичну визначимо за формулою середньої арифметичної зваженої:

де і – середина відповідного інтервалу

fi – частота відповідного інтервалу.

Тоді:

= 44 грн.

Для визначення моди спочатку перебудуємо вихідний інтервальний ряд із нерівними інтервалами на варіаційний ряд із рівними інтервалами, для чого розіб’ємо третій та четвертий інтервали навпіл, враховуючи припущення, що в межах інтервалу значення ознаки розподіляється за рівномірним законом. (Примітка: Якщо задано інтервальний ряд розподілу із рівними інтервалами, тоді таку перебудову робити не потрібно).

Після перебудови ряду розподілу маємо :

Ціна товару,грн

Кількість товару,од

0 - 10

12

10 – 20

18

20 - 30

20

30 – 40

20

40 – 50

25

50 – 60

25

60 – 70

30

70 – 80

20

Разом

170

За побудованим вторинним інтервальним рядом із рівними інтервалами модальним інтервалом буде сьомий, якому відповідає найбільше значення частоти. Тоді значення моди обчислюється за формулою):

де Мо – мода

х Мо – нижня межа модального інтервалу

h Mo – ширина модального інтервалу

f Mo – частота модального інтервалу

f Mo -1 – частота передмодального інтервалу

f Mo+1 – частота післямодального інтервалу.

Тоді МО = = 63,3 грн.

Визначаємо моду графічним методом:

f

30

20

10

0 10 20 30 40 50 60 М0 70 80

Ціна товару,грн..

Визначення моди графічним методом

Для визначення медіани обчислимо суму накопичених частот, тобто послідовно підсумуємо частоти за принципом:

S1 = f1; S2 = f1 + f2; S3 = f1 + f2 + f3 і так далі.

Результати розрахунків наведено далі в таблиці.

Ціна товару,грн

Кількість товару,од

Накопичена частота, од.

0 - 10

12

12

10 – 20

18

30

20 - 30

20

50

30 – 40

20

70

40 – 50

25

95

50 – 60

25

120

60 – 70

30

150

70 – 80

20

170

Разом

170

х

Визначимо медіанний інтервал – той, в якому сума накопичених частот дорівнює або перебільшує половину сукупності.

Половина сукупності – 0,5 fі = 0,5 · 170 = 85.

З вище наведеної таблиці бачимо, що медіанним інтервалом є п’ятий інтервал з межами (40 – 50).

Значення медіани обчислюємо за формулою:

,

де Ме – медіана

хМе – нижня межа медіанного інтервалу

hMe – ширина медіанного інтервалу

0,5 f i – половина сукупності

S fMe - 1 – сума накопичених частот до медіанного інтервалу

f Ме – частота медіанного інтервалу.

Тоді = 46 грн.

Для визначення медіани графічним методом використовують графік, побудований на основі накопичених частот або часток. Цей графік має вигляд кумулятивної гістограми із вбудованою кумулятою.


Визначення медіани графічним методом

Результати розрахунків свідчать про те, що типовим рівнем ціни товару є = 44 грн.; половина одиниць товару мають значення ціни, що дорівнює або менше ніж 46 грн., а інша половина - дорівнює або більше ніж 46 грн.; найчастіше зустрічаються товар, що має ціну 63,3 грн.

Виходячи із співвідношення = 44< Ме = 46 < Мо = 63,3 можна зробити висновок, що представлений ряд розподілу має лівосторонню асиметрію.

Приклад 2

Визначити квадратичний коефіцієнт варіації та зробити висновки щодо однорідності сукупності за наведеними даними ( дані умовні):

Розподіл товару на складі за його ціною

Ціна, грн.

2 – 10

10 – 30

30 – 60

60 – 100

100 – 120

Разом

Обсяг, шт.

8700

1800

9800

5900

1900

28100

Примітка: Проміжні розрахунки проводити з точністю до другого знака після коми, результати округлювати до першого знака після коми.

Розв’язання:

Для визначення квадратичного коефіцієнта варіації необхідно спочатку розрахувати середню ціну товару на складі та середнє квадратичне відхилення. У вихідних даних наведено інтервальний ряд розподілу, тому необхідно перейти до дискретного ряду.

Визначимо середини інтервалів:

x 1 = 0,5 (2 + 10) = 6; x2 = 0,5 (10 + 30) = 20;

x3 = 0,5 (30 + 60) = 45; x 4 = 0,5 (60 + 100) = 80;

x 5 = 0,5 (100 + 120) = 110;

Для інтервального варіаційного ряду середню арифметичну визначимо за формулою:

де і – середина відповідного інтервалу

fi – частота відповідного інтервалу.

Тоді

= 43,1 грн.

(У розрахунку використано одну з математичних властивостей середньої арифметичної. Яку властивість використано?)

Середнє квадратичне відхилення обчислюється за формулою:

=

==32,6 грн.

Примітка: Квадратичний коефіцієнт варіації – це відношення середнього квадратичного відхилення до середньої арифметичної величини. Якщо квадратичний коефіцієнт варіації не перевищує 0,33, сукупність вважається однорідною.

V = 32,6 / 43,1 = 0,8 · 100 = 80 %.

Відповідь: Отже, сукупність товарів за їх ціною неоднорідна, так як V> 33%, а визначена середня величина, що дорівнює 43,1 грн. не є типовим рівнем ціни товару в даній сукупності.

= 43,1 грн.; = 32,6 грн.; V = 80 %.

Приклад 3

Протягом сесії студенти однієї групи одержали такі оцінки:

Оцінка

2

3

4

5

Разом

Кількість оцінок

4

35

33

28

100

Визначити дисперсію частки якісних оцінок (4 та 5). Проаналізувати однорідність сукупності та оцінити форму розподілу.

Розв’язання

Дисперсія частки (дисперсія альтернативної ознаки) визначається за формулою:

= pq,

де p – частка з наявністю даної ознаки;

q – частка з відсутністю даної ознаки.

Частка якісних оцінок в сукупності: p = (f4 + f5) / fі = (33+28) / 100 = 0,61.

Частка неякісних оцінок: q = 1 – p = 1 – 0,61 = 0,39.

Тоді дисперсія частки якісних оцінок: = 0,61 0,39 0,24,

відповідно = 0,24 = 0,49.

Проаналізуємо форму розподілу, для чого спочатку обчислимо середню оцінку за формулою:

;

= = 385 / 100 = 3,85.

Асиметрію визначимо через коефіцієнт асиметрії, який обчислимо за формулою:

.

Плосковершинність визначаємо за допомогою ексцесу, який розраховується за формулою:

.

Для спрощення розрахунків складемо допоміжну таблицю:

fi

xі –

(xі –) 2 fi

(xі –) 3 fi

(xі –) 4 fi

2

4

– 1,85

13,6900

– 25,3265

46,854025

3

35

– 0,85

25,2875

– 21,494375

18,27021875

4

33

0,15

0,7425

0,111375

0,01670625

5

28

1,15

37,0300

42,5845

48,972175

100

76,7500

– 4,125

114,113125

Середнє квадратичне відхилення обчислюється за формулою:

= = 0,876;

Дисперсія:

= 76,75 / 100 = 0,7675.

Квадратичний коефіцієнт варіації :

V = 0,876 / 3,85 = 0,228 · 100 = 22,8 %.

Коефіцієнт асиметрії:

= (– 4,125) / (0,8763 100) = – 0,061;

Ексцес:

= 114,113125 / (0,7675 0,7675) = 1,937.

Відповідь: Середній рівень оцінок становить 3,85, при цьому дисперсія частки якісних оцінок (4 та 5) становить 0,24; сукупність знаходиться в межах однорідності, тому визначений середній рівень оцінок може вважатися типовим для студентів даної групи; форма розподілу оцінок студентів за сесію – плоско вершинна з низькою лівосторонньою асиметрією.

Приклад 4

Проаналізувати структурні зміни за наведеними даними (дані умовні) про розподіл споживчих витрат населення регіону за окремі періоди і в цілому за весь час:

Структура споживчих витрат населення регіону

Вид споживчих витрат

Питома вага, % до загального підсумку

2004 рік

2005 рік

2006 рік

Продовольчі товари

Непродовольчі товари

Послуги

Інші

33,7

54,2

8,7

3,4

43,9

45,3

6,4

4,4

45,2

42,0

8,8

4,0

Разом

100,0

100,0

100,0

Розв’язання:

Зміну структури споживчих витрат населення регіону можна дослідити за допомогою лінійного коефіцієнта “абсолютних” структурних зрушень, квадратичного коефіцієнта “абсолютних” структурних зрушень, квадратичного коефіцієнта відносних структурних зрушень та лінійного коефіцієнта “абсолютних” структурних зрушень за n періодів. Для визначення цих показників зробимо допоміжні розрахунки у табличній формі (див. далі).

Для розрахунку лінійного коефіцієнта “абсолютних” структурних зрушень за перший (із 2004 по 2005 рік) і за другий (із 2005 по 2006 рік) періоди використовуємо підсумки стовпчиків 2 і 5 розрахункової таблиці:

проц. пункти;

проц. пункти.

Таким чином, із 2004 по 2005 рік питома вага окремих видів споживчих витрат населення в середньому змінювалася на 5,6 проц. пункти.

За наступний рік “абсолютні” структурні зрушення зменшилися, тобто структура споживчих витрат почала стабілізуватися.

Аналогічних висновків можна дійти і за розрахунком квадратичного коефіцієнта “абсолютних” структурних зрушень (розрахунки із використанням підсумків стовпчиків 3 і 6 розрахункової таблиці):

проц. пункти;

проц. пункти.

Визначимо величину квадратичного коефіцієнта відносних структурних зрушень, використовуючи підсумки стовпчиків 4 і 7 розрахункової таблиці:

;


.

Як свідчать ці розрахунки, за перший рік питома вага кожного виду витрат в середньому змінилася майже на своєї величини, тоді як за наступний рік – тільки на 1/9.

Для узагальнюючої оцінки структурних зрушень у досліджуваній сукупності в цілому за весь час використовуємо лінійний коефіцієнт “абсолютних” структурних зрушень за n періодів (із підсумками з стовпчика 8 розрахункової таблиці).

= 3,1 проц. пункти.

Таким чином, за весь час середньорічна зміна частки споживчих витрат населення регіону за всіма видами витрат становила 3,1 процентних пункти.

Розрахункова таблиця до прикладу 4

Вид споживчих витрат

1

2

3

4

5

6

7

8

Продовольчі товари

Непродовольчі товари

Послуги

Інші

10,2

8,9

2,3

1,0

104,04

79,21

5,29

1,00

3,09

1,46

0,61

0,29

1,3

3,3

2,4

0,4

1,69

10,89

5,76

0,16

0,04

0,24

0,90

0,04

11,5

12,2

0,1

0.6

Разом

22,4

189,54

5,45

7,4

18,50

1,22

24,4

Бібліографічний список до практичного заняття : [5 - 10, 15 - 19]


PAGE 157

Методи аналізу рядів розподілу