Вибіркове спостереження
Лабораторна робота № 3
Тема заняття: “ Вибіркове спостереження”
Мета роботи: Вміти формувати вибіркову сукупність, обчислювати статистичні показники та розповсюджувати результати спостереження на генеральну сукупність.
- Основні теоретичні відомості
Вибіркове спостереження найбільш поширений вид несуцільного спостереження. Його застосовують під час вивчення різноманітних закономірностей суспільних та соціально-економічних явищ. Наприклад, обстеження сімейних бюджетів населення, вивчення громадської думки з приводу того чи іншого питання, попит населення та ступінь його задоволення в торгівлі тощо.
При вибірковому спостереженні обстеженню підлягають не всі елементи сукупності, яка вивчається, а лише певним чином відібрана частина. Порівняно з суцільним спостереженням вибіркове має переваги, оскільки обстеження за однією й тією самою програмою будь-якої частини сукупності потребує менше коштів і часу, ніж обстеження сукупності в цілому. Крім того, дешевше обходиться і статистична обробка інформації вибіркового спостереження. При обстеженні невеликої частини сукупності стає можливим детальне вивчення кожного елементу, зменшуються помилки реєстрації.
Під час вибіркового обстеження розглядаються дві сукупності. Сукупність, з якої вибирають елементи для обстеження називається генеральною. Сукупність, яка безпосередньо підлягає обстеженню, називається вибірковою або вибіркою. При цьому статистичні характеристики вибіркової сукупності розглядають як оцінки відповідних характеристик генеральної сукупності.
Першочергове завдання вибіркового спостереження полягає в тому, що на основі вибіркових оцінок треба обчислити невідомі характеристики генеральної сукупності.
Формування вибірки не безладний процес, він здійснюється за певними правилами.
Систематичний (механічний) відбір передбачає, що основою вибірки є упорядкована чисельність елементів сукупності. Вибір елементів здійснюється через рівні інтервали. Крок інтервалу обчислюють діленням обсягу генеральної сукупності на обсяг вибірки, тобто за формулою:
h = N / n, (1)
де h крок вибірки
N обсяг генеральної сукупності
n обсяг вибіркової сукупності.
Щоб не порушувати принцип випадковості відбору, початковий елемент визначають як випадкове число в межах першого інтервалу. Другий та наступні елементи залежать від початкового числа та кроку інтервалу.
Наприклад, проводиться 10 %-не обстеження студентів вищого навчального закладу з метою визначення умов життя в гуртожитку. В такому разі до вибірки потрапляє кожен десятий студент, тобто крок інтервалу дорівнює 10. Усіх студентів цього закладу можна розташувати уряд за алфавітним порядком. Потім з першої десятки навмання обрати якогось студента, наприклад, третього за списком. Тоді наступними одиницями вибіркової сукупності стануть студенти, номери яких за списком будуть 13, 23, 33, 43 ,53 ,63 і так далі.
Розшарований (районований) відбір це спосіб формування вибірки з урахуванням структури генеральної сукупності. Він орієнтований на забезпечення представництва у вибірці відповідних типових груп генеральної сукупності. При цьому вся сукупність розбивається (розшаровується) на однотипні, однорідні групи.
Потім з кожної групи за допомогою простого випадкового або механічного відбору формується вибіркова сукупність, тобто відбирається певна кількість одиниць.
У практиці вибіркових спостережень застосовують різні способи визначення обсягу вибіркової сукупності n та її складових частин n j.
Найпростіший спосіб передбачає однакову кількість елементів у кожній групі вибірки. Проте застосування цього способу обмежене. Якщо чисельності груп генеральної сукупності коливаються в широких межах, може виникнути ситуація, коли обсяг складової частини вибірки буде більшим за обсяг складової частини генеральної сукупності. Взагалі обсяг складової частини вибірки розраховується за формулою:
nj = n / m, (2)
де n обсяг вибірки
m кількість груп у вибірці.
Найчастіше використовують пропорційний відбір, який передбачає однакове для всіх складових частин представництво, тобто частки di однакові і обсяг часткової вибірки залежить від обсягу відповідної складової частини. Тоді обсяг кожної часткової вибірки розраховується за формулою:
nj = d * Nj , (3)
де nj обсяг окремої складової частини вибірки
d частка, яку складає вибіркова сукупність (або її окремі складові частини) у генеральній сукупності (або відповідно в окремих складових частинах генеральної сукупності)
Nj обсяг генеральної сукупності.
Розглянемо знову 10 %-ве обстеження студентів вищого навчального закладу з метою визначення умов життя в гуртожитку. Якщо використовувати механічний відбір, може статися так, що до вибірки потраплять студенти якогось одного факультету, чи навпаки, студенти якогось факультету не потраплять до вибірки, або їх буде дуже мало. У такому випадку, щоб до вибірки гарантовано потрапили представники усіх факультетів, доцільно використати розшарований спосіб формування вибіркової сукупності. В такому разі з кожного факультету пропорційно відбирається певна чисельність студентів.
Оптимальним щодо мінімізації помилки вибірки є добір, пропорційний до середнього квадратичного відхилення. При цьому обсяг складової частини вибірки обчислюється за формулою:
, (4)
де nj обсяг окремої складової частини вибірки
Nj обсяг генеральної сукупності
j середнє квадратичне відхилення окремої групи генеральної сукупності
n обсяг вибіркової сукупності.
Очевидно, що обсяг вибірки залежить від рівня варіації ознаки в окремих складових генеральної сукупності. Однорідні групи подаються меншим числом елементів, неоднорідні більшим. Відсутність даних про варіацію ускладнює практичну реалізацію такого способу вибірки.
Різновидом розшарованої вибірки є метод квот, коли обсяг частинних вибірок nj визначається завчасно. Наприклад, вивчаючи попит на продукцію косметичної фірми, реєстратор має опитати пятьох дівчат віком від 15 до 18 років, трьох жінок віком 30 35 років і так далі. Як саме реєстратор буде заповнювати ці “квоти”, він вирішує самостійно. Проте цей метод не гарантує незсуненості вибіркових оцінок.
Серійний відбір полягає в тому, що одиницею основи вибірки є серія елементів, які розглядаються як одне ціле. Серії складаються з одиниць, які повязані або територіально (наприклад, район, місто, селище тощо), або організаційно (фірма, підприємство, бригада тощо). Серії відбираються для обстеження за допомогою простого випадкового або механічного відбору. Якщо серія s потрапила до вибірки, то обстежують усі без винятку елементи серії.
Наприклад, при вивченні успішності студентів вищого навчального закладу обстеженню підлягають окремі академічні групи. Академічна група в цьому випадку, з одного боку, являє собою елемент вибіркової сукупності, а з іншого серію, бо складається з 20 25 студентів. Під час спостереження всі студенти групи, що потрапила до вибірки підлягають обстеженню.
Застосування того чи іншого способу формування вибіркової сукупності залежить від мети вибіркового обстеження, можливостей його організації та проведення. Найбільш поширеними є комбіновані вибірки, які поєднують різні способи відбору. Поєднання способів відбору забезпечує високу репрезентативність результатів з найменшими трудовими й грошовими витратами на організацію й проведення досліджень.
При великій кількості спостережень розподіл випадкових помилок середньої величини та частки має асимптотичне наближення до нормального.
У практиці вибіркових спостережень використовують два типи вибіркових оцінок: точкові та інтервальні.
Точкова оцінка це значення параметра, яке обчислене за даними вибіркового спостереження, тобто вибіркова середня або вибіркова частка.
Інтервальна оцінка це інтервал значень параметра, який розрахований за даними вибірки для певної прийнятої ймовірності. Іншими словами це довірчий інтервал. Чим меншим буде довірчий інтервал, тим точнішою буде вибіркова оцінка. Межі довірчого інтервалу визначаються на основі точкової оцінки та граничної помилки вибірки. Таким чином, довірчий інтервал для середньої можна записати у вигляді:
, (5)
де середня величина, обчислена на основі вибіркової сукупності
гранична помилка
середня генеральної сукупності.
Гранична помилка вибірки це помилка, максимально можлива для прийнятої ймовірності. Вона розраховується за формулою:
= t , (6)
де t квантиль розподілу ймовірностей (довірче число)
стандартна помилка вибірки.
Квантиль розподілу ймовірностей, або довірче число t вказує, як співвідносяться гранична та стандартна помилки. Так, для імовірності 0,683 довірче число дорівнює 1 для імовірності 0,954 довірче число дорівнює 2 для імовірності 0,997 довірче число дорівнює 3. На практиці найчастіше використовують імовірність 0,954 або 0,95.
Для простого випадкового або механічного (систематичного) відбору, проведеного за схемою безповторного відбору, стандартна помилка обчислюється за формулою:
, (7)
де дисперсія, обчислена за даними вибірки
N обсяг генеральної сукупності
n обсяг вибіркової сукупності.
Розмір граничної помилки залежить від варіації ознаки, яку характеризує дисперсія 2, обсягу вибірки n та частки вибірки у генеральній сукупності, яка характеризується відношенням , а також прийнятого рівня ймовірності, якому відповідає квантиль розподілу ймовірностей t.
Слід зауважити, що квантиль розподілу ймовірностей t для малої за обсягом вибірки (n < 30) визначають за розподілом Стьюдента якщо ж обсяг вибірки великий (n 30), то квантиль розподілу ймовірностей t визначають з таблиць нормального розподілу.
Під час практичного використання наведених формул слід ураховувати таке:
- дисперсія частки є добутком часток, а саме:
2 = p (1 q) = pq (8)
- у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому враховується лише у малочисельних (малих) вибірках
- коригуючий множник для безповторної вибірки , тобто при малих величинах наближається до одиниці (наприклад, для вибірки менше 5 %). У такому разі розрахунок можна виконувати за формулою для повторної вибірки.
З урахуванням наведених положень та конкретних умов для розрахунку граничної помилки обирається відповідна формула з наведених у табл. 1.
Як видно з формул, розмір граничної помилки залежить від варіації ознаки, яку характеризує дисперсія 2, обсягу вибірки n та частки вибірки у генеральній сукупності, яка характеризується відношенням , а також прийнятого рівня ймовірності, якому відповідає квантиль розподілу ймовірностей t.
Таблиця 1