Помилки вибіркового спостереження
ГУМАНІТАРНИЙ УНІВЕРСІТЕТ
“ЗАПОРІЗЬКИЙ ІНСТИТУТ ДЕРЖАВНОГО ТА МУНІЦИПАЛЬНОГО УПРАВЛІННЯ”
Кафедра______________________________________________________
“Отримано”
Реєстраційний номер №______
від “___”____________200__м.
Контрольна робота №____
з дисципліни “________________________________________________”
на тему “_____________________________________________________
____________________________________________________________”
Виконав (ла) студент (ка)____ курсу (заочне відділення), групи_______
_____________________________________________________________
(прізвище, ім'я, по батькові)
Перевірив: __________________________________________________
(оцінка, дата, підпис, викладача)
_____________________________________________________________
(прізвище, ім'я, по батькові)
Адреса університету:
Адреса для повідомлення результату контрольної роботи студента:
69002, м. Запоріжжя,
вул. Жуковського, 70-б________________________________________
Тел. 63-99-73
г. Запоріжжя
2006р.
Зміст.
32. Помилки вибіркового спостереження.
Задача №28.
Задача №41.
Задача №58.
Задача №77.
Література.
32. Помилки вибіркового спостереження.
При правильному проведенні вибіркового спостереження характеристики вибірки близькі до відповідних характеристик генеральної сукупності, але вони не збігаються. Пояснюється це наявністю помилки вибірки. Помилкою вибірки називаються деякі розходження характеристик генеральної та вибіркової сукупностей. Вона складається з помилок реєстрації та помилок репрезентативності.
Помилками реєстрації називають такі, які виникають внаслідок отримання неточних або невірних відомостей від окремих одиниць сукупності із-за недосконалості вимірювальних приладів, недостатньої кваліфікації спостерігача, недостатньої точності розрахунку тощо.
Помилки репрезентативності розділяють на систематичні та випадкові. Систематичні помилки репрезентативності виникають внаслідок особливостей прийнятої системи та обробки даних спостереження або з умов недотримання правил відбору у вибіркову сукупність. Вони мають тенденційний характер викривлення величини досліджуваної ознаки в бік її збільшення або зменшення. Такі помилки також повинні бути виключені. Випадкові помилки репрезентативності виникають перш за все через те, що вибіркова сукупність через її малий обсяг не завжди точно відтворює характеристики генеральної сукупності. Тому цей вид помилок є основним, і завдання вибіркового методу полягає в отриманні таких вибіркових характеристик , які б якомога точніше відтворювали характеристики генеральної сукупності, тобто давали найменші помилки репрезентативності.
Теорія вибіркового методу полягає в знаходженні середньої величини помилки репрезентативності та можливих її меж при різних способах утворювання вибіркової сукупності. Для кожного конкретного вибіркового спостереження значення помилки репрезентативності здійснюється за відповідними формулами.
Для узагальнюваної характеристики похибки вибірки розраховують середню похибку репрезентативності µ, її називають стандартом.
Для вивчення середньої похибки репрезентативності власне випадкової і механічної вибірки застосовують певні формули (табл. 1.1).
Таблиця 1.1
Середня похибка репрезентативності µ.
Спосіб відбору | Визначення середньої | Визначення частки |
Повторний | ||
Безповторний |
де σ2 – середній квадрат відхилень у вибірці; n – чисельність вибіркової сукупності; N – чисельність генеральної сукупності; - частка обстеженої частини вибіркової сукупності; - необстежена частина генеральної сукупності; W – частка одиниць, які мають дану ознаку; 1- W – частка одиниць, які не мають даної ознаки.
Без повторний відбір гарантує більш точніші результати, оскільки він виключає можливість обстеження одних і тих самих одиниць при відборі з генеральної сукупності.
Для узагальнюваної характеристики похибки вибірки поряд із середньою розраховують і граничну похибку вибірки. Стверджувати, що дана генеральна середня не вийде за межі середньої похибки вибірки можна лише за певним ступенем імовірності.
Уразі вибіркового спостереження гранична похибка репрезентативності ∆ може бути більшою, чи дорівнювати, або меншою від середньої похибки репрезентативності µ . Тому граничну похибку репрезентативності обчислюють з певною ймовірністю Р, якій відповідає t-разове значення µ. З уведенням показника кратності похибки t формула граничної похибки репрезентативності має вигляд:
де t – коефіцієнт довіри, який залежить від імовірності, з якою гарантується значення граничної похибки вибірки.
Формула граничної похибки вибірки випливає з основних положень теорії вибіркового методу, сформульованих у теоремах ймовірностей, що відображають закон великих чисел.
Однією з головних теорем, які покладено в основу теорії вибіркового методу. є теорема П.Л. Чебишева, за допомогою якої він довів, що імовірністю, скільки завгодно близької до одиниці, можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятися від генеральної середньої при проведенні повторної вибірки.
Академік А.А. Марков довів збереження цієї умови для залежних спостережень (безповторної вибірки). Академік А. М. Ляпунов дослідив, що ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки та обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях t визначається за формулою:
Значення цього інтеграла при різних значеннях t табульовані і наводяться в спеціальних таблицях, наприклад:
t = 1; Р(∆≤µ) = 0,683
t = 2; Р(∆≤µ) = 0,954
t = 3; Р(∆≤µ) = 0,997
t = 4; Р(∆≤µ) = 0,999
Ці показники означають, що з імовірністю 0,683 можна стверджувати, що гранична похибка вибірки не перевищує µ, тобто в 68,3% випадків похибка репрезентативності не виходить за межі ±µ. Інакше, в 683 випадках із 1000 похибка репрезентативності не перевищує одного значення середньої похибки. З імовірністю 0,954 можна стверджувати, що похибка репрезентативності не перевищує 2 ±µ, з імовірністю 0,997 – не перевищить 3±µ. З імовірністю 0,999, тобто дуже близької до одиниці, можна очікувати, що різниця між вибірковою і генеральною середніми на перевищить 4±µ.
Гранична похибка вибірки розраховується за вибірковим спостереженням по-різному, залежно від видів і способів відбору. Вона дає можливість встановити, в яких межах лежить значення генеральної середньої або частки.
Із теореми Чебишева знаходять, що
і
Теорема Бернулі розглядає похибку вибірки для альтернативної ознаки. Стверджується, що при достатньо великому обсязі вибірки в міру його збільшення ймовірність відхилення між частками ознак у вибірковій і генеральній сукупностях наближатиметься до одиниці. Тобто, з імовірністю, скільки завгодно близькою до одиниці, можна стверджувати, що при достатньо великому обсязі вибірки вибіркова частка мало відрізняється від її частки в генеральній сукупності.
Додаючи граничну похибку вибірки до вибіркової частки і віднімаючи її від неї, знаходять межі генеральної частки:
Таким чином ми можемо записати формули для обчислення граничної похибки власне випадкової і механічної вибірки (табл. 1.2),
Табл.. 1.2
Граничні похибки вибірки.
Спосіб відбору | Визначення середньої | Визначення частки |
Повторний | ||
Безповторний |
де ∆х – гранична похибка вибірки середньої; ∆р – гранична похибка вибірки для частки.
За допомогою формул граничної похибки вибірки можна визначити:
довірчі межі генеральної і середньої частки з певною ймовірністю;
ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищує визначену величину;
необхідну чисельність вибірки, яка із заданою ймовірністю забезпечує очікувану точність вибіркових показників.
Під час розрахунків вибіркових характеристик інколи треба визначити ймовірності допуску певної похибки , тобто відхилення від відповідних характеристик генеральної сукупності не більше, ніж на певне задане значення, яке знаходять за формулою граничної похибки.
Під час вибіркового спостереження важливо правильно визначити необхідну чисельність обсягу вибірки, яка з відповідною ймовірністю забезпечує точність результатів спостереження. Надмірна чисельність вибірки призводить до затягнення строків дослідження, зайвої втрати часу і коштів, недостатня ж дає результати з великою похибкою репрезентативності.
Чисельність вибірки залежить від таких факторів:
варіації досліджуваної ознаки. Чим більша варіація, тим більшою має бути чисельність вибірки і навпаки;
розміру можливої граничної похибки вибірки. Чим менший розмір можливої похибки, тим більшою має бути чисельність вибірки. За існуючим правилом, якщо похибку потрібно зменшити в три рази, то чисельність вибірки збільшують в дев’ять раз;
значення ймовірності, з якою гарантуватимуть результати вибірки. Чим більша ймовірність, тим більша має бути чисельність вибірки;
способу вибору одиниць у вибіркову сукупність.
Визначення необхідної чисельності вибірки залежить від алгебраїчного перетворення формул граничної похибки вибірки при різних способах відбору.
Для власне випадкової і механічної вибірки виведення формул необхідної чисельності вибірки здійснюється в такий спосіб. З формули граничної похибки вибірки для середньої при повторному відборі потрібно визначити чисельність вибірки n. Для цього обидві частини даного рівняння підносимо до квадрата і отримуємо , звідки необхідна чисельність вибірки .
Дана формула є математичним підтвердженням залежності чисельності вибірки від граничної похибки, величини коефіцієнта довіри t і варіації (дисперсії).
Так само виводять формули необхідної чисельності вибірки в разі обчислення частки ознаки при повторному і безповторному відборах (табл. 1.3).
табл. 1.3
Чисельність вибірки n.
Спосіб відбору | Визначення середньої | Визначення частки |
Повторний | ||
Безповторний |
Коли відбір одиниць здійснюється з окремих типово однорідних груп, виділених за відповідною ознакою, варіації групових середніх немає, і похибка типової вибірки залежить від середньої величини з групових дисперсій. А тому при типовому відборі в формулах похибок вибірки замість загальної дисперсії слід використовувати середню з групових для середньої - для частки.
Отже, граничну похибку вибірки при типовому відборі розраховують за допомогою певних формул (табл. 1.4).
табл. 1.4
Гранична похибка вибірки ∆.
Спосіб відбору | Визначення середньої | Визначення частки |
Повторний | ||
Безповторний |
Знайти необхідну чисельність вибірки за типовим відбором можна в такий спосіб. Спочатку визначають загальну чисельність вибірки за формулою - для повторного відбору і - для безповторного відбору, після чого здійснюється відбір одиниць кожної групи методом, який враховує чисельність одиниць у кожній групі і варіацію досліджуваної ознаки.
Найпоширенішим способом серійного відбору є такий, за якого утворені в генеральній сукупності і відібрані вибіркою серії (гнізда) однакові за обсягом. Очевидно, що в разі серійної вибірки, яка передбачає суцільне спостереження одиниць у відібраних серіях, похибка вибірки залежатиме не від числа обстежених одиниць сукупності, а від кількості відібраних серій. Похибка вибірки залежатиме не від варіації ознаки в усій сукупності, а від варіації серійних середніх, яка вимірюється міжсерійною (між груповою) дисперсією δ2 (табл. 1.5), показниками: S – число серій у генеральній сукупності; s – число відібраних серій.
табл. 1.5
Гранична помилка ∆ серійної вибірки.
Спосіб відбору | Визначення середньої | Визначення частки |
Повторний | ||
Безповторний |
Необхідну чисельність вибірки в разі серійного відбору визначають як відбір певної кількості серій, які забезпечують з відповідною ймовірністю потрібну точність результатів дослідження.
Для повторного відбору необхідна чисельність вибірки , а для безповторного - .
У статистичні практиці вибіркове спостереження з великих масивів генеральної сукупності часто здійснюють у вигляді комбінованої, ступінчастої або кілька фазної вибірки. Вибіркова сукупність у разі комбінованої вибірки формується внаслідок ступінчастого відбору.
Загальна похибка для комбінованої вибірки складається з похибок, які можливі на кожному ступені, і визначається як корінь квадратний з квадратів похибок відповідних вибірок. Якщо серійну вибірку скомбінувати власне випадковою або механічною, то гранична похибка вибірки
Під час застосування комбінованої вибірки обов’язково потрібно знати склад генеральної сукупності, а також скласти обґрунтовану схему відбору одиниць за ступенями.
У разі моментального методу спостереження гранична похибка частки визначається як для звичайної повторної власне випадкової вибірки.
Вибір моментів здійснюють за схемою механічної вибірки або за схемою власне випадкової вибірки за таблицею випадкових чисел. Другий спосіб доцільно застосовувати в тих випадках, коли спостереження має бути для об’єкта несподіваним, аби не порушувати його звичайний трудовий ритм.
Визначають чисельність моментних спостережень за формулою похибки власне випадкової повторної вибірки. Відбір у моментних спостереженнях завжди безповторний, однак формулу безповторного відбору застосовувати не можна, оскільки чисельність генеральної сукупності моментів роботи визначити неможливо, вона нескінченна, якщо момент спостереження досить короткий. А тому необхідна чисельність моментів спостереження
,
або якщо довірчу ймовірність Р = 0,954, тобто коефіцієнт довіри t = 2, тоді .
В разі малих вибірок розподіл вибіркових середніх і похибок вибірки відрізняється від нормального. Тому для оцінки результатів малої вибірки використовують дещо змінені формули. Середня похибка малої вибірки , де ; n – 1 – число ступенів вільності варіації, які вказують на кількість різних можливих значень варіантів з їх середньою арифметичною.
Аби зв’язати середню похибку малої вибірки з граничною, враховують те, що в разі недостатньо великого обсягу вибірки стандартизована різниця між вибіркою і генеральною середньою має розподіл Стьюдента, а не нормальний. У. Стьюдент винайшов закон розподілу відхилень вибіркових середніх від генеральної середньої для малих вибірок і склав спеціальні таблиці, в яких наведено значення t при невеликому обсязі вибірки.
Малі вибірки використовують переважно для оцінки суттєвості (достовірності) різниць двох вибіркових середніх.
Для оцінки відмінності двох залежних вибіркових середніх застосовують середню різницю.
На основі теорії малої вибірки оцінюють точність вибіркової середньої, тобто визначають ймовірність того, що різниця між вибірковою і генеральною середньою не перевищує задану абсолютну величину.
Задача №28.
Визначити середню місячну заробітну плату робітника фірми в цілому методом середньої арифметичної простої і зваженої величини, середньої гармонічної зваженої.
Структурні підрозділи | Фонд заробітної плати за місяць, тис.грн. | Кількість робітників |
«Наталка» | 21 | 30 |
«Геркулес» | 7,44 | 12 |
«Світанок» | 4,25 | 5 |
«Морозко» | 5,6 | 16 |
Разом | 38,29 | 63 |
Яка із середніх величин найбільш реально відображає середню заробітну плату одного працівника фірми?
Розв’язання.
Знаходимо середню місячну заробітну плату для одного робітника кожного підрозділу фірми. Фонд заробітної плати ділимо на кількість працівників. Дані заносимо до таблиці. Таким чином ми визнаємо, що фонд заробітної плати – це добуток кількості робітників (частота) на середню заробітну плату (варіанта).
Структурні підрозділи | Фонд заробітної плати за місяць, тис.грн. | Кількість робітників | Середня заробітна плата підрозділу | |
Добуток, W | частота | Варіанта, Х | ||
1 | «Наталка» | 21 | 30 | 0,7 |
2 | «Геркулес» | 7,44 | 12 | 0,62 |
3 | «Світанок» | 4,25 | 5 | 0,85 |
4 | «Морозко» | 5,6 | 16 | 0,35 |
Разом | 38,29 | 63 |
Розраховується середня проста за допомогою формули
, де X – середня заробітна плата одного робітника, n – кількість робітників.
Якщо розглядати найпростішим способом: е чотири варіанта середніх заробітних плат робітників чотирьох підрозділів, тоді розрахунок середньої арифметичної простої матиме такий вигляд:
В нашому випадку частоти варіантів різні, тобто не однакові. Набагато легше обчислювати середню за допомогою формули середньої арифметичної зваженої: множення кожного варіанта на його частоту, підсумування отриманих добутків і, врешті, ділення добутої суми на суму частот.
Розглянемо можливість вирішення цієї задачі за допомогою середньої гармонійної зваженої, зважаючи на те, що добутки за кожною ознакою нерівні, за формулою:
, де W – добуток варіанта Х на частоту f, звідки ;
- обернені значення варіантів.
В свою чергу ми можемо сказати, що підтвердилося правило, що середню гармонійну використовують тоді, коли вагою слугують не одиниці сукупності (носії ознаки), а добуток цих одиниць на значення ознаки, W = Xf.
З цього правила випливає: середня гармонійна зважена в статистиці – це перетворена середня арифметична зважена, яку застосовують у разі, коли чисельність сукупності невідома, а варіанти зважуються обсягом ознаки.
Аналізуючи проведені розрахунки ми можемо впевнено сказати, що результати, проведені методами середньої арифметичної зваженої і середньої гармонійної зваженої мають однаковий результат і цей результат є обґрунтованим і реальним.
Задача №41.
Заробітна плата | Число робітників |
До 90 | 10 |
90 – 110 | 18 |
110 – 130 | 48 |
130 – 150 | 5 |
150 і вище | 3 |
По даним визначити:
модальний розмір заробітної плати;
медіану;
середнє лінійне відхилення;
розмах варіації;
коефіцієнт варіації.
Розв’язання.
Знаходимо кумулятивні частоти для даних у таблиці.
№ варіанти | Заробітна плата (варіанта) | Число робітників (частота) | Кумулятивні частоти |
1 | До 90 | 10 | 10 |
2 | 90 – 110 | 18 (Ме) | 10+18=28 |
3 | 110 – 130 | 48 (Мо) | 28+48=76 |
4 | 130 – 150 | 5 | 76+5=81 |
5 | 150 і вище | 3 | 81+3=84 |
-------- | Всього | 84 |
знаходимо Моду (Мо) – це величина, яка найчастіше трапляється в даній сукупності. У варіаційному ряді це – варіант, що має найбільшу частоту.
Моду можна визначити візуально і за допомогою формули.
Візуально найбільшу частоту має третя варіанта (від 110 до 130 грн).
За допомогою формули визначимо значення Моди:
Таким чино модальний розмір заробітної плати становить близько 118,2 грн.
знаходимо медіальний розмір заробітної плати.
Для цього ділимо частоти навпіл і дізнаємося середину медіального ряду 84/2=42. Серед кумулятивних частот немає такого значення, тому визначаємо найближче значення до середнього:
76-42=34
42-28=14
Таким чином ми визначили, що найближчою є друга варіанта – заробітна платня від 90 до 110 грн.
За допомогою формули визначаємо медіальний розмір заробітної плати:
Таким чином ми дізнались, що медіальний розмір заробітної плати становить 95,84 грн, який належить до другої варіанти заробітної плати (від 90 до 110).
Знаходимо розмах варіації
R=Xmax - Xmin
R=48 – 3 = 45 – розмах варіації.
Цей показник є недосконалим, тому, що враховує тільки крайні відхилення і зовсім не враховує відхилень решти варіантів від їхньої середньої.
Визначаємо середнє лінійне відхилення. Цей показник обчислюють як частку від ділення суми всіх відхилень на їх число. Пам’ятаючи властивість середньої, що , суму відхилень беруть за модулем, без урахування знака відхилень. Формула середнього лінійного відхилення:
(для не згрупованих даних)
Знаходимо середнє значення суми частот = 84 / 5 = 16,8.
Дані розраховуємо і заносимо до таблиці.
№ варіанти | Заробітна плата (варіанта) | Число робітників (частота),Х | Відхилення | ||
1 | До 90 | 10 | 16,8 | -6,8 6,8 | 46,24 |
2 | 90 – 110 | 18 (Ме) | 16,8 | 1,2 1,2 | 1,44 |
3 | 110 – 130 | 48 (Мо) | 16,8 | 31,2 31,2 | 973,44 |
4 | 130 – 150 | 5 | 16,8 | -11,8 11,8 | 139,24 |
5 | 150 і вище | 3 | 16,8 | -13,8 13,8 | 190,44 |
-------- | Всього | 84 | ----- | 0 64,8 | 1350,8 |
Таким чино ми визначили суму відхилень і визначаємо середнє лінійне відхилення за наведеною формулою:
для визначення коефіцієнта варіації визначаємо дисперсію за формулою:
(для не згрупованих даних) (дані вписуємо в таблицю)
і відповідно середнє квадратичне відхилення:
Усі розглянуті показники варіації – розмах варіації, середнє лінійне відхилення, середній квадрат відхилення та середнє квадратичне відхилення завжди виражають у одиницях вихідних даних ряду та середніх величин. Всі вони є абсолютним виміром варіації. А це означає, що безпосередньо порівнювати абсолютні показники варіації у варіаційних рядах різних явищ не можна. Для того, щоб забезпечити їх порівняння, потрібно обчислити показники, які характеризують варіацію, виражену в стандартних величинах, наприклад у процентах. Порівняння середнього квадратичного відхилення з середньою величиною дає змогу знайти цю стандартну величину.
Отриманий відносний показник називають коефіцієнтом варіації і визначають за формулою:
Коефіцієнт варіації є певною мірою критерієм типовості середньої. Якщо коефіцієнт дуже великий (як у нашому випадку), то це означає, що середня характеризує сукупність за ознакою, яка суттєво змінюється для окремих одиниць. Типовість такої середньої сумнівна, тобто невелика.
Задача №58.
На приватному сільськогосподарському підприємстві витрати на виробництво продукції характеризуються даними:
Продукція | Загальні витрати на виробництво, тис. грн. | Індивідуальний індекс собівартості | |
Минулий рік | Звітній рік | ||
Зернові | 223,0 | 242,5 | 0,97 |
Зернобобові | 47,2 | 49,0 | 0,98 |
Всього | 270,2 | 291,5 | ------ |
Треба визначити: 1. Загальний індекс собівартості продукції та абсолютний розмір економії грошових коштів на їх виробництво, в результаті зниження собівартості;
2. Індекс загальних грошових витрат на виробництво продукції і загальний індекс фізичного обсягу виробництва;
3. Визначте загальне абсолютне збільшення грошових витрат і їх зміни в результаті росту фізичного обсягу виробництва. Проаналізувати одержані результати.
Розв’язання.
1. Загальний індекс собівартості продукції у формі агрегатного індексу за даними задачі визначити неможливо, так як відомо чисельник індексу - витрати на виробництво поточного періоду, і невідомо знаменник - умовні витрати тієї ж продукції, якщо б собівартість одиниці продукції була на рівні базисного періоду. Але за вихідними даними задачу можна розв’язати при обчисленні загального індексу собівартості продукції у формі середньозваженого індексу. Оскільки відомі зміни собівартості в звітному періоді порівняно з базисним, тобто індивідуальні індекси фізичного обсягу кожного виду продукції , то знаменник агрегатного індексу можна виразити, розділити вартість реалізованої продукції кожного виду за звітний період на відповідні індивідуальні індекси (