Обоснование целесообразности применения выборочного метода

Введение


Выборочным называется такое статистическое исследование, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части, сформированной на основе положений случайного отбора.

В основе выборочного исследования лежит несплошное наблюдение, при котором обследуются не все единицы совокупности, а лишь определенная их часть.

Выборочное исследование широко применяется на практике, поскольку обладает существенными преимуществами по сравнению с другими методами получения статистических данных. К ним относятся:

• Достаточно высокая точность результатов обследования благодаря использованию более квалифицированных кадров, что приводит к сокращению ошибок регистрации;

• Экономия времени и средств в результате сокращения объема работы, большая оперативность в получении данных о результатах обследования;

• Возможность исследования очень больших статистических совокупностей;

• Выборочный метод является единственно возможным, если сбор информации связан с разрушением или потерей единиц наблюдения, например, при органалитическом контроле качества продукции;

• Возможность исследования полностью недоступных совокупностей


Обоснование целесообразности применения выборочного метода


Выборочное статистическое наблюдение является наиболее широко применяемым видом не сплошного наблюдения. При выборочном методе обследованию подвергается сравнительно набольшая часть всей изучаемой совокупности (обычно до 5–10%, реже до 15–20%). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой. Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части, организованной по принципу случайного отбора.

При случайном отборе каждой единице изучаемого объекта (массового явления, генеральной совокупности) обеспечивается определенная (обычно равная) вероятность попасть в количество обследуемых единиц (в выборку) и тем самым исключается субъективность, тенденциозность и односторонность в подборе этих единиц.

При строгом соблюдении принятых правил отбора выборочное наблюдение репрезентативно в широком смысле слова: при нем обеспечивается близкое соответствие состава охваченной наблюдением выборки и состава генеральной совокупности. Благодаря этому по данных выборочного наблюдения можно определить с желательной степенью приближения интересующие исследователей характеристики изучаемого явления.

Выборочный метод при проведении ряда исследований является единственно возможным, например, при контроле качества продукции (товара).

Выборочный метод иногда применяется для проверки данных даже сплошного учета. Минимальная численность обследуемых единиц позволяет провести исследование более тщательно и квалифицированно. Так, при переписи населения практикуются выборочные контрольные обходы для проверки правильности записей сплошного наблюдения.

Большую актуальность приобретает выборочный метод в условиях перехода к рыночной экономике. Развитие различных форм собственности, изменения в характере экономических отношений, как, обусловливают изменения функций учета и статистики, сокращение и упрощение статистической отчетности.

По сравнению с другими методами, применяющими не сплошное наблюдение, выборочный метод имеет существенное преимущество. При соблюдении правил научной организации выборочного наблюдения появляется возможность количественной оценки ошибки репрезентативности (представительности).

Более того, способы определения ошибок выборки при различных приемах формирования выборочной совокупности и распространение характеристик выборки на генеральную совокупность составляют основное содержание статистической методологии выборочного метода.

Логика выборочного наблюдения:

определение объекта и целей выборочного наблюдения;

выбор схема отбора единиц для наблюдения;

расчет объема выборки;

проведение случайного отбора установленного числа единиц из генеральной совокупности;

наблюдение отобранных единиц по установленной программе;

расчет выборочных характеристик в соответствии с программой выборочного наблюдения;

определение ошибки, ее размера;

распространение выборочных данных на генеральную совокупность;

анализ полученных данных.

Основные преимущества выборочного наблюдения:

Выборочное наблюдение можно осуществить по более широкой программе.

Выборочное наблюдение более дешевое с точки зрения затрат на его проведение.

Выборочное наблюдение можно организовать тогда и в тех случаях, когда отчетностью мы воспользоваться не можем.

Основные недостатки:

Полученные данные всегда содержат в себе ошибку, о результатах наблюдения можно судить лишь с определенной степенью достоверности. Но по сравнению с другими видами наблюдения это достоинство выборочного метода.

Для его проведения требуются квалифицированные кадры.
Вся совокупность единиц, из которых производится отбор, называется генеральной. Совокупность единиц отобранных называется выборочной.

Проведение выборочного наблюдения складывается из ряда последовательных этапов:

1) обоснование целесообразности проведения выборочного метода в соответствии с задачами исследования;

2) составление программы проведения статистического исследования выборочным методом;

3) решение организационных вопросов сбора исходной информации;

4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;

5) обоснование способов формирования выборочной совокупности;

6) осуществление отбора единиц из генеральной совокупности для их обследования;

7) фиксация в отобранных единицах выборки значений изучаемых признаков;

8) статистическая обработка полученной в выборке информации с определением обобщающих характеристик изучаемых признаков;

9) определение количественной оценки ошибки выборки;

10) распространение обобщающих выборочных характеристик на генеральную совокупность.

11) В зависимости от способа организации выборочного наблюдения и применяемых способов отбора различают также виды выборочного наблюдения:

1) простая случайная выборка (собственно-случайная);

2) механическая случайная выборка;

3) типическая случайная выборка;

4) серийная (гнездовая) выборка;

5) многоступенчатая (многостепенная или комбинационная) выборка.

Выборку можно производить из конечной (ограниченной) и неограниченной генеральной совокупности. Поэтому целесообразно различать выборочный метод и по этому признаку. Иногда различают также большие, охватывающие значительное число обследуемых единиц, выборки и малые выборки.

Каждый из указанных основных способов отбора может реализоваться по схеме повторного (когда зафиксированная в выборке единица возвращается в генеральную совокупность) или бесповоротного отбора (когда зафиксированная единица исключается из дальнейшего просмотра и может попасть в выборку только один раз). Целесообразно различать выборки и по этому признаку.


Задача №1.


Вычислить индексы сезонности и построить сезонную волну за полугодие. Сделать вывод




Индексы сезонности

I II III всего за три года В среднем за три года
Январь 30,2 31,5 31,2 92,9 31 16,77
Февраль 29,8 31,1 30,8 91,7 30,6 16,55
Март 29,6 30,9 30,5 91 30,3 16,39
Апрель 29,4 30,6 30,3 90,3 30,1 16,28
Май 30,5 31,9 31,5 93,9 31,3 16,93
Июнь 30,8 32,2 31,8 94,8 31,6 17,09
Итого 180,3 188,2 186,1 554,6 184,9 100,01

Решение:

Всего за три года =I+II+III

Январь = 30,2+31,5+31,2=92,9

Февраль = 29,8+31,1+30,8=91,7

Март = 29,6+30,9+30,5=91

Апрель = 29,4+30,6+30,3=90,3

Май = 30,5+31,9+31,5=93,9

Июнь = 30,8+32,2+31,8=94,8

Итого I = январь I+ февраль I+март I+апрель I+май I+июнь I=30,2+29,8+29,6+29,4+30,5+30,8=180,3

Итого II = январь II+февраль II+март II+май II+июнь II = 31,5+31,1+30,9+30,6+31,9+32,2=188,2

Итого III = январь III+февраль III+март III+апрель III+май III+ июнь III = 31,2+30,8+30,5+30,3+31,5+31,8=186,1

Итого всего за три года = 92,9+91,7+91+90,3+93,9+94,8=554,6

В среднем за три года = (I+II+III)/3 = Всего за три года/3. По этой формуле рассчитаем для всех месяцев:

Январь = 92,9/3=31

Февраль = 91,7/3=30,6

Март = 91/3=30,3

Апрель = 90,3/3=30,1

Май = 93,9/3=31,3

Июнь = 94,8/3=31,6

Итого = 554,6/3=184,9

Индекс сезонности (Ис) =Всего за три года для каждого месяца / общую среднюю за три года*100%. По этой формуле рассчитае6 м для каждого месяца:

Ис январь = 31/184,9*100=16,77

Ис февраль = 30,6/184,9*100=16,55

Ис март = 30,3/184,9*100=16,39

Ис апрель = 30,1/184,9*100=16,28

Ис май =31,3/184,9*100=16,93

Ис июнь = 31,6/184,9*100=17,09

Итого Ис = 16,77+16,55+16,39+16,28+16,93+17,09=100,01

Строим сезонную волну:



Вывод: Правильность полученной сезонной волны зависит от числа уровней ряда и от характера их изменения: чем больше уровней ряда, тем более точные будут результаты. Если посмотреть на полученных данных сезонной волны, видно существенный спад в марте и апреле, а в мае и июне видимое увеличение средних показателей.


Задача №2.

Имеются данные о 23 рабочих-сдельщиках, представленные в следующей таблице:


Номер рабочих Стаж работы, лет Месячная выработка продукции, у. е.
1 18,0 737
2 23,5 827
3 26,2 844
4 21,5 792
5 23 797
6 19,5 770
7 19,7 762
8 33 857
9 30,2 829
10 31 869
11 28 842
12 29 825
13 27,5 823
14 18 769
15 26 807
16 22 782
17 23 775
18 27,2 805
19 22 757
20 22,4 787
21 24,5 795
22 25 805
23 25,8 812

Для изучения зависимости между приведенными показателями произвести группировку рабочих по стажу работы, выделив 5 групп с равными интервалами. По каждой из них и совокупности подсчитать количество рабочих (абсолютное и в процентах к итогу), средний стаж работы, среднемесячную выработку продукции. Результаты представить в таблице, сделать краткие выводы.


Решение:

Определяем величину интервала (i):


i = (Xmax-Xmin)/5=(33–18)/5=3.


Разбиваем на группы: (18; 21); (21; 24); (24; 27); (27; 30); [30; 33].


Строим вспомогательную таблицу для рассчитанных

Размер интервала Номер рабочих Стаж работы, лет Месячная выработка продукции, у. е.

(18; 21)

1 18 737

6 19,5 770

7 19,7 762

14 18 769
Итого 4 75,2 3038

(21; 24)

2 23,5 827

4 21,5 792

5 23 797

16 22 782

17 23 775

19 22 757

20 22,4 787
Итого 7 157,4 5517

(24; 27)

3 26,2 844

15 26 807

21 24,5 795

22 25 805

23 25,8 812
Итого 5 127,5 4063

(27; 30)

11 28 842

12 29 825

13 27,5 823

18 27,2 805
Итого 4 111,7 3295

[30; 33]

8 33 857

9 30,2 829

10 31 869
Итого 3 94,2 2555

Строим итоговую таблицу

Группы пп по стажу работы, лет Количество рабочих, человек Стаж работы, лет Месячная выработка продукции, у. е.

абсолютное в% к итогу всего в среднем на 1 рабочего всего в среднем на 1 рабочего

1

2

3=2*100/23

4

5=4/2

6

7=6/2

[18; 21] 4 17,4 75,2 18,8 3038 506,3
(21; 24) 7 30,4 157,4 22,5 5517 788,1
(24; 27) 5 21,7 127,5 25,5 4063 812,6
(27; 30) 4 17,4 111,7 27,9 3295 823,8
{30; 33] 3 13,1 94,2 31,4 2555 851,7

Вывод: Для всех 5 групп «Группировки рабочих по стажу работы» характерны следующие характеристики: среднемесячная выработка продукции пропорционально растет, а количество рабочих уже с третьей группы резко уменьшается. Можно предположить, что на данном предприятии происходит внедрение новых процессов производства, в связи с чем ручной труд заменяется машинным.


Задача №3.

Построить прогноз методом среднего абсолютного прироста. Обосновать выбор метода прогнозирования, предварительно проверив предпосылки его реализации.

Построить прогноз методом среднего темпа роста, предварительно проверив предпосылки его реализации.

Построить прогноз, методом экстраполяции трендовых моделей.

Произвести оценку точности прогнозов, полученных методом экстраполяции трендовых моделей на основе:

средней квадратической ошибки;

коэффициента несоответствия.

Сделать выводы.

Исходные данные

Динамика числа семей, состоявших на учете на учёте на получение жилья в одном из регионов Республики Беларусь за январь-октябрь 2009 г.


Месяц Число семей, состоявших на учете на получение жилья, тыс. ед.
январь 179,6
февраль 181,2
март 203,3
апрель 206,1
май 226,9
июнь 248
июль 261,3
август 231,9
сентябрь 255,1
октябрь 299

Решение:

1. Прогноз методом среднего абсолютного прироста.

Месяц

Число семей, состоявших

на учете на получение

жилья, тыс. ед. yi


yi2


Δr


Δ2

_ _

y Δ

_ _

yi- y Δ

_ _

(yi- y Δ)

январь 179,6 32256,16 - - 179,6 0 0
февраль 181,2 32833,44 1,6 2,56 192,867 -11,667 136,111
март 203,3 41330,89 22,1 488,41 206,134 -2,834 8,028
апрель 206,1 42477,21 2,8 7,84 219,401 -13,3 176,91
май 226,9 51483,61 20,8 432,64 232,668 -5,768 33,27
июнь 248 61504 21,1 445,21 245,935 2,065 4,264
июль 261,3 68277,69 13,3 167,89 259,202 2,098 4,401
август 231,9 53777,61 -29,4 864,36 272,469 -40,569 1645,844
сентябрь 255,1 65076,01 23,2 538,24 285,736 -30,636 938,564
октябрь 299 89401 43,9 1927,21 299 0 0
Итого 2292,4 538417,62 119,4 4883,36 2393,012 -100,612 2947,392

Δ=(yn-y1)/(n-1)=(октябрь-январь)/9=(299–179,6)/9=13,267


Для того чтобы найти Δr, нужно от каждого месяца отнять предыдущий: Δrфевраля=февраль-январь; Δr марта = март-февраль и так для всех месяцев.

_ _ Δ2 = значение Δr возведённое в квадрат.

y Δ февраля = yi января + е значение Δ, для марта =Δ+ yi февраля.

Для осуществления прогноза должна выполняться предпосылка:δ2ост≤ р2;

Проверим: δ2=∑(yi – y Δ)2/n=2947,392/10=294,739

р2=1/2*∑ Δ2/n=1/2*4883,36/10=244,168; δ2ост≤ р2, условие не выполняется, следовательно прогноз построить нельзя.


2. Прогноз методом среднего темпа роста

Месяц

Число семей, состоявших на учете на получение

жилья, тыс. ед. yi


Tr

_

yiTr

январь 179,6 - 171,218
февраль 181,2 1,008 192,101
март 203,3 1,122 194,746
апрель 206,1 1,014 214,4
май 226,9 1,101 234,338
июнь 248 1,093 246,905
июль 261,3 1,054 219,125
август 231,9 0,887 241,047
сентябрь 255,1 1,1 282,529
октябрь 299 1,172 299
Итого 2292,4 9,551 2295,409

Для расчета Тr нужно месяц для которого считаем разделить на предыдущий. Тr февраля = февраль уi /январь уi так для всех месяцев.


Тr=√(yn/y1)= √(299/179.6)=1.0583


yiTr= уi следующего месяца/ Тr= yiTr сентября = уi октября/ Тr=299/1,0583= =282,529 и так для каждого месяца.

Проверим предпосылки осуществления прогноза:

∑yi ≈∑yTr; 2295,409>2292,4; Так как предпосылка не выполняется, то прогноз методом среднего темпа построить невозможно.

3. Прогноз методом экстраполяции трендовых моделей.


Модель прямой

Месяц

Число семей, состоявших на учете на получение

жилья, тыс. ед. yi

Номер года t t2 yixt yt (yi-yt)2 yi2
январь 179,6 1 1 179,6 176,815 7,76 32256,16
февраль 181,2 2 4 362,4 188,465 52,78 32833,44
март 203,3 3 9 609,9 200,115 10,14 41330,89
апрель 206,1 4 16 824,4 211,765 32,09 42,477,21
май 226,9 5 25 1134,5 223,415 12,15 51483,61
июнь 248 6 36 1488 235,065 167,31 61504
июль 261,3 7 49 1829,1 246,715 212,72 68277,69
август 231,9 8 64 1855,2 258,365 700,4 53777,61
сентябрь 255,1 9 81 2295,9 270,015 222,46 65076,01
октябрь 299 10 100 2990 281,665 300,5 89401
Итого 2292,4 55 385 13569 2292,4 1718,31 538417,62

yixt= yiмесяца * t месяца.

na0+∑ta1=∑yt

∑ta0+∑t2a1=∑yixt

10a0+55a1=2292.4

55a0+385a1=13569


10a0=2292.4–55a1

55a0+385a1=13569

a0=229.24–5.5a1

55a0+385a=13569.подставим значения е а0 во второе уравнение и решим его. 55 (229,24–5,5а1)+385а1=13569

82,5а1=960,8

а1=11,65, подставим значение а1 в первое уравнение и решим его.

10а0+640,75=2292,4

а0=165,165

а0=165,165

а1=11,65

yt января = а0+а1; yt февраля = yt января+ а1, так для всех месяцев.

Yt=165.165+11.65t. Построим прогноз:


номер года, t yt
11 529,915
12 604,565
13 616,215

11= yt октябрь+а1=281,665+11,65=592,915

12=11 yt+а1=592,915+11,65=604,565

13=12 yt+а1=604,565+11,65=616,215

Оценка точности прогноза:

Среднеквадратическая ошибка: δ=√(∑(yi-yt)2/n)=13.11

Коэффициент несоответствия: КН=√(∑(yi-yt)2/∑ yi2)=0,05649


Модель параболы

Месяц

Число семей, состояв-

ших на учете

на получе-ние

жилья, тыс. ед. yi

Но-мер года

t

t2 t3 t4 yixt yixt2 yt (yi-yt)2 yi2
январь 179,6 1 1 1 1 179,6 179,6 177,1 7,76 32256,16
февраль 181,2 2 4 8 16 362,4 724,8 188,51 52,78 32833,44
март 203,3 3 9 27 81 609,9 1829,7 200 10,14 41330,89
апрель 206,1 4 16 64 256 824,4 3297,6 211,4 32,09 42,477,21
май 226,9 5 25 125 625 1134,5 5672,5 222,8 12,15 51483,61
июнь 248 6 36 216 1296 1488 8929 234,21 167,31 61504
июль 261,3 7 49 343 2401 1829,1 12803,7 245,64 212,72 68277,69
август 231,9 8 64 512 4096 1855,2 14841,6 257,1 700,4 53777,61
сентябрь 255,1 9 81 729 6561 2295,9 20663,1 268,5 222,46 65076,01
октябрь 299 10 100 1000 10000 2990 29900 280 300,5 89401
Итого 2292,4 55 385 3025 25333 13569 98841,6 2285,3 1718,31 538417,62

na0+∑ta1+∑t2a2=∑yt

∑ta0+∑t2a1+∑t3a2=∑yixt

∑t2a0+∑t3a1+∑t4a2=∑ yixt2

10a0+55a1+3025a2=2292.4

55a0+385a1+3025a2=13569

385a0+3025a1+25333a2=98841.6

a0=165.6578

a1=11.4036

a20.0224

Yt=165.6578+11.4036t+0.0224t2


Построим прогноз (подставляя в найденное уравнение t)

номер года, t yt
11 291,1
12 305,73
13 317,69

Оценка точности прогноза:

Среднеквадратическая ошибка: δ=√(∑(yi-yt)2/n)=13.11

Коэффициент несоответствия: КН=√(∑(yi-yt)2/∑ yi2)=0,05649

Вывод: Первые два метода: метод среднего абсолютного прироста и среднего темпа роста неэффективны, так как построить прогноз невозможно, из-за невыполнения условий. А из метода экстраполяции трендовых моделей наиболее эффективным является модель прямой, так как у неё совпали два показателя yt и yi, а среднеквадратическая ошибка и коэффициент несоответствия одинаковые.


Список использованных источников


Громыко Г.Л. Теория статистики. Учебник. Москва: ИНФРА-М, 2000. – 414 с.

Колесникова, Н.Н. Статистика: учебное пособие./ Н.Н. Колесникова, Г.В. Круглякова. – Москва: Новое знание, 2007.-224 с.

Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Практикум по статистике. Питер, 2007. – 288 с.

Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005. – 190 с.

www.allstats