EРМОЛАEВ А ВЫБОРОЧНЫЙ МEТОД В СОЦИОЛОГИИ МEТОДИЧEСКОE ПОСОБИE М 2000 26 С 2

<< Пред. стр. 2 (из 2) След. >>

Формулы ошибки репрезентативности для стратифицированной выборки (непропорциональный отбор). [3, 24]
Предмет изучения. Повторный отбор. Бесповторный отбор. Среднее значение признака. Доля признака. Где:
- объем страты в генеральной совокупности.
- объем страты в выборке.
Как видно из формул, при непропорциональном отборе вместо средней внутригрупповых дисперсий берется сумма взвешенных по объему генеральной совокупности внутригрупповых дисперсий.
Стратифицированная выборка может проводиться пропорционально дисперсии признака в группах. Формулы ошибки репрезентативности для этого случая представлены в таблице 9.
Таблица 9.
Формулы ошибки репрезентативности для стратифицированной выборки (пропорционально колеблемости признака в группах). [3, 26]
Предмет изучения. Повторный отбор. Бесповторный отбор. Среднее значение признака. Доля признака.
Эти формулы являются просто преобразованными формулами ошибки репрезентативности для непропорционального отбора. Преобразование производится путем подстановки вместо выражения, которое будет представлено немного ниже.
4.2.3 Определение объема выборки.
Формулы для вычисления объема выборки за исключением отбора пропорционально дисперсии - легко получаются путем элементарных преобразований из формул ошибки репрезентативности.
Таблица 10.
Формулы для определения объема выборки при пропорциональном стратифицированном отборе.
Предмет изучения. Повторный отбор. Бесповторный отбор. Среднее значение признака. Доля признака.
Для непропорционального отбора число опрашиваемых в каждой страте определяется отдельно, исходя из их численности в генеральной совокупности.
Отбор пропорционально колеблемости признака в группе вносит и другой критерий для определения величены страт в выборке - внутригрупповую дисперсию.
Таблица 11.
Формулы для определения объема выборки при стратифицированном отборе пропорционально колеблемости признака в группе.
Среднее значение признака. Доля признака.
4.2.4 Плюсы и минусы стратифицированного отбора.
Стратифицированная выборка в любом случае оказывается точнее собственно-случайной. Этот метод особенно хорош, когда генеральная совокупность неоднородна. В этом случае собственно-случайный отбор крайне неэффективен (требует большого объема выборки).
Однако стратифицированная выборка может быть применена лишь при наличии дополнительной информации о генеральной совокупности (например, нам необходимо процентное соотношение мужчин и женщин, в случае, если мы хотим стратифицировать выборку по полу). Отсутствие такой информации делает применение стратифицированной выборки невозможным. Еще один недостаток стратифицированного отбора - это возможность систематической ошибки. Далее на примерах попытаемся проиллюстрировать различные способы применения стратифицированной выборки.
Пример: [6, 41] Возьмем опять данные о доходах из таблицы 1. Только теперь из этого же массива произведем не случайную, а стратифицированную выборку из четырех человек.
Для возможности проведения стратифицированной выборки сделаем допущение, что из предыдущей переписи мы знаем доходы респондентов за предыдущий период и имеем основания предполагать, что к этому периоду они не изменились или изменились пропорционально.
На основании этих данных можно стратифицировать генеральную совокупность по доходу. Результаты этого деления представлены в таблице 12.
Таблица 12.
Распределение респондентов по стратам.
№ группы. Респонденты, попавшие в группу. 1. A,J,D. 2. L,G,F. 3. I,H,C. 4. E,K,B.
Здесь в каждой группе (или страте) находятся люди с максимально близкими доходами. Необходимые нам четыре человека мы отбираем путем случайного отбора одного человека из каждой группы (т.е. проводим пропорциональную выборку).
В итоге мы получаем вполне репрезентативную по доходу выборку, т.к. в нашей выборке будут в нужной пропорции представлены люди с различным материальным достатком.
Более того, подобный отбор является надежнее случайного, т.к. при таком отборе не могут быть выбраны "плохие" выборки, т.е. выборки, содержащие только бедных или богатых (например, ADJL или BCEK). Однако стратифицированная выборка не всегда приносит выгоду, что показано в следующем примере.
Пример:[6, 42] Допустим, что перед нами опять встала необходимость провести стратифицированную выборку из респондентов, представленных в таблице 1. Далее предположим, что за период между переписью и опросом доходы респондентов претерпели значительные изменения, то выделенные нами группы на основе данных переписи могут получиться не гомогенными (в одну страту попадут люди с разными доходами). Например, такими, которые представлены в таблице 13.
Таблица 13.
Распределение респондентов по стратам.
№ группы. Респонденты, попавшие в группу. 1. A,F,C. 2. L,J,D. 3. K,E,G. 4. H,B,I.
В этом случае практически никакой выгоды по сравнению с собственно-случайной выборкой стратифицированный отбор не принесет, т.к. вероятность отбора нами плохих выборок сохранится и здесь.
Пример:[6, 42-46] Теперь рассмотрим случай с неоднородной генеральной совокупностью, т.е. совокупностью, в которой существуют отдельные резкие отклонения от средней тенденции. Например, генеральная совокупность, представленная в таблице 1, будет неоднородной, если, к примеру, респондент B вместо дохода в 6300 будет получать доход в 20000.
Стратифицировать в этом случае можно двумя путями: так, как было стратифицировано в таблице 12 и так, как это сделано в таблице 14.
Таблица 14.
Распределение респондентов по стратам.
№ группы. Респонденты, попавшие в группу. 1. A,J,D,L. 2. G,F,I,H. 3. C,E,K. 4. B.
В первом случае, как уже было сказано, был проведен пропорциональный отбор, а в данном случае - соответственно непропорциональный. Пропорциональный отбор в данном случае (в случае с неоднородной генеральной совокупностью) не годится, т.к. он не обеспечит однородность страт (в какую бы страту ни попал B, эта страта сразу же станет неоднородной).
Однако при непропорциональном отборе нарушается принцип равной вероятности попадания в выборку, т.к. респондент B попадает в нашу выборку при любом исходе.
Для исправления этого обстоятельства при непропорциональном отборе применяется процедура взвешивания. Взвешивание призвано "восстановить" Взвешиванием мы увеличиваем удельный вес респондентов из больших страт. Для нашего примера средняя будет рассчитываться следующим образом:

Если отобрать все возможные выборки при данной стратификации (таб. 14), то без взвешивания мы получим смещенную выборочную оценку (генеральная средняя = 3817, а выборочная средняя = 6852). Однако если произвести взвешивание, то в данном случае непропорциональный отбор (стандартное отклонение = 277) будет эффективнее пропорционального (стандартное отклонение = 1878).
Пример:
Рассмотрим далее рассмотренный выше пример с микрорайонами. Решение проблемы может состоять в увеличении объема выборки или в проведении случайного опроса. Но последнее может привести к некоторым искажениям и неточностям, т.к. микрорайоны отличаются также и между собой. Первое же связано с дополнительными расходами.
Здесь нам на помощь может прийти стратифицированная выборка. Ее можно осуществить если нам удастся объединить несколько микрорайонов как сходные. Разделив все микрорайоны на несколько относительно однородных групп, можно построить репрезентативную выборку, не увеличивая ее объем.
Стратифицированная выборка может помочь нам и тогда, когда нет полного списка жителей города. В этом случае можно из каждой страты выбрать один микрорайон, в котором будет проводиться опрос, и собрать информацию о его жителях.
Однако если мы неправильно выберем критерии для объединения микрорайонов, то это приведет к серьезной систематической ошибке.
4.3 Гнездовая (серийная) выборка.
4.3.1 Практическая реализация.
Здесь отбираются не люди, а группы. Группы отбираются случайным образом, а внутри них проводится сплошной опрос. Например, в ВУЗе с большим количеством студенческих групп отбор можно проводить путем случайного отбора этих групп и дальнейшего сплошного опроса в этих группах.
4.3.2 Вычисление ошибки выборки.
Формулы для расчета ошибки репрезентативности при гнездовом отборе даны в таблице 15.
Таблица 15.
Формулы ошибки репрезентативности для стратифицированной выборки. [3, 29]
Предмет изучения. Повторный отбор. Бесповторный отбор. Среднее значение признака. Доля признака.
Где:
- межгрупповая дисперсия.
r - число групп в выборке.
- групповая средняя.
- общая средняя.
R - число групп в генеральной совокупности.
- межгрупповая доля.
Ясно, что доверительный интервал при гнездовой выборке будет меньше (выборка точней) при той же надежности чем при случайной, т.к. межгрупповая дисперсия меньше общей дисперсии.
Внутригрупповая дисперсия нам не нужна, т.к. мы опрашиваем все гнездо целиком и поэтому отклонения выборочного показателя от генерального внутри этой группы не имеем. Следовательно, нас должно волновать то, правильно ли мы выбрали сами группы. Поэтому мы и учитываем лишь межгрупповую дисперсию.
4.3.3 Определение объема выборки.
Формулы для вычисления объема выборки - преобразованные формулы ошибки репрезентативности. Они даны в следующей таблице.
Таблица 16.
Формулы для определения объема выборки при гнездовом отборе.
Предмет изучения. Повторный отбор. Бесповторный отбор. Среднее значение признака. Доля признака.
4.3.4 Плюсы и минусы этого метода.
Разные источники по-разному оценивают точность гнездовой выборки по сравнению со случайной. [3, 29; 6, 49-50].
Главный "козырь" этого типа отбора в том, что он гораздо проще в организационном плане. Действительно, гораздо проще выбрать несколько групп и опросить их целиком, чем бегать за каждым респондентом. Это дает нам выигрыш в средствах и во времени.
Но при этом необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе ни о каком принципе случайности не может быть и речи. Более того, возможны перекосы из-за того, что на момент опроса не удается застать всех членов группы. К тому же объем выборки при гнездовом отборе обычно больше, чем при случайном отборе.
Пример:[6, 48-50]
Возьмем опять все ту же генеральную совокупность из таблицы 1 и сделаем из нее гнездовую выборку. Вопрос заключается в том, какие гнезда наиболее подходящие (здесь остается за скобками тот очевидный факт, что респонденты одного гнезда должны быть доступны в единый промежуток времени).
Для ответа на этот вопрос сначала разделим генеральную совокупность по принципу наибольшего сходства (в реальности эти группы нам, конечно же, уже заданы), т.е. в страты попадут люди с максимально близкими доходами. Результаты представлены в таблице 17.
Таблица 17.
Распределение респондентов по группам.
№ группы. Респонденты, попавшие в группу. 1. A,D,J,L. 2. F,G,H,I. 3. B,C,E,K.
В выборку попадет какая-либо из этих трех групп целиком. Естественно, что при таком разделении на группы, мы, скорее всего получим плохие результаты, т.к. исключаются "хорошие" выборки. Мы отбираем лишь людей с близкой величиной дохода.
Отсюда следует вывод, что при гнездовом отборе мы должны выбирать не максимально гомогенные, а максимально гетерогенные гнезда, т.к. эти гнезда должны представлять собой генеральную совокупность в миниатюре. Подобное разделение можно видеть в таблице 18.
Таблица 18.
Распределение респондентов по группам.
№ группы. Респонденты, попавшие в группу. 1. E,C,G,J. 2. A,H,K,L. 3. B,F,D,I.
Здесь люди сгруппированы так, что их доходы максимально различаются.
5. Неслучайные (невероятностные) методы отбора.
5.1 Почему применяют неслучайный отбор?
1. Невозможность проведения случайного отбора вследствие:
* ограниченности ресурсов (в широком смысле: ограниченность денежных средств, ограниченность времени, отведенного на проведение исследования, отсутствие списков единиц генеральной совокупности и т.д.);
* этических проблем (мы не можем заставить респондента отвечать, если он отказывается).
2. Отсутствие необходимости проведения случайного отбора.
5.2 Классификация методов неслучайного отбора.
Классификация, которой мы будем придерживаться в данном докладе, строится на основе критериев, предложенных В.Э. Шляпентохом. Хотя эта классификация не является абсолютно строгой, и часто трудно провести границу между двумя методами, она отражает основные отличия методов и позволяет их некоторым образом структурировать. Основными факторами, определяющими природу неслучайного отбора, являются:
1. Фактор доступности (насколько включение в выборку зависит от респондента). Этот фактор отражает искажение случайности, идущее со стороны респондентов.
2. Фактор целенаправленности (насколько состав выборки контролируется исследователем). Этот фактор определяет искажение случайности, идущее от исследователя.
Классификация методов неслучайного отбора на основе названных факторов представлена в таблице 1.
Таблица 1.
Классификация методов неслучайного отбора.
Факторы, определяющие природу неслучайного отбора Целенаправленность: контроль выборки исследователем: минимальный на среднем уровне максимальный Доступность: включение в выборку от респондента: не зависит А С E зависит В D X Рассмотрим подробнее каждый из типов неслучайного отбора.
5.2.1 Доступная выборка
Как следует из названия, в этом случае проводится отбор доступных единиц. Одним из плюсов этого метода являются сравнительно низкие издержки на поиск респондентов.
А: доступные респонденты выделены заранее;
В: респонденты выявляются в процессе опроса, поэтому действительное число доступных объектов определяется апостериори.
Сферы применения доступной выборки:
1) тестирование анкет
2) отработка процедур опроса
3) изучение интимных сторон жизни людей
4) изучение здоровья населения на основе данных об обращениях в больничные учреждения
5) монографические обследования.
С - соответствует принципам случайного отбора.
Этот тип выборки был подробно рассмотрен в предыдущих докладах.
5.2.2 Стихийная выборка.
Исследователь при применении данного метода в некоторой степени контролирует выборку (например, публикуя анкету в журнале, он обращается только к читателям этого журнала), но решение о включении в выборку принимает сам респондент.
Сферы применения стихийной выборки:
1) анкеты, публикуемые в периодическом издании
2) почтовые опросы.
5.2.3 Направленный отбор.
Можно выделить три основных метода направленного отбора:
1) метод типичных единиц (Е)
2) целевая выборка (Х)
3) квотный отбор (Х).
Остановимся на каждом из этих методов.
1. Метод типичных единиц.
При использовании данного метода отбираются единицы генеральной совокупности, обладающие средним (или типичным) значением признака. Однако в таком случае встает проблема выбора признака и определения его типичного значения. Субъективный характер оценки вполне может привести к систематической ошибке. Данный метод целесообразно применять для изучения таких объектов, о которых мы уже обладаем некоторой информацией, например, территориальных общностей, предприятий, учреждений и т.п.
2. Целевая выборка.
Сферы применения целевой выборки:
1) формирование состава участников эксперимента (например, формирование контрольных групп точечным методом, когда для каждого участника основной группы подбирается участник контрольной группы, обладающий сходными признаками). Это один из тех редких случаев, когда нет необходимости в проведении случайного отбора.
2) отбор экспертов, который может проводиться на основе следующих критериев:
* объективные характеристики экспертов, содержащиеся в документах
* тестирование кандидатов в эксперты
* взаимный отбор
* самооценка кандидатов в эксперты.
3. Квотный отбор.
Остановимся на описании этого метода более подробно, т.к. это один из самых распространенных методов неслучайного отбора.
При использовании данного метода отбирают один или несколько признаков, по которым будет контролироваться выборка. Количество единиц в выборке, обладающих определенными характеристиками, должно быть пропорционально количеству таких единиц в генеральной совокупности.
Виды квотного отбора.
Можно выделить две разновидности метода квот:
1) априорный отбор
2) апостериорный отбор.
Априорный отбор осуществляется интервьюером на стадии сбора первичной информации.
Апостериорный отбор проводится для корректировки выборки. Например, когда в газету приходят письма с заполненными читателями анкетами, часто среди ответивших имеется перекос по некоторым важным параметрам (возраст, пол и т.п.). В таком случае можно взвесить полученные результаты, а можно провести выборку из выборки квотным методом.
Почему используют квотный отбор?
1) отсутствие необходимости в повторных посещениях
2) достижение заданной точности результатов при меньшем объеме выборки.
Объем выборки при квотном отборе.
Считается, что при использовании метода квот можно делать выборку меньшего объема, чем при случайном отборе, так как квотный отбор дает почти полное совпадение выборочной и генеральной совокупностей по заданным параметрам. Однако это утверждение невозможно подтвердить при помощи математических методов. Единственный способ проверить его справедливость - провести эксперимент.
Такой эксперимент, например, поставил Ф.Э. Шереги. Сначала он случайным методом отобрал 300 рабочих текстильной фабрики в Узбекистане и доказал высокую репрезентативность выборки. Затем он произвел квотным методом выборку из этих 300 человек. Контролировалось два параметра: возраст и национальность. Сначала были отобраны 200 человек, затем - 100. Оказалось, что в выборке 200 человек около 80% всех параметров имели относительную ошибку не более 3%. В выборке 100 человек такую ошибку имели 55% параметров. В выборке 200 человек 6% параметров имели ошибку более 5%, а в выборке 100 человек такую ошибку имели 25% показателей [5, с.126].
Выбор признаков.
Во-первых, выбранные признаки должны быть тесно связаны с изучаемыми характеристиками, иначе полученные результаты могут оказаться сильно искаженными.
Во-вторых, признаки должны быть независимыми, иначе расход средств на их контроль будет нерациональным.
Требования к выборке могут быть жесткими и пониженными. Жесткие требования означают совпадение пропорций генеральной и выборочной совокупностей по сочетаниям признаков. В этом случае структура выборочной и генеральной совокупностей по заданным параметрам точно совпадают. При использовании пониженных требований контролируют лишь совпадение пропорций по каждому параметру отдельно.
Например, если исследователи решили контролировать выборку по четырем параметрам: пол (2 градации), возраст (7 градаций), образование (6 градаций) и род занятий (12 градаций), то при предъявлении пониженных требований они получат 2+6+7+12=27 групп, а при предъявлении жестких требований они получат 2*6*7*12=1008 групп.
Обычно к выборке предъявляют пониженные требования, так как в обратном случае теряется основное преимущество квотного отбора - малый объем выборки, и увеличиваются затраты на поиск респондентов, обладающих определенными характеристиками.
Чаще всего используются социально - демографические признаки, так как:
* они часто носят ключевой характер
* легко получить информацию о распределении по этим признакам единиц в генеральной совокупности.
Обычно используют не более трех - четырех признаков, так как при увеличении их числа растет число ограничений и, соответственно, растут затраты на поиск респондентов.
Трудности, возникающие при применении метода квот.
1. Необходимо предварительное изучение объекта для выявления в нем пропорций единиц с различными характеристиками и связей между характеристиками.
2. Необходима свежая информация о генеральной совокупности. Например. Если активно происходят какие-то демографические процессы, например, миграция, то применение данных переписи населения, проведенной несколько лет назад, может дать большую систематическую ошибку.
3. Некоторые проблемы могут возникнуть на полевом этапе проведения исследования:
3.1 Интервьюер, скорее всего, будет проводить отбор среди наиболее доступных ему лиц, поэтому выборка имеет тенденцию превращаться в доступную. При этом проблема "крепких орешков" не решается, а обходится, так как даже в группе труднодоступных, "дефицитных" респондентов будет происходить смещение в сторону тех, кто наиболее охотно идет на контакт с интервьюером.
3.2 Ближе к концу полевого этапа часто возникает группа "дефицитных" признаков, поэтому повышается соблазн для интервьюера сфальсифицировать результаты.
Пути усовершенствования квотного метода.
1. Часто метод квот применяется не в чистом виде, а в смеси со случайным. Например, интервьюер получает список лиц, с которыми он должен вступить в контакт, и проводит интервью только с теми, кто оказался носителем необходимых параметров. Для внесения элементов случайности интервьюеру может быть задан определенный маршрут, который он обязан соблюдать при поиске респондентов.
2. Квотный метод можно применять в многоступенчатой случайной выборке (на последней ступени отбора). Используемая на предшествующих ступенях случайная стратифицированная выборка обеспечит самовзвешивание по важнейшим признакам.
3. Квотный метод может применяться для замены труднодоступных единиц при использовании случайного отбора.
6. Литература.
1. Венецкий И.Г. Виды выборки.//Вестник статистики, 1974, №2.
2. Кокрен У. Методы выборочного исследования. М., "Статистика", 1976.
3. Ноэль Э. Массовые опросы. Введение в методику демоскопии. М., Ава-Эстра, 1993.
4. Шереги Ф.Э. Применение метода квот в выборочном социологическом исследовании.//СОЦИС, 1975, №3.
5. Шляпентох В.Э. Проблемы репрезентативности социологической информации (случайная и неслучайная выборки в социологии). М., "Статистика", 1976.
6. Sudman S. Reducing The Cost of Surveys. Chicago, 1967.
7. Ноэль. Э. "Массовые опросы". М. Ава-Эстра, 1993г. (с.85-111)
8. Батыгин. Г. С. "Методология социологического исследования" (с. 169)
9. Королев. Ю. Г. "Выборочный метод в социологии". М. 1975г. (с.8-33)
10. "Методика выборочного обследования миграции сельского населения" (под ред. Заславской, Миркиной, Ершовой). Новосибирск. 1969г. (с.58-68)
11. Кокрен. У. "Методы выборочного исследования" М. Статистика. 1976г. (с.104-107)
12. Hansen, Hurwitz, Madow. "Sample Survey [Methods and Theory]" v.1. Wiley Classics Library. 1953. (с. 13, 34-52).
13. Батыгин Г. С. Лекции по методологии социологических исследований. М.: "Аспект-Пресс", 1995.
14. Венецкий И. Г. Теоретические и практические основы выборочного метода. М., 1971.
15. Вестник статистики. 1921, №№ 1-4.
16. Гмурман В. Г. Теория вероятностей и математическая статистика. М.: "Высшая школа", 1998.
17. Кокрен У. Методы выборочного исследования. М.: Статистика, 1976.
18. Ноэль Э. Массовые опросы. Введение в методику демоскопии. М.: "АВА-ЭСТРА", 1993.
19. Паниотто В. И. Качество социологической информации. Киев: "Наукова Думка", 1986.
20. Рабочая книга социолога. М.: "Наука", 1976.
21. Чурилов Н. Н. Проектирование выборочного социологического исследования. Киев: "Наукова Думка", 1986.
22. Шаповалов В. И., Гаскаров Д. В. Малая выборка. М.: Статистика, 1978.
23. Hansen H., Hurwitz N., Madow G. Sample survey. Methods and theory. New York, 1993.
24. Kalton G. Introduction to survey sampling.

1 О причинах систематических ошибок см., например, [1, 132-168].
2 Следует заметить, что бесповторный отбор не отвечает принципу случайности. Это нарушение тем существеннее, чем меньше ГС. Однако на практике как правило применяется бесповторный отбор.
3 Мы не будем приводить доказательство.
4 Мы не будем приводить доказательство этих соотношений.
5 Выборка считается более эффективной, если:
1. при одинаковых расходах она более точна.
2. при одинаковой точности она более дешевая. [6, 34]

6 Вообще любое повышение точности выборки возможно только благодаря наличию дополнительной информации о генеральной совокупности.
Эту информацию можно получить из постоянно проводящихся обследований Госкомстата РФ, а также из отдельных статистических, демографических и социологических исследований.
7 В данном параграфе рассматривается лишь один из многих возможных способов. Задача состояла в том, чтобы показать саму возможность подобной методики.
8 Под корреляцией здесь понимается то, что удельный вес каждой единицы генеральной совокупности остался примерно тот же, что и в прошлом году. Иными словами, имеется в виду пропорциональный рост или снижение доходов.
9 Принцип моделирования выборки станет более понятен при непосредственном рассмотрениии модификаций случайной выборки.
10 При случайном отборе существует 495 возможных выборок при генеральной совокупности в 12 человек и при объеме выборки 4 человека. В нашем случае (при объеме выборки в 3 человека) число возможных выборок еще больше.
11 То есть пропорционально дисперсии признака в группах.
12 То же самое справедливо и для доли, т.к. есть не что иное, как дисперсия доли.
13 Под "размытостью" понимается большая внуригрупповая и маленькая межгрупповая дисперсии. Иными словами, рассматриваемый нами признак примерно равномерно распределен в выделенных группах.
??

??

??

??

Выборочный метод в социологии 2

<< Пред. стр. 2 (из 2) След. >>

Список литературы по разделу