Маркетинговые исследования

Голубков Е.П., академик Международной академии информатизации, д.э.н., профессор АНХ при Правительстве РФ   Опубликовано в номере: Маркетинг в России и за рубежом №1 / 2001

(Продолжение. Начало журнал "Маркетинг в России и за рубежом" в №№ 1, 2, 3, 5 и 6 за 2000 г.)

Маркетинговые исследования

 5. Разработка и реализация плана исследований

5.1 Выбор методов сбора данных

Можно выделить следующие методы сбора данных при проведении опросов с участием интервьюеров или самостоятельном заполнении анкет респондентами:

1. Интервьюирование, осуществляемое на дому у респондента. Возможно предварительное согласование сроков интервью по телефону.

Обычно в этом случае легче установить доверительные отношения с опрашиваемым, возможен показ образцов товара, рекламных материалов и т.п. Домашняя обстановка настраивает на достаточно длительное интервью с высокой степенью концентрации внимания на проводимом обследовании. Однако это дорогой метод сбора данных.

2. Интервьюирование посетителей крупных магазинов. Компании, проводящие такие обследования, могут в крупных магазинах иметь свои офисы. Посетители магазина опрашиваются интервьюером в помещении магазина или могут приглашаться для дачи интервью в офис. C помощью данного метода, без использования специальных методических подходов, трудно обеспечить репрезентативность результатов обследования и вдумчивое отношение опрашиваемых к задаваемым вопросам. По сравнению с первым данный метод является более дешевым.

3. Интервью в офисах. Используется обычно при сборе информации о продукции производственно-технического и офисного назначения. Этот метод, по существу, обладает теми же достоинствами и недостатками, что и первый, однако имеет более высокую стоимость проведения, обусловленную использованием более квалифицированных интервьюеров.

4. Традиционное телефонное интервью. К числу достоинств данного метода сбора данных относятся: относительно низкая стоимость, возможность охватить большое число респондентов и обеспечить высокий уровень репрезентативности, возможность проведения за относительно короткий период времени. Методу присущи следующие недостатки: невозможность что-либо показать респонденту, невозможность получить личное впечатление от встречи с респондентами. (Правда, отсутствие личного контакта порой способствует получению правдивых ответов на вопросы о потреблении алкоголя, противозачаточных средств и т.п.) Далее - трудность получения пространных ответов на большое число вопросов, так как терпение респондента может иссякнуть. Кроме того, трудно проверить качество проведенного интервью и установить, все ли запланированные к опросу респонденты в реальности были им охвачены.

5. Телефонное интервью из специально оборудованного помещения, где одновременно работают несколько интервьюеров, к телефонам которых могут подсоединяться контролеры.

6. Телефонное интервью с помощью компьютера. Многие компании, занимающиеся опросом потребителей, специально оборудованные помещения для телефонного интервьюирования оснащают компьютерной техникой. Эта техника осуществляет автоматический набор телефонных номеров респондентов, далее на мониторе появляется вступительный текст, а затем - последовательно задаваемые вопросы с возможными вариантами ответов. Интервьюер зачитывает респонденту вопросы и с помощью кода фиксирует названный вариант ответа.

7. Полностью компьютеризованное интервью. В данном случае в дополнение к ранее описанному методу респондент отвечает на вопросы путем нажатия на кнопки своего телефона или вопросы появляются на мониторе его компьютера, а респондент вводит ответы, используя обычную компьютерную клавиатуру.

8. Групповое самостоятельное заполнение анкет. Такой подход используется для удобства и удешевления интервьюирования. Например, перед двадцатью-тридцатью членами группы демонстрируется рекламный ролик, после чего они индивидуально отвечают на вопросы анкеты, касающиеся оценки данного ролика. Участниками группы могут быть школьники одного класса, студенты одной учебной группы, отдыхающие дома отдыха и т.д.

9. Самостоятельное заполнение оставленных анкет. Является вариантом обследования на основе самостоятельного заполнения анкет. После предварительного устного разъяснения целей и задач проводимого обследования анкета оставляется у респондента. Заполненную анкету, спустя определенное время, или забирают у респондента, или он отсылает ее по почте в конверте с оплаченным ответом. Данный метод применяется при проведении опросов на ограниченной территории, не требующей от интервьюера значительных передвижений.

10. Обследование по почте. Вопросы и ответы на них посылаются по почте. Достоинства метода обусловлены тем, что не надо нанимать интервьюеров, легкостью формирования групп целевых респондентов, его дешевизной. Этот метод обладает теми же недостатками, что и методы самостоятельного заполнения анкет без участия интервьюера. Кроме того, он характеризуется низким процентом возвращенных ответов, ориентирован в основном на достаточно грамотных людей, проживающих к тому же в странах с эффективной почтовой системой.

Выбор конкретных методов обследований основан на учете следующих групп факторов: цели и ресурсы исследователя; характеристики респондентов; характеристики вопросов, задаваемых исследователем. Кратко охарактеризуем эти три группы факторов.

Цели сбора данных вытекают из целей проводимого маркетингового исследования. В основе их определения лежат требования получения информации желаемого качества. Последнее же обусловлено временем, отпущенным на принятие решения, и имеющимися ресурсами.

К числу наиболее быстро реализуемых методов относятся телефонный опрос и интервьюирование посетителей крупных магазинов. Отсутствие достаточных денежных средств также оказывает влияние на выбор метода сбора данных. Наиболее дешевым методом является телефонное интервьюирование.

Следует рассмотреть, по крайней мере, следующие характеристики целевой группы респондентов, влияющие на выбор метода сбора данных:

1. Процент респондентов, обладающих требуемыми характеристиками в общей совокупности опрашиваемых. Например, если исследуется концепция низкокалорийных продуктов питания, приготавливаемых в микроволновой печи, то в качестве целевых респондентов следует рассматривать домохозяек, имеющих микроволновые печи и которые в течение последних шести месяцев покупали низкокалорийные продукты питания.

2. Желание участвовать в опросе. Исследователя всегда беспокоит высокая степень отказа респондентов в участии в обследовании. Можно выделить два типа причин нежелания принять участие в любом обследовании. Первый обусловлен некими обобщенными чувствами подозрительности и стремлением никого не допускать в свою личную жизнь: определенная категория людей просто не хочет принимать участия в любом опросе. Второй связан со специфическими обстоятельствами проведения конкретного обследования. Например, некоторые респонденты не желают обсуждать определенные темы. Выбранный метод опроса влияет на степень желания участвовать в обследовании, Так, потенциальные респонденты находят более трудным отказаться от участия в личном интервью, чем в почтовом опросе.

3. Возможность принятия участия в опросе. Даже если потенциальный респондент удовлетворяет двум вышеизложенным требованиям, он в силу тех или иных причин может не принять участие в обследовании (командировка, болезнь, неожиданные семейные обстоятельства, забывчивость и т.п.).

Выбор методов сбора данных во многом определяется уровнем сложности вопросов. Существенное влияние на выбор метода сбора данных оказывает степень затрагивания личных интересов, взглядов, морально-этических аспектов Опыт изучения данных проблем говорит о том, что здесь менее всего подходит персональное интервью, а чаще всего наиболее приемлемым является телефонное интервью или интервью с помощью компьютера.

5.2 Вопросник и порядок его разработки

Главными инструментами реализации методов наблюдения и опроса являются анкета (вопросник) и механические устройства, например счетчики количества людей, кино- и видеокамеры. Далее будет чаше использоваться термин "вопросник", поскольку он носит более общий характер - анкета применяется только при письменных ответах на поставленные вопросы.

Обычно процесс составления вопросника осуществляется в следующей последовательности:

1. Определение целей опроса.

2. Выбор методов сбора данных.

3. Разработка вопросов.

4. Оценка вопросов.

5. Одобрение со стороны клиента.

6. Тестирование.

7. Уточнение анкет.

Определение целей опроса и выбор методов сбора данных были рассмотрены ранее. Ниже дается описание процесса непосредственного составления вопросника. Этот процесс носит итеративный характер и направлен на последовательное уточнение содержания вопросника, повышение вероятности получения достоверных ответов, исключение влияния содержания вопросов и их формата на получаемые ответы.

Вопросник обычно состоит из трех частей: введения, реквизитной части и основной части.

Главная задача введения - убедить респондента принять участие в опросе. Оно должно содержать цель проводимого опроса и призвано показать, какую пользу получит респондент, приняв в нем участие.

В реквизитной части приводится информация, касающаяся респондентов. Кроме того, здесь идентифицируется сам вопросник, то есть ему дается название, указываются дата, время и место проведения опроса, фамилия интервьюера.

При разработке основной части вопросника следует обратить внимание на: тип вопросов (формат ответов), их содержание и число, последовательность представления вопросов в анкете, наличие контрольных вопросов.

Существуют три основных формата задаваемых вопросов: открытые вопросы, закрытые вопросы и вопросы со шкалой ответов.

Открытый вопрос - вопрос анкеты, позволяющий опрашиваемому отвечать на него "своими словами". В таких вопросах отсутствует предвзятость, стремление навязать определенный ответ. Однако ответы на открытые вопросы требуют достаточно больших затрат времени. Кроме того, полученные ответы могут быть интерпретированы по-разному.

Закрытый вопрос включает все возможные варианты ответов, из которых опрашиваемый делает свой выбор. Использование данного типа вопросов активизирует деятельность респондентов по заполнению анкет, облегчает процесс ввода полученных данных. Главный недостаток вопросов с многовариантным выбором обусловлен трудностью формулирования всех возможных вариантов ответов, характеристик или факторов.

Вопросы со шкалой ответов содержат четкие, возможно количественные, дескрипторы, определяющие отдельные градации шкалы или ее конечные точки. На таких принципах, например, построены шкалы Лайкерта и семантической дифференциации.

Что касается метода сбора данных, то очевидно, что, скажем, телефонное интервью предполагает использование относительно простых вопросников по сравнению с опросами, проводимыми по почте.

Определяя содержание вопросов, необходимо учесть следующие обстоятельства.

Вопрос должен быть сфокусирован на одной проблеме или теме, быть кратким и понятным. Все респонденты должны понимать заданный вопрос однозначно и отвечать именно на него, а не на свои варианты его домысливания. Вопросы следует формулировать в нейтральной тональности, без некоей положительной или отрицательной оценки рассматриваемой проблемы, не должны склонять респондента к ответу, желаемому для исследователя.

При определении числа вопросов следует руководствоваться тезисом: чем их меньше, тем больше шансов получить на них ответы.

Желательно, чтобы вопросы излагались в определенной логической последовательности. Вначале следует задать вопросы, с помощью которых можно определить уровень компетентности респондентов в области проводимого исследования. Дальнейшие вопросы должны служить целям "разминки" респондентов. Эти вопросы должны быть относительно простыми, легкими для ответов, а кроме того, заинтересовывать опрашиваемых, показать им, что они легко справятся с ответами. За разминочными следуют основные вопросы.

Наиболее трудные вопросы, требующие для ответа использования специальных шкал и достаточных умственных усилий, рекомендуется ставить в середине или ближе к концу анкеты.

Вопросы, носящие чрезмерно личный характер ("Чистите ли Вы зубы каждый день?" "Часто ли Вы на своем автомобиле превышаете допустимую скорость?"), обычно помещаются среди "невинных" вопросов.

Описанное выше носит характер общих рекомендаций. Однако существуют, по крайней мере, два специальных подхода к проектированию вопросников: туннельный и секционный.

При использовании туннельного подхода имеет место постепенный переход от широких, общих вопросов к более узким, частным.

Секционный подход заключается в том, что последовательно рассматриваются вопросы по отдельным темам, до их полного исчерпания.

На практике зачастую используется комбинация рассмотренных подходов.

Опрос может носить анонимный и конфиденциальный характер.

В первом случае респондент должен быть уверен, что его имя и другие реквизиты не будут известны исследователям. Во втором случае предполагается, что имя респондента известно только исследователю, но отнюдь не заказчику данного обследования. В телефонном опросе и при опросах, связанных с присутствием интервьюеров, опрос носит только конфиденциальный характер.

5.3 Рассмотрим понятия выборочных исследований

Рассмотрим основные понятия, используемые при проведении выборочных исследований.

Вся исследуемая группа в целом, например все потребители, купившие какой-нибудь продукт, в статистике называется генеральной совокупностью или просто совокупностью. Иногда совокупность является достаточно малой по своей численности и можно изучить всех ее членов. Обычно же это сделать невозможно. Следовательно, проводится изучение только части совокупности, называемой выборкой.

Выборка является базовым уровнем проводимых исследований.

Необходимо отметить, что данные, полученные от выборки, скорее всего не будут в точности соответствовать данным, которые можно было бы получить от всех единиц совокупности. Различие между данными, полученными от выборки и истинными данными, называется ошибкой выборки. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Эти вопросы будут рассмотрены ниже.

Формирование выборки основывается прежде всего на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области.

При формировании выборки используются вероятностные (cлучайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому термин "известная вероятность" скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отбор предполагает, что вероятность быть включенным в выборку известна и является одинаковой для всех единиц совокупности. Вероятность эта определяется отношением объема выборки к размеру совокупности.

Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел.

При использовании метода формирования выборки вслепую единицы совокупности в соответствии с их фамилиями, названиями или другими признаками вносятся в карточки, которые в перемешанном виде помещаются в какую-то непрозрачную емкость (ящик, коробку и т.п.). Из данной емкости кто-то случайным образом вытягивает число карточек, определяемое объемом выборки.

В таблицах случайных чисел содержатся числа, порядок включения которых в таблицу осуществлен случайным образом. Единицам совокупности присваивают порядковые номера. В таблице случайных чисел выбирают любую начальную точку и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирают необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки.

Кроме того, используются генераторы случайных чисел. Например, при телефонном интервьюировании компьютер, имеющий генератор случайных чисел, может генерировать случайным образом телефонные номера.

Начальная часть метода систематического отбора соответствует начальному этапу проведения метода простого случайного отбора: необходимо получить полный список единиц генеральной совокупности. Однако далее вместо присвоения им порядковых номеров используется показатель "интервал скачка", рассчитанный как отношение размера совокупности к объему выборки. Например, если используется телефонный справочник и интервал скачка определен равным 250, то это означает, что каждый 250-й телефонный номер включается в выборку. Однако для определения начальных страницы и колонки справочника используются случайные числа.

Особенно широко метод систематического отбора применяется, когда для различных видов совокупностей существуют различные справочники, списки, спецификации и иные подобные материалы.

Другим методом вероятностного отбора является кластерный отбор, основанный на делении совокупности на подгруппы, каждая из которых представляет совокупность в целом. Базовая концепция данного метода очень похожа на базовую концепцию метода систематического отбора, однако реализация этой концепции осуществляется по-другому.

Предположим, что исследуется мнение населения какого-то региона относительно марки какого-либо товара. Регион разбивается на четко определяемые части (кластеры), например области. Исследователь может считать, что выделенные кластеры являются идентичными и мнение населения этих областей характерно для региона в целом. Далее одна из областей (один кластер) выбирается случайным образом, определяется совокупность для этой области, в ней проводится соответствующее исследование, а выводы распространяются на совокупность всего региона (одноступенчатый подход).

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик, - говоря иными словами, что каждая выборка достаточно полно характеризует всю совокупность и различные крайности в выборке уравновешивают друг друга. Однако такая ситуация на практике встречается крайне редко. Скажем, исследуется рыночный потенциал определенного региона для какого-то товара, но и население больших, средних и малых городов, сельской местности данного региона различается по уровню образования, доходу, образу жизни и т.п.

В случае несимметричного распределения совокупности последняя подразделяется на различные подгруппы (страты), например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора. Далее для каждой страты с помощью случайного отбора формируется выборка.

При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятности, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности.

Кратко охарактеризуем следующие невероятностные методы отбора: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например, с позиций минимальных затрат времени и усилий, с позиции доступности респондентов.

Формирование выборки на основе суждений основано на использовании мнений квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Формирование выборки в процессе обследования основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется в проводимом исследовании, затем она по мере проведения обследования расширяется.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования принимается решение, что в универсаме должно быть опрошено пятьдесят мужчин и пятьдесят женщин, и интервьюер проводит опрос, пока не выберет установленную квоту.

На практике имеет место одновременное использование нескольких методов формирования выборки.

5.4 Этапы разработки выборочного плана

Рассмотренные выше понятия встраиваются в определенную логическую последовательность отдельных шагов (этапов) по разработке выборочного плана, целью которого является получение конечного варианта выборки. Можно выделить следующие обобщенные этапы разработки выборочного плана:

1. Определение соответствующей совокупности.

2. Получение "списка" совокупности.

3. Проектирование выборочного плана.

4. Достижение нужного объема выборки или ее переформирование.

Кратко охарактеризует отдельные этапы разработки выборочного плана.

На первом этапе определяется совокупность исходя из целей исследования.

На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности, - это нужно для определения контура выборки. На данном этапе также необходимо оценить ошибку контура выборки.

На третьем этапе с учетом ранее выполненных работ осуществляется проектирование самой выборки. Здесь необходимо найти баланс между структурой выборки, затратами на сбор данных и объемом выборки, а также в деталях обсудить выборочные методы.

Достижение нужного объема выборки осуществляется в два этапа. Прежде всего устанавливается единица выборки, затем, исходя из этой единицы, должна быть получена требуемая информация. Однако очевидно, что на ряд выбранных респондентов в силу тех или иных причин невозможно выйти и что не каждый выбранный респондент выразит желание отвечать на вопросы. Возникает проблема замены респондентов, которая может быть решена с помощью трех методов: выбор следующего по списку респондента (например, следующего номера в телефонном справочнике), использование первоначальной выборки больших размеров и формирование повторной выборки. В последнем случае, если процент ответов оказался намного ниже, чем ожидалось, контуры исходной выборки расширяются за счет дополнительных имен, найденных, скажем, случайным образом.

Переформирование выборки осуществляется тогда, когда проверка показала, что выборка не представляет совокупность в целом. В этом случае выбираются новые респонденты, и они добавляются к ранее использованной выборке, пока не достигается удовлетворительный уровень репрезентативности.

В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации - прежде всего имеются в виду затраты на проведение опроса.

На практике используется несколько подходов к определению объема выборки. Прежде всего опишем наиболее простые.

Произвольный подход основан на применении "правила большого пальца". Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Данный подход является простым и легким в исполнении, однако при его применении не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весьма дорогим.

Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно составляет 1000-1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры.

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать, и очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности получаемых результатов.

Наиболее теоретически обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в основе которых лежит ряд базовых понятий математической статистики (вариация, среднее квадратическое отклонение, доверительный интервал, средняя квадратическая ошибка). Краткое описание данных понятий приводится в приложении.

На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки. Все формулы для расчета объема выборки предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки. (Более подробную информацию по данным вопросам можно получить из работ [2, 3, 4].)

5.5 Организация и проведение сбора данных

Существуют по крайней мере три альтернативных подхода к сбору данных: осуществлять это самим, осуществлять путем создания специальной группы или путем привлечения коммерческих компаний, специализирующихся на сборе данных.

В первом случае сотрудники маркетинговой службы организации своими силами производят сбор данных - скажем, путем интервьюирования.

Специальная группа обычно комплектуется из специалистов не очень высокой квалификации, например студентов, для проведения телефонного или персонального интервьюирования.

Услуги специализированных компаний, осуществляющих маркетинговые исследования, в большинстве случаев обеспечивают быстрое и качественное получение маркетинговых данных. Однако стоимость их услуг в три-пять раз превышает стоимость других двух подходов к сбору данных. Поэтому ее необходимо сопоставлять с качеством и надежностью получаемой информации.

Большое значение имеет правильное проведение сбора данных. При личном интервьюировании необходимо представиться и сказать несколько слов о проводимом исследовании. При использовании анкеты данная информации должна содержаться в ее вводной части. Следует подчеркивать конфиденциальность ответов. Скажите, сколько времени займет опрос. Не начинайте с вопросов о доходах и других вопросов личного характера. Помогайте респонденту разобраться в сложных вопросах.

При сборе данных могут иметь место многие погрешности - другие, нежели ошибки выборки, называемые поэтому невыборочными ошибками.

Невыборочные ошибки включают: 1) типы ошибок, обусловленные тем, что не все респонденты дали ответы; 2) ошибки сбора данных; 3) ошибки обращения с полученными данными; 4) ошибки анализа собранных данных; 5) ошибки интерпретации полученных результатов. Кроме того, существуют ошибки, обусловленные нечетким выявлением проблем, использованием неоднозначных терминов, и т.п.

Невыборочные ошибки можно классифицировать на ошибки лиц, осуществляющих сбор данных, и ошибки респондентов. Кроме того, невыборочные ошибки подразделяются на преднамеренные и на непреднамеренные.

Преднамеренные ошибки лица, собирающего информацию, имеют место, когда оно сознательно нарушает установленные исследователем требования к сбору данных.

Непреднамеренная ошибка лица, собирающего информацию, главным образом определяется неправильным пониманием интервьюером отдельных аспектов сбора данных, изложенных в различных инструкциях, хотя ему и кажется, что он все делает правильно.

Существуют два вида преднамеренных ошибок респондентов.

Первый вид обусловлен стремлением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на персональные вопросы (об уровне дохода, о национальности, возрасте, семейном положении и т.п.), из-за подозрения, что интервьюер преследует какие-то свои цели.

Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам.

Непреднамеренная ошибка респондента возникает в случае, когда респондент, думая, что говорит правду, на самом деле дает ошибочный ответ.

Контроль за преднамеренными ошибками интервьюеров осуществляется двумя способами: путем надзора за их работой и путем проверки выполненной работы. Надзор осуществляется, например, незаметным подключением к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо.

Контроль за преднамеренными ошибками респондентов направлен на снижение числа случаев лжи и отказа участвовать в обследовании. Для этого прежде всего необходимо сохранять анонимность и конфиденциальность.

Контроль за непреднамеренными ошибками респондентов осуществляется в различных формах. Необходимо тщательно составлять вопросники и инструкции к ним, использовать разнонаправленные шкалы измерений. Для уменьшения числа ответов-предположений в шкалы вводятся такие градации, как "не имею мнения", "не могу вспомнить", "не уверен".

Можно выделить три типа ошибок, обусловленных нежеланием респондентов отвечать на вопросы: из-за отказа вообще принять участие в обследовании, из-за прекращения участия в нем и из-за отказа отвечать на определенные вопросы.

Перед тем как табулировать и анализировать данные проведенного обследования, целесообразно произвести их предварительную проверку и выявить ошибки респондентов. Жестких правил в данной области не существует, и они основаны на традициях, опыте и т.п., то есть на неформальных подходах к определению, какие анкеты пригодны для последующего анализа, а какие нет. Поэтому лучше ужесточить контроль за сбором анных, уменьшив таким образом проблемы предварительной оценки собранных данных.

5.6 Анализ данных и подготовка заключительного отчета

Анализ данных начинается с перевода полученных "сырых" сведений в осмысленную информацию и включает их введение в компьютер, проверку на предмет выявления ошибок, кодирование, представление в матричной форме (табулирование). Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды - респондентов или изучаемые ситуации. Все это называется преобразованием исходных данных.

Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов.

Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: дескриптивный анализ, выводной анализ, анализ различий, анализ связей и предсказательный анализ. Иногда эти виды анализа используются по отдельности, иногда - одновременно.

В основе дескриптивного анализа лежит использование двух групп статистических мер. Первая включает меры "центральной тенденции", или меры, которые описывают типичного респондента или типичный ответ (средняя величина, мода, медиана). Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов относительно "типичных" респондентов или ответов (распределение частот, размах вариации и среднее квадратическое отклонение).

Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые, и не представляют особого интереса для заказчика.

Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю совокупность, называется выводным анализом. Вывод является видом логического анализа, направленного на получение общих заключений о всей совокупности на основе наблюдений за малой группой единиц данной совокупности.

Выводы делаются на основе анализа малого числа фактов. Например, если два ваших товарища, имеющие одну и ту же марку автомобиля, жалуются на его качество, то вы можете сделать вывод о низком качестве данной марки автомобиля в целом.

Статистический же вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В данном случае результаты выборочных исследований являются только отправной точкой для получения общих выводов. Например, автомобилестроительная компания провела два независимых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в течение последних шести месяцев. Вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: "Удовлетворены или не удовлетворены вы купленной вами моделью автомобиля?" Первый опрос выявил 30% неудовлетворенных, второй - 35%.

Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. Для первого случая около 30% опрошенных выразили неудовлетворенность купленной моделью автомобиля, для второго случая - около 35% опрошенных. Какой же общий вывод можно сделать в данном случае? Как избавиться от слова "около"? Для этого введем показатель ошибки: 30% ± x% и 35% ± y% и сравним x и y. Используя логический анализ, можно прийти к заключению, что бо2льшая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей. Видно, что решающим фактором для получения правильных выводов является размер выборки. Данный показатель присутствует во всех формулах, определяющих содержание различных методов статистического вывода.

Анализ различий используется для сравнения результатов исследования двух групп (двух рыночных сегментов) с целью определения степени реального различия в их поведении, в реакции на одну и ту же рекламу и т.п.

Проверка существенности различий заключается в сопоставлении ответов на один и тот же вопрос, полученных для двух или более независимых групп респондентов. Кроме того, в ряде случаев представляет интерес сравнение ответов на два или более независимых вопросов для одной и той же выборки.

Примером первого случая может служить изучение вопроса: что предпочитают пить по утрам жители определенного региона - кофе или чай. Первоначально было опрошено на основе формирования случайной выборки 100 респондентов, 60% которых отдают предпочтение кофе; через год исследование было повторено, и только 40% из 300 опрошенных человек высказались за кофе. Как можно сопоставить результаты этих двух исследований? Прямым арифметическим путем сравнивать 40 и 60% нельзя из-за разных ошибок выборок. Хотя в случае больших различий в цифрах, скажем 20 и 80%, легче сделать вывод об изменении вкусов в пользу кофе. Однако если есть уверенность, что эта большая разница обусловлена прежде всего тем, что в первом случае использовалась очень малая выборка, то такой вывод может оказаться сомнительным. Таким образом, при проведении подобного сравнения в расчет необходимо принять два критических фактора: степень существенности различий между величинами параметра для двух выборок и средние квадратические ошибки двух выборок, определяемые их объемами.

Анализ связей направлен на определение систематических связей (их направленности и силы) переменных. Например, его предметом можеть быть определение, как увеличение затрат на рекламу влияет на рост сбыта.

Очень часто маркетолог ищет ответы на вопросы типа: "Увеличится ли показатель рыночной доли при увеличении числа дилеров?", "Есть ли связь между объемом сбыта и рекламой?" Такие связи не всегда имеют причинно-следственный характер, а могут иметь просто статистическую природу. В приведенных выше вопросах можно определенно говорить о влиянии одного фактора на другой. Однако степень влияния изучаемых факторов может быть различной; скорее всего, влияние при этом могут оказывать также какие-то другие факторы.

Предсказательный анализ используется в целях прогнозирования развития событий в будущем - например, путем анализа временных рядов.

Маркетолог хорошо знает, насколько важна хорошая упаковка для продаваемого товара. Результаты маркетинговых исследований также являются товаром и поэтому должны быть хорошо "упакованы".

Прежде всего, структура заключительного отчета должна соответствовать особым требованиям заказчика. Если их нет, то можно рекомендовать при подготовке заключительного отчета разделить его на три части: вводную, основную и заключительную.

Вводная часть включает начальный лист, титульный лист, договор на проведение исследования, меморандум, оглавление, перечень иллюстраций и аннотацию.

Основная цель меморандума заключается в ориентации читателя на изученную проблему и в создании у отчета положительного имиджа. Меморандум имеет персональный и слегка неформальный стиль. В нем кратко говорится о характере исследования и об исполнителях, комментируются результаты исследования, делаются предложения о дальнейших исследованиях. Объем меморандума - одна страница.

Аннотация ориентирована прежде всего на руководителей, которых не интересуют детальные результаты проведенного исследования. Иногда ее называют поэтому "генеральским отчетом". Кроме того, аннотация должна настроить читателя на восприятие основного содержания отчета. В ней должны быть охарактеризованы: предмет исследования, круг рассмотренных вопросов, методология исследования, основные выводы и рекомендации. Объем аннотации - не более одной страницы.

Основная часть отчета состоит из введения, характеристики методологии исследования, обсуждения полученных результатов, констатации ограничений, а также выводов и рекомендаций.

Введение ориентирует читателя на ознакомление с результатами отчета. Оно содержит описание общей цели отчета и целей исследования, актуальности его проведения.

В методологическом разделе с необходимой степенью детализации описываются: кто или что явилось объектом исследования, используемые методы. Дополнительная информация помещается в приложение. Приводятся ссылки на авторов и источники использованных методов. Читатель должен понять, как были собраны и обработаны данные, почему был использован выбранный метод, а не другие.

Главным разделом отчета является раздел, в котором излагаются полученные результаты. Рекомендуется строить его содержание, имея в виду цели исследования. Зачастую логика данного раздела определяется структурой вопросника, так как вопросы в нем приводятся в определенной логической последовательности.

Поскольку не следует маскировать проблемы, которые возникли при проведении исследований, то в заключительный отчет обычно включается раздел "Ограничения исследования". В нем описывается степень влияния ограничений (недостаток времени, денежных и технических средств, недостаточная квалификация персонала и т.д.) на полученные результаты. Например, эти ограничения могли оказать влияние на формирование выборки только для ограниченного числа регионов. Следовательно, относить полученные результаты ко всей стране в целом следует с большой осторожностью или вообще этого не делать.

Выводы и рекомендации могут быть изложены как в одном, так и в отдельных разделах.

Выводы основываются на результатах проведенного исследования. Рекомендации представляют собой предположения относительно того, какие следует предпринять действия исходя из изложенных выводов. Осуществление рекомендаций может предполагать использование знаний, выходящих за рамки полученных результатов.

В заключительной части приводятся приложения, содержащие дополнительную информацию, необходимую для более глубокого осмысления полученных результатов.

Помимо написания отчета исследователи часто также устраивают для клиентов устную презентацию о методах исследования и полученных результатах. В данном случае имеется возможность ответить на возникшие вопросы и обсудить полученные результаты.

Вопросы для повторения и обсуждения

1. Изложите главные преимущества и недостатки методов опроса по сравнению с качественными методами.

2. Какие особенности метода опроса, осуществляемого с помощью компьютера, являются наиболее привлекательными?

3. Что является общим и в чем заключается различие между интервьюированием, осуществленным на дому, в магазине и в офисе?

4. Почему так популярны опросы по телефону?

5. Какие три фактора ресурсного характера влияют на выбор метода опроса?

6. Фирма-производитель охранной сигнализации выбирает метод опроса владельцев квартир относительно предлагаемой системы сигнализации. В случае проникновения вора в квартиру включается звуковой сигнал и имитируется лай сторожевой собаки. Фирма хотела бы знать, какое число потенциальных клиентов знают о существовании данной системы, что они о ней думают и собираются ли они ее приобрести в следующем году. Какой из рассмотренных методов опроса наиболее пригоден в данном случае и почему?

7. Что понимается под итеративным характером процесса разработки вопросника?

8. В какой последовательности разрабатывается вопросник?

9. Какие типы вопросов используются при составлении анкет?

10. Каковы основные требования к формулированию вопросов?

11. Предположим, вам поручили провести опрос отдохнувших на Кавказе, которые ожидают своего вылета в аэропорту Адлера. Используя туннельный и секционный подходы, сформулируйте вопросы для поиска ответов в следующих направлениях:

· Определите, почему отдохнувшие выбрали именно этот регион для отдыха.

· В каком конкретно месте они отдыхали, как долго и почему выбрали именно его.

· Узнайте, какие сувениры они купили, где, когда и почему были сделаны эти покупки и по какой цене.

· Обрисуйте демографический профиль опрошенных.

12. Сформулируйте три главные проблемы формирования выборки.

13. Определите различия между вероятностным и невероятностным методами формирования выборки.

14. По каким аспектам систематическая выборка является более эффективной по сравнению со случайной выборкой?

15. Кратко опишите каждый из четырех невероятностных выборочных методов.

16. Ниже приводятся четыре генеральные совокупности и контуры выборки для них. Для каждой пары определите:

· членов генеральной совокупности, не вошедших в контур выборки;

· единицы контура выборки, которые не являются частью генеральной совокупности.

Можете ли вы определить для каждой генеральной совокупности, является ли ошибка контура выборки допустимой или недопустимой?

17. Какие существуют подходы к сбору данных?

18. Охарактеризуйте природу вневыборочных ошибок.

19. Какие виды статистического анализа используются в маркетинговых исследованиях?

20. Сформулируйте главные требования к написанию заключительного отчета по результатам маркетинговых исследований.

 

Литература

1. Burns Alvin C., Bush Ronald F. Marketing Research. - New Jersey: Prentice Hall, 1995.

2. Голубков Е.П. Маркетинговые исследования: теория, методология и практика. - Изд. 2-е. - М.: Финпресс, 2000.

3. Голубков Е.П. Маркетинг: Словарь-справочник. - М.: Дело, 2000.

4. Черчилль Г.А. Маркетинговые исследования. - СПб.: Питер, 2000.

 

 Приложение

1. Средние величины

Средняя величина (среднее, среднее значение) дает представление о наиболее "типичном" или "центральном" значении (центральной тенденции) в интервале изменения переменной (переменной величины). Например, средняя цена, средний объем продаж - подобные термины часто используются в практической работе маркетолога. В качестве средней величины чаще всего рассматриваются мода, медиана, средняя арифметическая и средняя геометрическая.

Мода - наиболее часто встречаемая величина в наборе данных. Это наиболее "типичное" значение среди данных. Оно может быть определено непосредственно из данных таблицы или графика. В графическом изображении данная величина соответствует величине на оси абсцисс, при которой соответствующая величина у является наибольшей. Недостаток наиболее часто встречаемой величины состоит в том, что она учитывает только соотношения величин, изменения же величин за пределами моды остаются неучтенными.

Пример расчета моды.

Упаковочная машина упаковывает по 100 канцелярских скрепок в маленькие пластмассовые футляры. Проверка 25 пластмассовых футляров дала следующий результат:

Наиболее часто встречаемой здесь величиной со значением признака 7 является количество в 100 штук.

Медиана (центральная величина) - это среднее, полученное путем выявления "центрального" значения в перечне данных, расположенных в ранжированном порядке. Медиана не учитывает экстремальных значений. Если налицо нечетное количество величин, например N = 9, то центральная величина рассчитывается следующим образом:

центральная величина

В предыдущем примере наиболее часто встречаемая величина определялась среди следующих величин: 92, 95, 97, 98, 99, 100, 101, 102, 107. Медианой является здесь 99 (5-я величина).

Средняя арифметическая учитывает каждое значение признака, в том числе экстремальные и случайные величины. Каждое изменение значений признака влияет на среднюю величину. Выделяют невзвешенную среднюю арифметическую и взвешенную среднюю арифметическую.

Невзвешенная средняя арифметическая получается путем деления суммы всех значений на их количество:

Невзвешенная средняя арифметическая

Средняя арифметическая чисел 2, 3, 5, 7 и 8 следующая:

Средняя арифметическая

Во взвешенной средней арифметической у отдельных значений учитывается определенный признак, например количество или вес:

взвешенной средней арифметической

Предположим, что отдельным значениям признака xi (х1, х2, х3 ... хn) соответствует разный вес или разная частотность fi:

Если сумму умноженных на соответствующий вес значений признака =36 разделить на сумму частотностей =12 , то в результате получится взвешенная средняя арифметическая, равная 3.

Пример расчета средних арифметических.

За 1 кг нескольких товаров были рассчитаны соответственно следующие цены: товар А - 12 руб., товар Б - 40 руб., товар В - 60 руб. и товар Г - 70 руб.

Проданное количество товаров составило:

товар А - 500 кг          товар В - 600 кг

товар Б - 2500 кг товар Г - 1400 кг

а) невзвешенная средняя арифметическая равна:

невзвешенная средняя арифметическая

б) расчет взвешенной средней арифметической

расчет взвешенной средней арифметической

Средняя геометрическая также учитывает все значения признака в наборе данных. Знак корня способствует, правда, тому, что в средней геометрической менее сильно, чем в средней арифметической, сказывается влияние экстремальных значений. Средняя геометрическая применяется в большинстве случаев для расчета средних темпов роста:

Средняя геометрическая

Например, объем продаж предприятия за последние четыре года изменялся следующим образом:

1-й год - увеличение 7%: 1 + 0,07 = 1,07;

2-й год - увеличение 9%: 1 + 0,09 = 1,09;

3-й год - уменьшение 3%: 1 - 0,03 = 0,97;

Средняя геометрическая

Mg = 1,0364

Средний темп роста составляет 0,0364 (если предварительно вычесть 1). Обороты предприятия за последние четыре года увеличились, таким образом, в среднем на 3,64%.

2. Показатели выриации

Совокупность изучаемых данных (статистической массы) может иметь разную структуру. Например, две совокупности могут иметь совпадающие средние значения, и, несмотря на это, у них может быть разная структура:

Средняя арифметическая и медиана составляют в обоих рядах соответственно 15, и, несмотря на это, у них разная структура. Значения признака ряда Б отчетливо больше рассеяны, чем ряда А.

Вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени. В маркетинге понятие вариации часто характеризует величину несхожести (схожести) ответов респондентов на определенный вопрос. Результаты ответов на вопросы опроса обычно представляются в форме кривой распределения. При высокой схожести ответов говорят о малой вариации (узкая кривая распределения), а при низкой схожести ответов - о высокой вариации (широкая кривая распределения).

Обычно используют следующие меры вариации (рассеивания): размах вариации, среднее отклонение, среднее квадратическое отклонение, дисперсию и коэффициент вариации.

Размахом вариации является разница между наибольшим и наименьшим значениями признака.

Размахом вариации

Размах вариации в ряду А: 20-10=10 и в ряду Б: 28-2=26.

Размах вариации легко рассчитывается. Однако он имеет недостаток, который состоит в том, что учитываются только оба экстремальных значения.

Среднее отклонение учитывает отдельное отклонение каждого значения признака статистической массы от среднего значения этой массы.

Простое среднее отклонение d статистической массы из n элементов со значениями признака от x1 до хn рассчитывается по следующей формуле:

Простое среднее отклонение

Разница | хi - М | представляет собой абсолютную разницу между значением признака хi и средним значением  М). Сумма отдельных отклонений всех значений признака от среднего арифметического делится на число значений признака.

Пример расчета простого среднего отклонения.

Среднее отклонение ряда Б от среднего значения = 15 может быть рассчитано следующим образом:

Среднее отклонение ряда

В среднем значения отклоняются от среднего арифметического или от центральной величины на 5,5.

Взвешенное среднее отклонение учитывает тот факт, что разные значения признака возникают с разными частотами:

Взвешенное среднее отклонени

Отдельное отклонение каждого значения признака от среднего значения умножается на соответствующую частоту. Сумма всех этих результатов делится на сумму частот.

Пример расчета взвешенного среднего отклонения ряда А от среднего значения = 15:

ример расчета взвешенного среднего отклонения

Среднее квадратическое отклонение (стандартное отклонение), обычно обозначаемое 23.jpg (806 bytes)или s, соотносит отклонения отдельных величин признака только со средним арифметическим. Расчет здесь похож на расчет среднего отклонения. Отдельные отклонения от среднего арифметического возводятся в квадрат, и затем извлекается квадратный корень:

Простое среднее квадратическое отклонение рассчитывается по формуле

Простое среднее квадратическое отклонение

Взвешенное среднее квадратическое отклонение рассчитывается по формуле

Взвешенное среднее квадратическое отклонение

Например, взвешенное среднее квадратическое отклонение s ряда А от среднего арифметического  19.jpg (854 bytes)=15 рассчитывается следующим образом:

Дисперсия s2 получается путем возведения в квадрат среднего квадратического отклонения. В предыдущем примере дисперсия

Среднее квадратическое отклонение имеет такую же размерность, как и признаки статистической массы, например рубли, килограммы, поэтому их нельзя объединять напрямую. Такое объединение можно делать в случае использования дисперсии. В то время как дисперсия используется преимущественно в теоретической статистике, стандартное отклонение s имеет большее значение для практических расчетов.

При нормальном распределении по Гауссу, на основе теории выборок, элементы ряда следующим образом располагаются вокруг среднего арифметического:

68,3% в границах от х ± 1;

95,5% в границах от х ± 2;

99,7% в границах от х ± 3.

Коэффициент вариации V является частным от среднего квадратического отклонения и средней арифметической:

Коэффициент вариации

В отличие от других мер вариации коэффициент вариации не является "овеществленной" мерой разброса. Размерность значений признака статистической массы теряется, но распределения с различными единицами сопоставимы.

Оглавление  

Погрешности, имеющие место в ходе проведения выборочных опросов, весьма разнообразны и могут быть сведены в целом к следующим основным типам:

1.     Неудачные формулировки вопросов в бланке интервью.

2.     Влияние личности интервьюера (как намеренное, так и не осознаваемое).

3.     Нарушение случайности выборки (смещения).

4.     Статистическая погрешность (собственно, ошибка выборки).

В этом списке источники ошибок перечислены в порядке убывания важности. Наибольшей проблемой, как правило, являются неудачные вопросы, подталкивающие респондентов "проявить фантазию" или просто различно понимаемые разными людьми. Общих правил тут не существует, есть только несколько простых принципов, которые на практике бывает достаточно трудно соблюсти: а) спрашивать надо о фактах, а не о мнениях, б) чтобы узнать, что будет завтра, надо выяснить - что было вчера, в) лучшие вопросы такие, на которые можно ответить "да" или "нет", г) предпочтение надо отдавать вопросам и методикам, проверенным временем в ходе прошлых опросов.

На втором месте по важности находятся ошибки, связанные с влиянием личности интервьюера. В опросах люди контактируют с людьми. Соответственно, в процессе передачи информация претерпевает трудно отслеживаемые изменения. Причем речь идет не только о сознательных нарушениях методики интервьюерами (прямая подделка интервью, переформулировка или сокращение вопросов по собственному разумению, незачитывание ответов или, наоборот, подсказки etc.), но и разного рода бессознательных эффектах (симпатия/антипатия между респондентом и интервьюером, интонационное подчеркивание интервьюером "правильных" на его взгляд ответов, избирательное восприятие интервьюером того, что ему говорят и т.п.).

Избавится от всего этого практически невозможно. Основные правила, благодаря которым можно до известной степени уменьшить влияние этих факторов: а) использовать много интервьюеров с малым числом интервью на каждого, б) лучший интервьюер - женщина 30-50 лет с сравнительно низким социальным статусом (образованная, но не более), в) жестко контролировать работу интервьюеров, причем интервьюеры должны лично видеть, что их проверяют и наказывают, г) детально инструктировать их, сводя самостоятельность интервьюера к минимуму, д) соблюдать приведенные выше требования в отношении вопросов (простые короткие вопросы о фактах меньше подвержены влиянию со стороны интервьюеров).

Далее свое влияние оказывают разного рода смещения выборки. Со статистической точки зрения, по выборке можно судить о целом только в том случае, если эта выборка случайна, - то есть все представители генеральной совокупности имеют равные шансы в нее попасть.

На практике, естественно, в ходе опросов добиться соблюдения этого требования невозможно. Не говоря уже о том, что участие в опросе - дело добровольное, обычно существует еще множество причин, приводящих к недостижимости той или иной категории респондентов: недостоверность баз, на основании которых делалась выборка, отсутствие лиц, подлежащих опросу, в месте проведения опроса, сезонные или суточные колебания и т.д. и т.п.

Таким образом, смещения есть всегда и зачастую довольно сильные. Но на самом деле, в ходе проведения опросов практическое значение имеют только смещения по характеристикам, тесно скоррелированным с изучаемыми вопросами. Например, телефонные опросы по определению сильно смещены относительно населения в целом (люди без домашнего телефона имеют нулевые шансы попасть в выборку). Но на практике для большинства рынков телефонные выборки в России вполне приемлемы, так как потребление большинства товаров в очень малой степени связано с наличием/отсутствием домашнего телефона.

По способу обеспечения случайности все выборки делятся на 1) базовые (истинно случайные или вероятностные) и 2) квотные. Базовые выборки делаются по той или иной базе данных (иначе называемой фреймом выборки), в которой, предположительно, перечислены все представители генеральной совокупности. Из базы случайным образом отбирается нужное число респондентов. Проблемы вероятностных выборок: а) нужные базы часто отсутствуют, б) базы всегда недостоверны, в) не всех отобранных респондентов удается застать и заставить участвовать в опросе (недостижимость респондентов).

При квотном способе формирования выборки конкретные лица, подлежащие опросу, не регламентируются. Вместо этого интервьюеру выдается квотная инструкция, в которой указано - каким именно критериям должны соответствовать опрошенные ими лица. Для расчета критериев используются либо чисто формальные ограничения ("не более 1 интервью в одном доме"), либо известные из других источников статистические распределения (наиболее частые, - пол, возраст). При этом предполагается, что если число таких ограничений будет достаточно велико, то на выбор конкретного респондента начнет влиять множество мелких, не связанных друг с другом факторов, в результате чего выборка окажется достаточно случайной (любой из подходящих под описание людей имеет примерно равные шансы быть выбранным).

Важно отметить, что точное соответствие выборки квотным критериям вовсе не гарантирует ее случайности (это обстоятельство даже во многих учебниках по социологии понимается неправильно). Если есть сильный фактор, влиявший на каждый выбор и связанный с изучаемыми вопросами, то результаты будут неверными, даже если пол и возраст (и другие аналогичные параметры) окажутся соблюдены точно.

В принципе, при правильной организации работы, квотные выборки аккуратнее вероятностных, т.к. в них менее актуальна проблема недостижимости респондентов. К сожалению, "правильная организация работы" обычно весьма затруднена. Главные проблемы: а) никогда не известно, сколько и каких именно критериев надо вставить в квоту, б) нет никакого способа проверить случайность выборки, в) увеличение сложности квоты стимулирует интервьюеров нарушать методику.

И наконец, четвертый источник погрешностей - собственно ошибка выборки, проистекающая из того факта, что мы опрашиваем не всех, но только часть интересующей нас группы лиц. Только эту ошибку и можно посчитать в процентах (когда пишут, что "ошибка составила 3.3%" - это именно о ней), если, конечно, нет внешнего критерия, по которому можно узнать - насколько мы ошиблись. На практике ошибка выборки оказывается совершенно неважна, так как описанные выше другие источники погрешностей ее намного перекрывают.

Если считать, что наша выборка была случайной, то согласно теории статистики ошибка выборки определяется по формуле:

где "мю" - ошибка выборки, k - коэффициент, зависящий от доверительного интервала, d2 - дисперсия целевой переменной, а n - объем выборки. Надо обратить внимание, что

1.     Ошибка не зависит от объема генеральной - и в городе с миллионом жителей и с 10 тысячами, для получения одинаковой ошибки надо опрашивать одинаковое число людей: чем больше опросим, тем меньше будет ошибка. Существует поправочный коэффициент, но он имеет значение только тогда, когда объемы выборки и генеральной практически равны (и когда число возможных выборок данного объема из данной генеральной сравнительно невелико).

2.     Ошибка выборки, вообще-то, считается для каждой переменной (вопроса) отдельно. Чем выше его дисперсия (чем более "раскиданы" возможные ответы, чем более они разнообразны), тем выше будет ошибка.

Эту формулу можно достаточно легко редуцировать. Во-первых, коэффициент k зависит от доверительного интервала. В социологии обычно берется величина 1.96 (или, примерно, 2), соответствующая 95% доверительному интервалу: иначе говоря, подставляя в формулу 1.96 вместо k, мы можем утверждать, что в 95% всех возможных выборок из 100% реальное отклонение не будет превышать "мю".

Далее, для качественных переменных (типа "да/нет" или "есть этот ответ/нет ответа") дисперсия обычно считается по формуле p * (1 - p), то есть доля сказавших "да" умножается на долю сказавших "нет". Легко видеть, что максимально возможное значение дисперсии (0.25) здесь будет, когда ответы распределяются 50/50.

Подставляя 2 вместо k, 0.25 вместо дисперсии, и игнорируя вычитаемую из n единицу, получаем, что максимально возможная для данного объема выборки ошибка будет равна примерно корню из единицы, деленной на объем этой выборки:

(При условии, что все наши вопросы удачны, интервьюеры не особенно напортачили, и у нас не возникло какого-нибудь непредвиденного смещения).

Уже при числе опрошенных порядка 400 человек максимальная ошибка выборки снижается до 5% и дальнейшее увеличение объема не приводит в этом отношении к увеличению достоверности исследования в целом, так как другие источники погрешностей гарантированно перекроют ошибку выборки. Провести опрос с реальной ошибкой ниже 5% можно только случайно.

Поэтому на практике объем выборки определяют исходя из других соображений, а именно исходя из того, насколько мелкие подгруппы в составе всей выборки нам предстоит анализировать (например, нам нужно проверить, отличаются ли чем-нибудь ответы "мужчин, проживающих в Кировском районе и имеющих автомобиль марки "Тойота"). Общего правила тут не существует, так как для точной оценки нам нужно было бы знать реальную долю этой подгруппы в составе генеральной, а также распределение ответов этой подгруппы на интересующий нас вопрос (для выяснения чего опрос, собственно, и проводится).

На практике объем подбирается "на глазок", в расчете на то, чтобы размер анализируемых подгрупп в выборке измерялся, по крайней мере, несколькими десятками записей (людей, организаций и т.п.). Только в этом случае общепринятые методики проверки достоверности отличий (типа "хи-квадрат") будут работать более-менее уверенно.

В заключение надо добавить еще одно соображение. Из сказанного становится ясно, что сами по себе опросы не очень достоверны (и это еще осторожно выражаясь). Но указанную неточность не следует распространять на маркетинговые исследования в целом. В конечном счете, как и в любой другой аналитической области (военная разведка, например) качество выводов в значительной мере зависит от профессионализма, таланта, опыта и интуиции аналитика, который и на неточных исходных данных может сделать точные выводы.  

Определение объема выборки

Определение объема выборки В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обсле­дования и возможностями их практической реализации, прежде всего имеются в виду затраты на проведение опроса. Следует отметить, что объем выборки никак не влияет на репре­зентативность полученных результатов. Предположим, например, что в целях изучения степени использования в России персональных компью­теров в научной работе проводился опрос на основе принципа удобства на одном из московских перекрестков. И хотя было опрошено 5000 рес­пондентов, полученные результаты не являются репрезентативными даже для Москвы. Это обусловлено тем, что был использован невероятност­ный метод формирования выборки, который в данном случае применять было нельзя. На практике используется несколько подходов к определению объ­ема выборки. Прежде всего опишем наиболее простые. Произвольный подход основан на применении «правила большого пальца». Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Данный подход является простым и легким в исполнении, однако не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весь­ма дорогим. Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно состав­ляет 1000—1200 человек, поэтому он рекомендует исследователю придер­живаться данной цифры. В случае, если на каком-то рынке проводятся ежегодные исследования, то в каждом году используется выборка одного и того же объема. В отличие от первого подхода здесь при определении объема выборки используется известная логика, которая, однако, являет­ся весьма уязвимой. Например, при проведении определенных исследо­ваний может потребоваться точность меньше, чем при изучении общест­венного мнения, да и объем совокупности может быть во много раз меньше, нежели при изучении общественного мнения. Таким образом, данный подход не принимает в расчет текущие обстоятельства и может быть достаточно дорогим. В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать. Очевидно, что ценность получаемой информации не принимается в рас­чет. Однако в ряде случаев и малая выборка может дать достаточно точ­ные результаты. Представляется разумным учитывать затраты не абсолютным обра­зом, а по отношению к полезности информации, полученной в результа­те проведенных обследований. Заказчик и исследователь должны рас­смотреть различные объемы выборки и методы сбора данных, затраты, учесть другие факторы. Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема вы­борки исходя из определенных требований к надежности и достоверно­сти получаемых результатов. Он также используется при анализе полу­ченных результатов для отдельных подгрупп, формируемых в составе вы­борки по полу, возрасту, уровню образования и т.п. Требования к надеж­ности и точности результатов для отдельных подгрупп диктуют опреде­ленные требования к объему выборки в целом. Наиболее теоретически обоснованный и корректный подход к оп­ределению объема выборки основан на расчете доверительных интерва­лов. Рассмотрение данного подхода начнем с краткой характеристики ряда базовых понятий математической статистики (см. подробнее, на­пример, в [10]). Понятие вариации характеризует величину несхожести (схожести) ответов респондентов на определенный вопрос. В более строгом плане вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени. Результаты ответов на вопросы оп­роса обычно представляются в форме кривой распределения. При высо­кой схожести ответов говорят о малой вариации (узкая кривая распределения) и при низкой схожести ответов — о высокой вариации (широкая кривая распределения). На рис. 4.5 приводятся кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш авто­мобиль?» для низкой и высокой вариации ответов. В качестве меры вариации обычно принимается среднее квадратическое отклонение, которое характеризует среднее расстояние от средней оценки ответов каждого респондента на определенный вопрос. Можно сравнить среднее квадратическое отклонения для двух выборок и опреде­лить, для какой из них вариация является меньшей. Поскольку все маркетинговые решения принимаются в условиях неопределенности, то это обстоятельство целесообразно учесть при опре­делении объема выборки. Так как определение исследуемых величин для совокупности в целом осуществляется на основе выборочной статистики, то следует установить диапазон (доверительный интервал), в который, как ожидается, попадут оценки для совокупности в целом, и ошибку их определения. Понятие «доверительный интервал» — это диапазон, крайним точ­кам которого соответствует определенный процент определенных ответов на какой-то вопрос. Данное понятие тесно связано с понятием «среднее квадратическое отклонение изучаемого признака в генеральной совокуп­ности»: чем оно больше, тем шире должен быть доверительный интервал, чтобы включить в свой состав, например, 95% ответов. Из свойств нормальной кривой распределения вытекает, что ко­нечные точки доверительного интервала, равного, скажем, 95%, опреде­ляются как произведение 1,96, называемого нормированным отклонени­ем, на среднее квадратическое отклонение. Числа 1,96 и 2,58 .(для 99%-ного доверительного интервала) обозначаются как Z. Имеются таблицы «Значение интеграла вероятностей», которые дают возможность опреде­лить величины Z для различных доверительных интервалов. Доверитель­ный интервал, равный или 95%, или 99%, является стандартным при проведении маркетинговых исследований. Например, проведено исследование числа визитов автовладельцев в сервисные мастерские за год. Доверительный интервал для среднего чис­ла визитов был рассчитан равным 5—7 визитам при 99%-ном уровне до­верительности. Это означает, что если появится возможность провести независимо 100 раз выборочные исследования, то для 99 средних значе­ний числа визитов попадут в диапазон от 5 до 7 визитов — другими сло­вами, 99% автовладельцев попадут в доверительный интервал. Предположим, было проведено исследование для пятидесяти неза­висимых выборок. Средние оценки для этих выборок образовали нор­мальную кривую распределения, которая в данном случае называется выборочным распределением. Средняя оценка для совокупности в целом равна средней оценке кривой распределения. Понятие «выборочное рас­пределение» также рассматривается в качестве одного из базовых поня­тий теоретической концепции, лежащей в основе определения объема выборки. Очевидно, что ни одна компания не проводит маркетинговых ис­следований, формируя 50 независимых выборок. Обычно используется только одна выборка. И математическая статистика дает возможность получить некую информацию о выборочном распределении, владея толь­ко данными о вариации единственной выборки. Индикатором степени отличия оценки, истинной для совокупности в целом, от оценки, которая ожидается для типичной выборки, является средняя квадратическая ошибка (см. ниже). Например, исследуется мне­ние потребителей о новом продукте и заказчик данного исследования указал, что его устроит точность полученных результатов, равная ±5%. Предположим, что 30% членов выборки высказалось за новый продукт. Это означает, что диапазон возможных оценок для всей совокупности составляет 25—35%. Причем чем больше объем выборки, тем меньше ошибка. Высокое значение вариации обусловливает высокое значение ошибки и наоборот. Теперь, после знакомства с базовыми понятиями, определим объем выборки на основе расчета доверительного интервала. Исходной инфор­мацией, необходимой для реализации данного подхода, является: 1. Ве­личина вариации, которой, как считается, обладает совокупность. 2. Же­лаемая точность. 3. Уровень доверительности, которому должны удовле­творять результаты проводимого обследования. Например, фирмой, выпускающей покрышки, проводится опрос автолюбителей. Целью обследования является определение процента ав­толюбителей, использующих радиальные покрышки, поэтому на вопрос: «Используете ли вы радиальные покрышки?» — возможно только два ответа: «Да» или «Нет» (шкала наименований). Если предположить, что совокупность автолюбителей обладает низким показателем вариации, то это означает, что почти каждый опрошенный использует радиальные покрышки. В этом случае может быть сформирована выборка достаточно малых размеров. В формуле (4.1) произведение pq выражает вариацию, свойственную совокупности. Предположим, что 90% единиц совокупности используют радиаль­ные покрышки. Это означает, что рq = 900. Если принять, что показатель вариации выше (р = 70%), то рq = 2100. Наибольшая вариация достигается в случае, когда половина сово­купности (50%) используют радиальные покрышки, а другая (50%) — не использует. В этом случае произведение рq достигает наибольшего значе­ния, равного 2500. При проведении обследования следует указать точность получен­ных оценок. Скажем, было установлено, что 44% респондентов исполь­зуют радиальные покрышки. В этом случае результаты измерения жела­тельно представить в виде: «Процент автолюбителей, использующих ра­диальные покрышки, составляет 44% плюс-минус ...%». Величину допус­тимой ошибки заранее совместно определяют заказчик исследования и исследователь. Что касается уровня доверительности, то при проведении марке­тинговых исследований, как отмечалось выше, обычно рассматриваются только два его значения: 95% или 99%. Первому значению соответствует значение z = 1,96, второму — z = 2,58. Если выбирается уровень довери­тельности, равный 99%, то это говорит о том, что мы уверены на 99% (другими словами, доверительная вероятность равна 0,99) в том, что про­цент членов совокупности, попавших в диапазон ± е%, равен проценту членов выборки, попавших в тот же диапазон ошибки. Принимая вариацию, равную 50%, точность, равную ± 10%, при 95%-ном уровне доверительности, рассчитаем размер выборки: При уровне доверительности, равном 99%, и е = ±3% n = 1067. При определении показателя вариации для определенной совокуп­ности прежде всего целесообразно провести предварительный качествен­ный анализ исследуемой совокупности, в первую очередь установить схожесть единиц совокупности в демографическом, социальном и других отношениях, представляющих интерес для исследователя. Возможно про­ведение пилотного исследования, использование результатов подобных исследований, проведенных в прошлом. При использовании процентной меры изменчивости принимается в расчет то обстоятельство, что макси­мальная изменчивость достигается для р = 50%, что является наихудшим случаем. К тому же этот показатель радикальным образом не влияет на объем выборки. Учитывается также мнение заказчика исследования об объеме выборки. Возможно определение объема выборки на основе использования средних значений, а не процентных величин, как это делалось выше. Предположим, что выбран уровень доверительности, равный 95% (z=1,96), среднее квадратическое отклонение (s) рассчитано равным 100 и желаемая точность (погрешность) составляет ±10. Определение объема выборки (n): На практике, если выборка формируется заново и схожие опросы не проводились, то s не известно. В этом случае целесообразно задавать погрешность е в долях от среднеквадратического отклонения. Расчетная формула преобразуется и приобретает следующий вид: Выше шел разговор о совокупностях очень больших размеров, ха­рактерных для рынков потребительских товаров. Однако в ряде случаев совокупности на являются столь большими — например, на рынках от­дельных видов продукции производственно-технического назначения. Обычно, если выборка составляет менее пяти процентов от сово­купности, то совокупность считается большой и расчеты проводятся по вышеприведенным правилам. Если же объем выборки превышает пять процентов от совокупно­сти, то последняя считается малой и в вышеприведенные формулы вво­дится поправочный коэффициент. Объем выборки в данном случае опре­деляется следующим образом: где n\' — объем выборки для малой совокупности; n — объем выборки (или для процентных мер, или для средних), рас­считанный по приведенным выше формулам; N — объем генеральной совокупности. Например, изучается мнение членов совокупности, состоящей из 1000 компаний, относительно изменения местной налоговой политики органами власти определенного региона. Вследствие отсутствия инфор­мации о вариации принимается наихудший случай 50:50. Решено исполь­зовать уровень доверительности, равный 95%. Заказчик исследования заявил, что его устроит точность результатов ±5%. Тогда, используя фор­мулу для процентной меры, получим Очевидно, что использование выборки меньших размеров приведет к экономии времени и средств. Данный подход к определению объема выборки с известными ого­ворками может быть использован и при определении численности панели и экспертной группы (см. соответствующие разделы данной книги). Приведенные формулы расчета объема выборки основаны на предположении, что все правила формирования выборки были соблюде­ны и единственной ошибкой выборки является ошибка, обусловленная ее объемом. Однако следует помнить, что объем выборки определяет точ­ность полученных результатов, но не их представительность. Последняя определяется методом формирования выборки. Все формулы для расчета объема выборки предполагают, что репрезентативность гарантируется использованием корректных вероятностных процедур формирования вы­борки. Помимо четкого планирования репрезентативности выборки, нель­зя распространять полученные результаты за ее границы. Так, результаты исследования мнения массового потребителя города Москвы о товарах определенной фирмы нельзя распространять на всю Россию. Далее, можно быть поставленным в тупик разными результатами обследования степени лояльности потенциальных покупателей к определенной марке пылесоса (в одном исследовании была названа цифра 10%, в другом слу­чае — 25%). Дело в том, что в первом случае цифра была получена от общего числа опрошенных, а во втором случае — только от числа тех покупателей, которые твердо решили приобрести пылесос. Поэтому для вдумчивого маркетолога очень важными являются те пояснения, которые сопровождают социологические данные (как минимум, формулировки вопросов и описание выборки).