<< Пред.           стр. 7 (из 18)           След. >>

Список литературы по разделу

 Марка Рейтинг (обведите одну из цифр) Очень низкое Очень высокое "Монблан" 1 2 3 4 5 6 7 8 9 10 "Паркер" 1 2 3 4 5 6 7 8 9 10 "Кросс" 1 2 3 4 5 6 7 8 9 10
  2. Укажите степень вашего согласия со следующими заявлениями, обведя одну из цифр:
 Заявление Сильно не согласен Сильно согласен а. Я всегда стремлюсь делать выгодные покупки 1 2 3 4 5 б. Я люблю проводить время вне дома 1 2 3 4 5 в. Я люблю готовить 1 2 3 4 5
  3. Пожалуйста, проранжируйте автомобиль "Понтиак Транс-Ам" по следующим характеристикам:
  Медленный разгон ______ _______ ______ ______
 
 
  _______ Быстрый разгон Хороший дизайн ______ _______ _______ ______ Плохой дизайн Низкая цена ______ _______ _______ ______ Высокая цена
  Г. Шкала отношений
  1. Пожалуйста, укажите ваш возраст____лет
  2. Приблизительно укажите, сколько раз за последний месяц вы делали покупки в дежурном магазине в интервале времени от 20 до 23 часов
 
 
 
  3. Какова вероятность того, что при составлении завещания вы прибегнете к помощи юриста _______ процентов
 
  Шкала порядка разрешает ранжировать респондентов или их ответы. Она имеет свойства номинальной шкалы в сочетании с отношением порядка. Иными словами, если каждую пару категорий шкалы наименований упорядочить относительно друг друга, то получится порядковая шкала. Для того чтобы шкальные оценки отличались от чисел в обыденном понимании, их на порядковом уровне называют рангами. Например, частоту покупки определенного товара (раз в неделю, раз в месяц или чаще). Однако такая шкала указывает только относительную разницу между измеряемыми объектами.
  (Зачастую предполагаемого четкого различения оценок не наблюдается и респонденты не могут однозначно выбрать тот или иной ответ, т.е. некоторые соседние градации ответов накладываются друг на друга. Такую шкалу называют полуупорядоченной; она находится между шкалами наименований и порядка.)
  Интервальная, шкала обладает также характеристикой расстояния между отдельными градациями шкалы, измеряемого с помощью определенной единицы измерений, т.е. используется количественная информация. На этой шкале уже не бессмысленны разности между отдельными градациями шкалы. В данном случае можно решить, равны они или нет, а если не равны, то какая из двух больше. Шкальные значения признаков можно складывать. Обычно предполагается, что шкала имеет равномерный характер (хотя это предположение требует обоснования). Например, если оцениваются продавцы магазина по шкале, имеющей градации: чрезвычайно дружественен, очень дружественен, в известной мере дружественен, в известной мере недружественен, очень недружественен, чрезвычайно недружественен, то обычно предполагается, что расстояния между отдельными градациями являются одинаковыми (каждое значение от другого отличается на единицу - см. табл. 4.7).
  Шкала отношений является единственной шкалой, имеющей нулевую точку, поэтому можно проводить количественное сравнение полученных результатов. Такое дополнение позволяет вести речь о соотношении (пропорции) а:b для шкальных значений а и b. Например, респондент может быть в 2,5 раза старше, тратить в три раза больше денег, летать самолетом в два раза чаще по сравнению с другим респондентом (табл. 4.7).
  Выбранная шкала измерений определяет характер информации, которой будет располагать исследователь при проведении изучения какого-то объекта. Кроме того, она предопределяет, какой вид статистического анализа можно или нельзя использовать.
  При использовании шкалы наименований возможно нахождение частот распределения, средней тенденции по модальной частоте, вычисление коэффициентов взаимозависимости между двумя или большим числом рядов свойств, применение непараметрических критериев проверки гипотез [10].
  Среди статистических показателей на порядковом уровне пользуются показателями центральной тенденции - медианой, квартилями и др. Для выявления взаимозависимости двух признаков используются коэффициенты ранговой корреляции Спирмена и Кендэла.
  Над числами, принадлежащими интервальной шкале, можно производить довольно разнообразные действия. Шкалу можно сжать или растянуть в любое число раз. Например, если шкала имеет деления от 0 до 100, то, разделив все числа на 100, получим шкалу со значениями из интервала от 0 до 1. Можно сдвинуть всю шкалу так, чтобы ее составляли числа от -50 до +50.
  Кроме рассмотренных выше алгебраических операций, интервальные шкалы допускают все статистические операции, присущие порядковому уровню; возможны также вычисления средней арифметической, дисперсии т.д. Вместо ранговых коэффициентов корреляции вычисляется коэффициент парной корреляции Пирсона. Может также быть рассчитан множественный коэффициент корреляции.
  Все перечисленные выше расчетные операции применимы также для шкалы отношений.
  Надо иметь в виду, что полученные результаты всегда можно перевести в более простую шкалу, но никогда наоборот. Например, градации "сильно не согласен" и "в какой-то мере не согласен" (интервальная шкала) легко перевести в категорию "не согласен" шкалы наименований.
 
 4.10.2. Построение шкал измерений
 
  В простейшем случае оценка измеряемого признака некоторым индивидом производится путем выбора, как правило, одного ответа из серии предложенных или путем выбора одного числового балла из некоторой совокупности чисел. Таким оценкам предшествует построение шкалы измерений.
  Для оценки измеряемого качества иногда пользуются графическими шкалами, разделенными на равные части и снабженными словесными или числовыми обозначениями. Респондента просят сделать отметку на шкале в соответствии с его оценкой данного качества.
  Ранжирование объектов является другим широко используемым приемом измерения. При ранжировании производится оценивание по измеряемому качеству совокупности объектов путем их упорядочивания по степени выраженности данного признака. Первое место, как правило, соответствует наиболее высокому уровню. Каждому объекту приписывается оценка, равная его месту в данном ранжированном ряду.
  Возможно попарное сравнение исследуемой совокупности по измеряемому качеству и дальнейшее упорядочивание их на основе результатов сравнения. Однако данный подход является более сложным и его, скорее, применяют при опросах экспертов, а не массовых респондентов.
  Так, при построении шкалы часто используются экспертные оценки, а в дальнейшем принятая шкала применяется при проведении полномасштабного исследования.
  Рассмотрим измерение, направленное на построение шкалы, т.е. построение шкальных весов оцениваемых признаков [19]. Для этого после определения числа и названий исследуемых признаков экспортно проводится назначение каждому признаку определенной количественной меры. Проще, но не лучше, осуществить построение шкалы с помощью простейших экспертных методов путем простого ранжирования или используя балльные шкалы. Полученные таким путем ранги (веса) оцениваемых признаков скорее всего будут носить ориентировочный характер. Причем многие эксперты, если не оговорить специальные правила определения шкальных весов, просто затруднятся провести такое измерение. Поэтому в данном случае целесообразно использовать более сложные методы.
  При решении подобных задач часто используется метод парных сравнений. Предположим, что строится шкала для выяснения отношения к таким ценностям продукта, как "польза", "дизайн", "качество", "срок гарантии", "послепродажный сервис", "цена" и т. п. Предполагаем, что простое ранжирование (определение весов признаков) затруднено или имеет большое значение достаточно точное определение шкальных весов исследуемых признаков, поэтому прямое их экспертное определение не может быть осуществлено. Обозначим для простоты эти ценности символами А1, А2, А3,..., А k.
  Сущность метода парных сравнений состоит в том, чтобы предложить экспертам произвести сравнение объектов попарно, с тем чтобы установить в каждой паре наиболее важный (значимый) из них.
  Из символов образуем всевозможные пары: (А1А2), (А1А3) и т. д. Всего таких парных комбинаций получится k • (k - 1)/2, где k - количество оцениваемых признаков.
  Выделенные пары признаков предъявляются экспертам на отдельных карточках так, чтобы одно и то же понятие не появлялось подряд в двух последовательно идущих карточках.
  Результаты опроса сводятся в таблицу по образцу табл. 4.8, в которой приведены гипотетические результаты опроса 30 экспертов по 5 признакам.
  Таблица 4.8
  Определение шкальных весов на основе парного сравнения
 Ценности А1 А2 А3 А4 А5 А1 - 061 0,82 0,89 0,95 А2 0,39 - 0,51 0,60 0,69 А3 0,18 0,49 - 0,68 0,73 А4 0,11 0,40 0,32 - 0,82 А5 0,05 0,31 0,27 0,08 -
  Число на пересечении, например, первой строки (А1) и второго столбца (А2 ) представляет собой долю случаев предпочтения признака А2 признаку А1 (общее число суждений равно n, где n - число экспертов). Очевидно, что на пересечении второй строки и первого столбца должно стоять число, дополняющее предыдущую долю до единицы. Если эксперт затрудняется выбрать предпочтительный признак, то в таблицу заносится число 0,5.
  В математической модели, лежащей в основе построения шкалы методом парных сравнений, предполагается, что доля случаев предпочтения признака i признаку j f (mij) подчиняется нормальному закону, т.е.
 
  Следующий шаг в построении шкальных оценок заключается в том, чтобы обратить наблюдаемые отношения mij в Zij по приведенному уравнению. По приложению для каждого значения mij (из табл. 4.8) находят Zij и заносят в табл. 4.9.
  В приложении приведены значения интеграла в пределах от 0 до Z, а не от- ? до Z, как требует того приведенная выше формула. Поэтому при использовании этой таблицы надо исходить из следующего: табл. 4.8 антисимметрична относительно диагонали (на диагонали стоят нули), т. е. Zij == Zij; причем значения Z положительны тогда, когда mij (табл. 4.8) больше 0,5. Поэтому берем из табл. 4.8 те mij, которые больше 0,5, вычисляем разности (mij - 0,5). По приложению для них находим Zij и записываем в табл. 4.9 со знаком "плюс". Симметричное к нему число Zij имеет знак "минус" и ту же абсолютную величину.
  Если Zij оказывается большим, чем 2,0, или меньшим 2,0, оно отвергается как нестабильное. Если ни одна из оценок не отвергается, то шкальная оценка признака i будет равна средней величине всех чисел в графе i табл. 4.9. Когда некоторые j отвергаются, то в табл. 4.9 ставится прочерк. Далее из данных столбца 2 вычитаются данные столбца 1, из 3 - 2 и т. д., а результат заносится в новую таблицу. При этом разность между двумя прочерками или между значением и прочерком считается незначимой и в матрице ставится прочерк. Для преобразованной таблицы вновь вычисляются средние по столбцам, которые и отождествляются с весом признака измеряемого явления.
 
 
  Нулевую точку устанавливают произвольным образом (см., например, последнюю строку в табл. 4.9).
  Метод парных сравнений может использоваться также при определении относительных весов целей, критериев, факторов и др., осуществляемом при проведении различных маркетинговых исследований.
  При большом числе признаков метод парных сравнений оказывается громоздким, поскольку эксперты должны -рассмотреть каждую возможную пару признаков, а число таких пар быстро растет с ростом числа признаков. Так, при k = 5 число пар равно 10, при k = 30 - 435.
  В таких случаях используются некоторые другие методы, из которых наибольшее применение получил метод равных интервалов [19].
  Лайкерт в 1932 г. предложил метод измерения без использования экспертной оценки, который получил название шкалы Лайкерта (метод суммарных оценок). Группе лиц даются вопросы, которые должны оцениваться по пятибалльной системе в отношении согласия с этими вопросами (суждениями);
  5 - "полностью согласен"
  4 - "согласен"
  3 - "нейтрален"
  2 - "не согласен"
  1 - "полностью не согласен".
  Баллы одного лица относительно всех вопросов суммируются. Полученная сумма - балл этого лица. Затем лица ранжируются по баллам.
  Для построения шкалы отбирается большое число вопросов, относящихся к исследуемой проблеме.
  Данный метод можно использовать для отбора наиболее значимых вопросов для их включения в анкету, особенно в случае, когда имеется большое количество вопросов и реально существует проблема их отбора для включения в анкету.
  Например, ограниченной группе потребителей или экспертов в 10 человек (А, Б, В и т.д.) дается 10 вопросов, из которых производится отбор. Вопросы оцениваются по пятибалльной шкале Лайкерта. Каждому лицу дается бланк (табл. 4.10).
  Таблица 4.10
  Иллюстрация метода суммарных оценок
 Номер вопроса Ответ полностью согласен согласен нейтрален не согласен полностью не согласен 1-й +
 
 
 
  2-й +
 
 
 
  3-й
 
  +
 
  4-й
  +
 
 
  5-й
  +
 
  Продолжение табл. 4.10
 Номер вопроса Ответ полностью согласен согласен нейтрален не согласен полностью не согласен 6-й
 
 
  +
  7-й
 
 
  +
  8-й
 
 
 
  + 9-й
 
  +
 
  10-й
  +
 
 
 
  Индивид делает отметку по каждому вопросу в соответствии со своим отношением к нему. Далее подсчитывается общий балл лица относительно всех вопросов. Полученные данные сводятся в следующую таблицу (здесь даны вычисления для пятого вопроса).
 
 
 Лицо Общий балл Балл пятого вопроса Разность Лицо Общий балл Балл пятого вопроса Разность А 45 5 40 Е 39 4 35 Б 42 5 37 И 33 3 30 В 35 4 31 К 40 4 36 Г 35 4 31 Л 22 1 21 Д 20 1 19 М 27 2 25
 
  Затем строится таблица сопряженности между баллами вопроса и величинами в графе "разность", причем разности сгруппированы по интервалам (табл. 4.11).
 
  Таблица 4.11
  Таблица сопряженности
 
 Балл Интервал разностей Балл Интервал разностей 10-19 20-29 30-39 40-50
  10-19 10-29 30-39 40-50 1 1 1 - - 4 - - 4 - 2 - 1 - - 5 . - - 1 1 3 - - 1 -
 
 
 
 
 
  Вычисляется коэффициент корреляции между баллом и разностью. И так для каждого вопроса. Вопросы с малыми корреляциями выбрасываются.
  Техника построения шкал методом суммарных оценок обеспечивает порядковый уровень измерения.
  Проблема сопоставимости признаков, измеренных по разным шкалам, с одной стороны, и желание иметь некий интегральный показатель для характеристики совокупности свойств измеренного объекта - с другой, приводят к задаче объединения нескольких признаков, измеренных по разным шкалам, в один общий, итоговый показатель - индекс.
  Следует помнить, что было бы большим заблуждением требовать от индекса того, чего он не может дать, - полной качественной характеристики объекта наблюдения, так как задача шкалирования предполагает .всего лишь разработку механизма сведения качественных признаков к количественным.
  При построении индекса измеряемое качество следует искать в сочетании оценок по совокупности исходных признаков.
  В общем виде измеряемое качество у можно представить некоторой функцией исходных признаков (х), т. е.
  Y=f(Х1, Х2,..., Хk).
  Возможны различные представления функции f и, с другой стороны, различные способы приписывания оценок исходным признакам {х}. В зависимости от этого можно выделить три существенно различных типа методов:
  1. Конструкция индекса задана на основе предваряющих исследование логических операций. Так, приписывание респонденту значения по основному показателю может определяться некоторой логической схемой, например схемой логического квадрата.
  Разберем этот случай на примере построения итогового индекса уровня индивидуальной свободы одеваться для подростка. Этот индекс может быть построен на базе двух исходных: в вопросе А подросток дает свою оценку предоставляемой ему родителями свободы выбора (оценки 1,2,3,4); вопрос Б содержит информацию о том, как родители, по мнению респондента, учитывают его индивидуальные склонности (оценки 1,2,3). Схема объединения вопросов А и Б в итоговом показателе дана на рис. 4.3. Итоговый индекс имеет три градации, различающиеся по уровню индивидуальной свободы, - 111,11,1.
 
  2. Итоговый индекс может представлять собой аналитическую функцию от исходных признаков. Форма математической зависимости между исходными признаками обосновывается исходя из теоретических соображений.
  Примером подобного рода косвенного измерения является шкала Лайкерта. Респонденту предъявляется серия из вопросов, связанных с исследуемым объектом либо непосредственно, либо только весьма косвенно. Общий балл респондента по всему вопроснику определяется как сумма его баллов x1 по всем признакам, т. е. суммарный балл равен x1 + x2 + x3 +,..., + xk.
  Другой пример касается определения устойчивости интересов респондента в проведении досуга с помощью индекса "стабильных занятий на досуге". Он представляет собой отношение количества "стабильных" занятий (z) к числу всех занятий (t), присутствующих в досуге респондента, т. е. индекс стабильности занятий имеет вид у == z/t.
  3. Конструкция индекса может определяться путем применения некоторых формальных методов преобразования исходных признаков изучаемой совокупности. Обоснованность конструкции индекса и его формирование определяются непосредственно самим методом.
  Наибольшую известность получили методы факторного анализа, распознавание образов, некоторые процедуры анализа причинных структур.
  Во многих случаях при составлении вопросников нецелесообразно с "нуля" разрабатывать шкалы измерений. Лучше воспользоваться стандартными типами шкал, используемыми в области маркетинговых исследований. К числу таких шкал относятся: модифицированная шкала Лайкерта, шкала для изучения жизненного стиля и семантическая дифференциальная шкала.
  На основе модифицированной шкалы Лайкерта (интервальная шкала), адаптированной под цели проводимого маркетингового исследования, изучается степень согласия или несогласия респондентов с определенными высказываниями. Данная шкала носит симметричный характер (табл. 4.12) и измеряет интенсивность чувств респондентов.
  Таблица 4.12
  Вопросник для выявления мнения потребителя относительно товара определенной марки
 Заявление Сильно согласен В какой-то мере согласен Отношусь нейтрально В какой-то мере не согласен Сильно не согласен 1. Джинсы (указывается конкретная марка) хорошо выглядят 1 2 3 4 5 2. Данные джинсы имеют разумную цену 1 2 3 4 5 3. Следующая пара ваших джинсов будет данной марки 1 2 3 4 5 4. Данные джинсы легкоузнаваемые 1 2 3 4 5 5. В данных джинсах вы чувствуете себя хорошо 1 2 3 4 5
  Существуют различные варианты модификации шкалы Лайкерта, например, вводится различное число градаций (7-9).
  Школа для изучения жизненного стиля является специальным направлением применения модифицированной шкалы Лайкерта и предназначена для изучения системы ценностей, личностных качеств, интересов, мнений относительно работы, отдыха, покупок различных людей. Такая информация дозволяет принимать эффективные маркетинговые решения. Пример анкеты для изучения жизненного стиля приводится в табл. 4.13.
 
  Таблица 4.13
  Анкета для изучения жизненного стиля
  Пожалуйста, обведите цифру, в наибольшей мере соответствующую степени Вашего согласия или несогласия с каждым утверждением.
 
 Утверждение Сильно согласен Согласен И согласен и не согласен Не согласен Сильно не согласен 1. Я покупаю много 1 2 3 4 5 специальных товаров
 
 
 
 
  2. Я обычно имею один и более видов одежды самой
 последней моды
 
 
 
 
  1 2 3 4 5
 
 
 
 
 
 
 
 
 
  3. Самое главное для
 меня - это мои дети 1
 
  2
 
  3
 
  4
 
  5
 
  4. Я обычно содержу мой дом в большом порядке 1 2 3 4 5
 
 
 
 
 
 
 
  Продолжение табл. 4.13
 Угверждение Сильно согласен Согласен И согласен и не согласен Не согласен Сильно не согласен 5. Я предпочитаю провести вечер дома,чем пойти на
 вечеринку 1
 
  2
 
  3
 
  4
 
  5
 
 
 
 
 
 
  6. Я люблю наблюдать или слушать трансляции футбольных матчей
 1
 
 
 2
 
 
 3
 
 
 4
 
 
 5
 
  7. Я зачастую оказываю влияние на покупки друзей 1 2 3 4 5
 
 
 
 
  8. В следующем году я буду иметь больше денег на покупки 1 2 3 4 5
 
 
 
 
 
  Семантическая дифференциальная шкала содержит серию двухполярных определений, характеризующих различные свойства изучаемого объекта. Так как многие маркетинговые стимулы основаны на мыслительных ассоциациях и отношениях, не выраженных явно, то данный тип шкалы часто используется при определении имиджа товарной марки, магазина и т.п. Результаты изучения мнений потребителей относительно двух ресторанов (№1 и №2) на основе семантической дифференциальной шкалы приводятся в табл. 4.14.
 
  Таблица 4.14
  Сравнительная оценка двух ресторанов
 
 
 
  Обозначения: - оценки ресторана №1,
  - оценки ресторана №2.
  В табл. 4.14 специально положительные или отрицательные оценки не расположены только с одной стороны, а случайным образом перемешаны. Это сделано для того, чтобы избежать "гало эффекта". Он заключается в том, что если первый оцениваемый объект обладает более высокими оценками (которые расположены только с левой стороны анкеты) по сравнению со вторым объектом, то респондент будет иметь тенденцию и дальше ставить оценки слева.
  'Одним из достоинств данного метода является то, что если отдельным градациям в шкале присвоить номера: 1, 2, 3, и т.д. и ввести в компьютер данные разных респондентов, то конечные результаты могут быть получены в графическом виде (табл. 4.14).
  При применении вышеназванных шкал возникает вопрос о целесообразности использования нейтральной точки. Все зависит от того, имеют или нет респонденты нейтральное мнение. Однозначной рекомендации по этому вопросу дать не представляется возможным.
  То же самое можно сказать и относительно того, строить шкалу симметричной или несимметричной.
  Существует великое множество вариантов шкал, построенных на основе изложенных принципов. Окончательный выбор обычно делается на основе испытания уровня надежности и точности измерений, проведенных с помощью различных вариантов шкал.
 
 4.10.3. Надежность и достоверность измерения маркетинговой информации
 
  Описанные выше способы построения шкал не дают полного представления о свойствах полученных оценок. Необходимы дополнительные процедуры для выявления присущих этим оценкам ошибок. Назовем это проблемой надежности измерения. Данная проблема решается путем выявления правильности измерения, устойчивости и обоснованности.
  При изучении правильности устанавливается общая приемлемость данного способа измерения (шкалы или системы шкал). Непосредственно понятие правильности связано с возможностью учета в результате измерения различного рода систематических ошибок. Систематические ошибки имеют некоторую стабильную природу возникновения: либо они являются постоянными, либо меняются по определенному закону.
  Устойчивость характеризует степень совпадения результатов измерения при повторных применениях измерительной процедуры и описывается величиной случайной ошибки. Она определяется постоянством подхода респондента к ответам на одинаковые или подобные вопросы.
  Например, вы являетесь одним из опрашиваемых, отвечающих на вопросы анкеты табл. 4.14 относительно деятельности какого-то ресторана. Из-за медленного обслуживания в данном ресторане вы опоздали на деловую встречу, поэтому вы дали самую низкую оценку по данному показателю. Спустя неделю вам позвонили и просили подтвердить, что вы действительно приняли участие в проведенном обследовании. Затем вас попросили по телефону ответить на ряд дополнительных вопросов, среди которых был вопрос о быстроте обслуживания по шкале от 1 до 7, где 7 означало самое быстрое обслуживание. Вы поставили 2, продемонстрировав высокий уровень идентичности оценок и, следовательно, - устойчивость ваших оценок.
  Наиболее сложный вопрос надежности измерения - его обоснованность. Обоснованность связана с доказательством того, что измерено вполне определенное заданное свойство объекта, а не некоторое другое, более или менее на него похожее.
  При установлении надежности следует иметь в виду, что в процессе измерения участвуют три составляющие: объект измерения (респондент), измеряющие средства, с помощью которых производится отображение свойств объекта на числовую систему, и субъект (интервьюер), производящий измерение. Предпосылки надежного измерения кроются в каждой отдельной составляющей.
  Прежде всего сам объект в отношении измеряемого свойства может обладать значительной степенью неопределенности. Так, зачастую у респондента нет четкой иерархии жизненных ценностей, а следовательно, нельзя получить и абсолютно точные данные, характеризующие важность для него тех или иных явлений. Он может быть плохо мотивирован, вследствие чего невнимательно отвечает на вопросы. Однако только в последнюю очередь следует искать причину ненадежности оценок в самом респонденте.
  С другой стороны, может быть, что способ получения оценки не в состоянии дать максимально точных значений измеряемого свойства. Например, у респондента существует определенная иерархия ценностей, а для получения информации используется номинальная оценка с вариациями ответов от "очень важно" до "совсем неважно". Как правило, из приведенного набора все ценности помечаются ответами "очень важно", "важно", хотя реально у респондента имеется большее число уровней значимости.
  Наконец, при наличии высокой точности первых двух составляющих измерения субъект, производящий измерение, допускает грубые ошибки; нечетко составлены инструкции к анкете; интервьюер каждый раз по-разному формулирует один и тот же вопрос, используя различную терминологию. Например, в процессе интервью, в ходе которого должна быть выявлена система ценностей опрашиваемого, интервьюер не смог довести до респондента суть опроса, не смог добиться доброжелательного отношения к исследованию и пр.
  Каждая составляющая процесса измерения может быть источником ошибки, связанной либо с устойчивостью, либо с правильностью, либо с обоснованностью. Однако, как правило, исследователь не в состоянии разделить эти ошибки по источникам их происхождения и поэтому изучает ошибки устойчивости, правильности и обоснованности всего измерительного комплекса в совокупности. При этом правильность (как отсутствие систематических ошибок) и устойчивость информации - элементарные предпосылки надежности. Наличие существенной ошибки в этом отношении уже сводит на нет проверку данных измерения на обоснованность.
  В отличие от правильности и устойчивости, которые могут быть измерены достаточно строго и выражены в форме числового показателя, критерии обоснованности определяются либо на основе логических рассуждений, либо на основе косвенных показателей. Обычно применяется сравнение данных одной методики с данными других методик или исследований.
  Прежде чем приступать к изучению таких компонентов надежности, как устойчивость и обоснованность, необходимо убедиться в правильности выбранного инструмента измерения.
  Возможно, что последующие этапы окажутся излишними, если в самом начале выяснится полная неспособность данного инструмента на требуемом уровне дифференцировать изучаемую совокупность, иначе говоря, если окажется, что систематически не используется какая-то часть шкалы либо та или иная градация шкалы или вопроса. И наконец, возможно, что исходный признак не обладает дифференцирующей способностью в отношении результирующего показателя - индекса. В первую очередь нужно ликвидировать или уменьшить такого рода недостатки шкалы и только затем использовать ее в исследовании.
  К числу недостатков используемой шкалы прежде всего следует отнести отсутствие разброса ответов по значениям шкалы. Попадание ответов в один пункт свидетельствует о полной непригодности измерительного инструмента - шкалы. Такая ситуация может возникнуть или из-за "нормативного" давления в сторону общепринятого мнения, или из-за того, что градации (значения) шкалы не имеют отношения к распределению данного свойства у рассматриваемых объектов (нерелевантны).
  Например, если все опрашиваемые респонденты согласны с утверждением "хорошо, когда строительный инструмент является универсальным" и нет ни одного ответа "не согласен", то подобная шкала не поможет дифференцировать отношение респондентов к разным типам строительных инструментов.
  Использование части шкалы. Довольно часто обнаруживается, что практически работает лишь какая-то часть шкалы, какой-то один из ее полюсов с прилегающей более или менее обширной зоной.
  Так, если респондентам для оценки предлагается шкала, имеющая положительный и отрицательный полюса, в частности от +3 до -3, то при оценивании какой-то заведомо положительной ситуации респонденты не используют отрицательные оценки, а дифференцируют свое мнение лишь с помощью положительных. Для того чтобы вычислить значение относительной ошибки измерения, исследователь должен знать определенно, какой же метрикой пользуется респондент - всеми семью градациями шкалы или только четырьмя положительными. Так, ошибка измерения в 1 балл мало о чем говорит, если мы не знаем, какова действительная вариация мнений.
  Для вопросов, имеющих качественные градации ответов, можно применять подобное требование в отношении каждого пункта шкалы: каждый из них должен набирать не менее 5% ответов, в противном случае считаем этот пункт шкалы неработающим. Требование 5%-ного уровня наполнения каждой градации шкалы не следует рассматривать как строго обязательное; в зависимости от задач исследования могут быть выдвинуты большие или меньшие значения этих уровней.
  Неравномерное использование отдельных пунктов шкалы. Случается, особенно при использовании упорядоченных шкал, что некоторое значение переменной (признака) систематически выпадает из поля зрения респондентов, хотя соседние градации, характеризующие более низкую и более высокую степень выраженности признака, имеют существенное наполнение.
  Так, если конфигурация распределения ответов на вопрос с четырьмя упорядоченными градациями такова, как на рис. 4.4, градации данной шкалы, видимо, неудачно сформулированы. Значительное наполнение двух соседних по отношению к пункту 2 пунктов (1 и 3) свидетельствует о "захвате" части голосов из плохо сформулированного пункта 2.
 
 
  Ранг градации
  Рис. 4.4. Пример неравномерного распределения ответов по шкале
 
  Аналогичная картина наблюдается и в том случае, когда респонденту предлагают шкалу, имеющую слишком большую дробность: будучи не в состоянии оперировать всеми градациями шкалы, респондент выбирает лишь несколько базовых. Например, зачастую десятибалльную шкалу респонденты расценивают как некоторую модификацию пятибалльной, предполагая, что "десять" соответствует "пяти", "восемь" - "четырем", "пять" - "трем" и т.д. При этом базовые оценки используются значительно чаще, чем другие.
  Для выявления указанных аномалий равномерного распределения по шкале можно предложить следующее правило: для достаточно большой доверительной вероятности (1-? ? 0,99) и, следовательно, в достаточно широких границах наполнение каждого значения не должно существенно отличаться от среднего из соседних наполнений. Для чего используется критерий хи-квадрат [19].
  Определение грубых ошибок. В процессе измерения иногда возникают грубые ошибки, причиной которых могут быть неправильные записи исходных данных, плохие расчеты, неквалифицированное использование измерительных средств и т. п. Это обнаруживается в том, что в рядах измерений попадаются данные, резко отличающиеся от совокупности всех остальных значений. Чтобы выяснить, нужно ли эти значения признать грубыми ошибками, устанавливают критическую границу, так чтобы вероятность того, что крайние значения превысят ее, была бы достаточно малой и соответствовала бы некоторому уровню значимости а. Это правило основано на том, что появление в выборке чрезмерно больших значений хотя и возможно как следствие естественной вариабельности значений, но маловероятно.
  Если окажется, что какие-то крайние значения совокупности принадлежат ей с очень малой вероятностью, то такие значения признаются грубыми ошибками и исключаются из дальнейшего рассмотрения, Выявление грубых ошибок особенно важно проводить для выборок малых объемов: не будучи исключенными из анализа, они существенно искажают параметры выборки. Для этого используются специальные статистические критерии определения грубых ошибок [19].
  Итак, дифференцирующая способность шкалы как первая существенная характеристика ее надежности предполагает: обеспечение достаточного разброса данных; выявление фактического использования респондентом предложенной протяженности шкалы; анализ отдельных "выпадающих" значений; исключение грубых ошибок. После того как установлена относительная приемлемость используемых шкал в указанных аспектах, следует переходить к выявлению устойчивости измерения по этой шкале.
  Существует несколько методов оценки устойчивости измерений: повторное тестирование; включение в анкету эквивалентных вопросов и разделение выборки на две части.
  Метод повторного тестирования был охарактеризован выше.
  Часто интервьюеры в конце опроса частично его повторяют, говоря при этом: "Заканчивая нашу работу, вновь коротко пройдемся по вопросам анкеты, чтобы я мог проверить, все ли я правильно записал из ваших ответов". Конечно, речь идет не о повторении всех вопросов, а только критических из их числа. При этом надо помнить, что если интервал времени между тестированием и повторным тестированием слишком короткий, то респондент просто может помнить первоначальные ответы. Если интервал слишком велик, то могут иметь место некоторые реальные изменения.
  Включение в анкету эквивалентных вопросов предполагает использование в одной анкете вопросов по той же проблеме, но сформулированных по-другому. Их респондент должен воспринимать как разные вопросы. Главная опасность данного метода заключается в степени эквивалентности вопросов; если это не достигается, то респондент отвечает на разные вопросы.
  Разделение выборки на две части основано на сравнении ответов на вопросы двух групп респондентов. Предполагается, что эти две группы являются идентичными по своей композиции и что средние оценки ответов для этих двух групп являются очень близкими. Все сравнения делаются только на групповой основе, поэтому сравнение внутри группы проводить невозможно. Например, среди студентов колледжа с помощью модифицированной шкалы Лайкерта с пятью градациями был проведен опрос относительно их будущей карьеры. В анкете приводилось утверждение: "Я считаю, что меня ожидает блестящая карьера". Ответы были обобщены, начиная с "сильно не согласен" (1 балл) и кончая "сильно согласен" (5 баллов). Затем общая выборка опрошенных была разделена на две группы и были вычислены средние оценки для этих групп. Средняя оценка была одинаковой для каждой группы и равнялась 3-м баллам. Данные результаты дали основание считать измерение надежным. Когда же групповые ответы были проанализированы более внимательно, то оказалось, что в одной группе все студенты ответили "и согласен и не согласен", а в другой - 50% ответили "сильно не согласен", а другие 50% - "сильно согласен". Как видно, более глубокий анализ показал, что ответы не являются идентичными.
  Вследствие данного недостатка этот метод оценки устойчивости измерений является наименее популярным.
  О высокой надежности шкалы можно говорить лишь в том случае, если повторные измерения при ее помощи одних и тех же объектов дают сходные результаты. Если устойчивость проверяют на одной и той же выборке, то часто оказывается достаточным сделать два последовательных замера с определенным временным интервалом - таким, чтобы этот промежуток не был слишком велик, чтобы сказалось изменение самого объекта, но и не слишком мал, чтобы респондент мог по памяти "подтягивать" данные второго замера к предыдущему (т. е. его протяженность зависит от объекта изучения и колеблется от двух до трех недель).
  Существуют различные показатели оценки устойчивости измерений. Среди них чаще всего используется средняя квадратическая ошибка (см. ниже).
  До сих пор речь шла об абсолютных ошибках, размер которых выражался в тех же единицах, что и сама измеряемая величина. Это не позволяет сравнивать ошибки измерения разных признаков по разным шкалам. Следовательно, помимо абсолютных, нужны относительные показатели ошибок измерения.
  В качестве показателя для нормирования абсолютной ошибки можно использовать максимально возможную ошибку в рассматриваемой шкале (xmax).
  Если число делений шкалы k, тогда xmax, равное разнице между крайними значениями шкалы (xmax - xmin), будет k - 1 и относительная ошибка окажется такой:
 
  (здесь х - средняя арифметическая ошибка измерения).
  Однако зачастую этот показатель "плохо работает" из-за того, что шкала не используется на всей ее протяженности. Поэтому более показательными являются относительные ошибки, рассчитанные по фактически используемой части шкалы.
  Если число градаций в "работающей" части шкалы обозначить k1, то тогда
 

<< Пред.           стр. 7 (из 18)           След. >>

Список литературы по разделу