<< Пред. стр. 2 (из 3) След. >>
2. Условия проведения исследования. Они вызывают реакцию испытуемого на эксперимент. Следовательно, его данные нельзя переносить на лиц, не принимавших участие в эксперименте; этими лицами является вся генеральная совокупность, кроме экспериментальной выборки.3. Взаимодействие факторов отбора и содержания экспериментального воздействия. Их следствия - артефакты (в экспериментах с добровольцами или испытуемыми, участвующими по принуждению).
4. Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. Если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.
Большинство причин нарушения внешней валидности связано с особенностями психологического эксперимента, проводимого с участием человека, которые отличают психологическое исследование от эксперимента, осуществляемого специалистами других наук.
На взаимодействие процедуры тестирования и содержания экспериментального воздействия первым обратил внимание в 1949 году Р.Л. Соломон при проведения исследования школьников: предварительное тестирование снижало эффективность обучения. Исследование социальных установок показало, что предварительное тестирование оказывало влияние на установки личности и ее подверженность убеждению, а в экспериментах Ховленда, наоборот, оно ослабляло убеждающее воздействие фильмов.
Эффект тем больше, чем необычайнее процедура тестирования и чем более сходно по содержанию экспериментальное воздействие с тестом. Для того, чтобы избежать эффекта предварительного тестирования, Кемпбелл рекомендует применять экспериментальные планы с предварительно не тестируемыми группами.
Как уже отмечалось, "взаимодействие состава группы и воздействия" связано с неслучайным участием испытуемых в эксперименте. Реакция может быть двух типов: готовность добровольцев "подвергнуться воздействию" и отказ, негативная реакция тех, кто принудительно привлечен к участию в эксперименте. В исследованиях по научению могут согласится участвовать только интеллектуально одаренные. Выбывание испытуемых в ходе эксперимента может вызываться экспериментальным воздействием. К примеру, лица, потерпевшие неудачу при выполнении заданий на мотивацию достижения, могут отказаться от участия в последующих сериях.
Естественно, практически невозможно элиминировать лишь фактор "реакции на эксперимент". Еще раз отметим, что проблема внутренней валидности разрешима в принципе, так как можно подобрать соответствующие процедуры планирования эксперимента и математической обработки результатов, чтобы обеспечить заданный уровень их достоверности.
Согласно Кэмпбеллу, проблема внешней валидности как репрезентативности эксперимента по отношению к реальности неразрешима, так как индукция, т.е. обобщение, никогда не может быть полностью объективна.
Проблема внешней валидности как адекватности ситуации эксперимента его "первообразной" жизненной ситуации также неразрешима логическими и математическими средствами: она требует привлечения всей совокупности научных психологических знаний для описания ситуации в целом.
2.4. Экспериментальная выборка.
Выбор объекта исследования - следующая задача, которую предстоит решать психологу после определения зависимой и независимой переменных. В прикладных исследованиях свобода психолога ограничена уже тем, что объект известен с самого начала. Психолог волен выбирать тот объект, который больше соответствует задачам исследования.
Идеальным объектом психологического исследования может выступать либо отдельный индивид, либо группа. В первом случае мы говорим об общепсихологическом эксперименте, во втором - о социально-психологическом. Но в конкретном эксперименте не только реальный объект должен соответствовать по своим характеристикам идеальному объекту, но и результаты, полученные при его участии, должны применяться к другим объектам. Если бы все люди (или животные) были похожи друг на друга, а еще лучше - оказались совершенно одинаковыми, то не возникло бы никаких проблем. Эксперимент можно провести с участием одного испытуемого, а полученные результаты применить для объяснения поведения всех других людей. Но люди различны по возрасту, полу, расе, национальности, принадлежности к той или иной культуре или религии, социальному или экономическому положению и т.д. Следовательно, простая генерализация (обобщение) данных, полученных при исследовании одного испытуемого, невозможна. Однако на практике, например в лабораторных экспериментах по исследованию сенсорных процессов, памяти, внимания и т.д., этими различиями пренебрегают, считая, что наш испытуемый может представлять любого индивида из Homo sapiens. В более занятных случаях голубь или крыса может выступать в качестве модели любого человека, например, в экспериментах по оперантному научению. Но это иная проблема. Здесь же заметим, что эксперимент может быть проведен с одним испытуемым (singl-experiment) или группой. В социальной психологии это будет одна группа и множество групп - "группа групп".
Эксперимент с одним испытуемым проводится тогда, когда: 1) индивидуальными различиями можно пренебречь, исследование чрезвычайно велико по объему и включает множество экспериментальных проб; 2) испытуемый - уникальный объект, например, гениальный музыкант или творчески одаренный шахматист; 3) от испытуемого требуется особая компетентность при проведении исследования (эксперимент с обученными испытуемыми); 4) повторение данного эксперимента с участием других испытуемых невозможно.
Для экспериментов с одним испытуемым разработаны особые экспериментальные планы.
Чаще исследование проводится с экспериментальной группой, в которой все испытуемые объективно различны, но отобраны и распределены по подгруппам с помощью той или иной стратегии.
Различают четыре основных вида "дизайна" - конструирования экспериментальных групп.
При первом варианте исследование проводится с двумя различными группами: экспериментальной и контрольной, которые ставятся в разные условия. Это наиболее распространенный способ.
Второй вариант предполагает исследование одной группы: ее поведение изучается и в экспериментальных и в контрольных условиях. Он применяется, когда имеется только экспериментальная группа и нет возможности сформировать контрольную. Но этот план никак не контролирует "эффект последовательности" и используется лишь в тех редких случаях, когда эффектом последовательности можно пренебречь.
Третий вариант - использование конструирования групп методом "парного дизайна" - состоит в следующем. Для каждого субъекта группы подбирается эквивалентный (или похожий) ему, и они распределяются по разным группам. Соответственно контрольная и экспериментальная группы становятся похожими по составу испытуемых. Конечно, в этом случае невозможно соблюсти полную эквивалентность групп в обеих условиях эксперимента, но данный способ значительно лучше, чем эксперимент с участием одной группы в разных условиях.
Наконец, четвертый план является смешанным: все группы ставятся в в разные условия. При этом образуется несколько групп. Способ применяется при факторном планировании эксперимента.
Итак, формирование выборки испытуемых - экспериментальной группы - должно подчиняться ряду правил.
1. Содержательный критерий (критерий операциональной валидности). Напомним, что операциональная валидность определяется соответствием экспериментального метода проверяемой гипотезе. Подбор экспериментальной группы должен определяться предметом и гипотезой исследования.
Таким образом, экспериментатор должен создать модель идеального объекта экспериментального исследования для своего частного случая и по возможности его описать, следуя этому описанию при формировании экспериментальной группы. Характеристики реальной экспериментальной группы должны минимально отклонятся от характеристик идеальной экспериментальной группы.
2. Критерий эквивалентности испытуемых (критерий внутренней валидности). Результаты, полученные при исследовании экспериментальной выборки, должны распространяться на каждого ее члена. То есть мы должны учесть все значимые характеристики исследуемого объекта, различия в выраженности которых могут существенно повлиять на зависимую переменную. Допустим, необходимо проверить влияние ситуативной тревожности детей на скорость овладения школьными навыками. В этом случае состав экспериментальной группы должен быть подобран так, чтобы в нее входили дети с одинаковым уровнем развития интеллекта. Если же это не удается сделать, то при обработке данных используется нормировка результатов на величину значимого параметра.
Процедура подбора эквивалентных групп и эквивалентных испытуемых называется рандомизацией.
3. Критерий репрезентативности (критерий внешней валидности). Существуют теоретические статистические критерии репрезентативности (представленности) выборки испытуемых. Группа лиц, участвующих в эксперименте, должна представлять всю часть популяции, по отношению к которой мы можем применять данные, полученные в эксперименте. Величина экспериментальной выборки определяется видом статистических мер и выбранной точностью (достоверностью) принятия или отвержения экспериментальной гипотезы. Она может быть равна множеству индивидов, чье поведение нас интересует. Экспериментальная выборка может представлять лишь часть интересующего нас множества. Главная проблема состоит в том, на какие другие интересующие нас группы можно распространить результаты проводимого нами исследования.
Подбор экспериментальной группы осуществляется с помощью различных стратегий. Напомним, что для чего нужна стратегия отбора групп. Задача сводится во-первых, к установлению уже рассмотренного в предыдущих разделах "эффекта смешения". Под этим термином понимается влияние индивидуальных различий между испытуемыми на связь независимой и зависимой переменных. Например, на публичное поощрение за хорошую работу люди разного темперамента реагируют неодинаково. Тем самым контролируется влияние побочной переменной на внутреннюю валидность. Во-вторых, экспериментальная группа должна представлять изучаемую популяцию, т.е. обеспечивать внешнюю валидность эксперимента.
Использование реально существующих групп порождает систематическое смешение независимой переменной с индивидуальными свойствами испытуемых.
Для нас уже очевидно, что экспериментальная выборка представляет собой модель популяции в целом или той ее части, поведение которой нас интересует.
Наиболее простой вариант был уже рассмотрен - составление репрезентативной группы испытуемых, характеристики которой соответствуют характеристикам интересующей нас популяции. Иногда невозможно найти способ создания репрезентативной группы. Тогда используется метод приближенного моделирования. В частности, исследование может проводится при участие студентов 2-го курса университета, а данные приписываются всем людям, или людям в возрасте от 17 до 21 года, или людям со средним образованием в возрасте от 17 до 21 года и т.д. Чем меньше генерализация, т.е. чем точнее набор критериев, описывающих популяцию, на которую распространяются выводы, тем выше внешняя валидность эксперимента.
При моделировании популяции методом случайного выбора, или рандомизации, экспериментальную выборку составляют так, что каждой личности предоставляется равный шанс для участия в эксперименте. Каждому индивиду присваивается номер; с помощью таблицы случайных чисел производится формирование экспериментальной выборки. Процедура очень трудноосуществима, поскольку каждый представитель интересующей нас популяции должен быть учтен. На практике прибегают к более простым способам случайного отбора. Отбирают любую группу испытуемых, затем измеряют у них значимое для эксперимента индивидуальное свойство. После этого испытуемых распределяют по группам методом Монте-Карло так, что вероятность попасть в группу для каждого испытуемого равна.
Наконец, существует еще один способ моделирования выборки - стратометрический. Генеральная совокупность рассматривается как совокупность групп, обладающих определенными характеристиками. В экспериментальную выборку отбираются испытуемые с соответствующими характеристиками - так, чтобы в ней были равнопредставлены лица из каждой страты. Чаще всего используются следующие характеристики: пол, возраст, политические предпочтения, образование и уровень доходов. Эту стратегию применяют психодиагносты при разработке тестов; педагогические; психологи; в основном же ею пользуются социологи и социальные психологи при опросах общественного мнения, исследовании социальных установок и т.д.
Ряд авторов выделяют стратегию попарного отбора. При этом экспериментальная и контрольная группы составляются из индивидов, эквивалентным по значимым для эксперимента побочным параметрам. Идеальный вариант - использование близнецовых пар (моно- или дизиготных). Разновидностью этой стратегии является подбор однородных групп, в которых испытуемые уравнены по всем характеристикам, кроме интересующих исследователя дополнительных переменных. Другой вариант - выделение значимой дополнительной переменной. Все испытуемые тестируются, ранжируются по уровню выраженности переменной. Группы формируются так, чтобы испытуемые, обладающие одинаковыми или близкими значениями переменной, попали в разные группы.
Итак, существует шесть стратегий построения групп: 1) рандомизация; 2) попарный отбор; 3) рандомизация с выделением страт (стратометрический отбор); 4) приближенное моделирование; 5) репрезентативное моделирование; 6) привлечение реальных групп.
Различают два основных типа привлечения испытуемых в группу:
а) отбор; б) распределение. Отбор проводят при рандомизации, рандомизации с выделением страт, при репрезентативном и приближенном моделировании. Распределение осуществляется при способе составления групп из эквивалентных пар и исследованиях с участием реальных групп.
Считается, что наилучшая внешняя и внутренняя валидность достигается при стратегии подбора эквивалентных пар и стратометрической рандомизации: индивидуальные особенности испытуемых с помощью этих стратегий контролируются максимально. В остальных же случаях нет никаких гарантий эквивалентности испытуемых, контролируемости индивидуальных различий и представленности группы.
Привлечение добровольцев или принудительное участие в эксперименте нарушает репрезентативность выборки. Отметим лишь, что стратегии попарного моделирования, приближенного моделирования и стратометрической рандомизации, в отличие от стратегии рандомизации ("случайно отобранных групп"), предполагают, что нам известен дополнительный параметр - индивидуальная особенность, которая может оказать значимое влияние на результат эксперимента. Ошибка в выделении этого параметра и/или недоучет других параметров приводят экспериментатора к неудаче. Очевидно, что применение таких стратегий формирования групп должно опираться на серьезные знания в области дифференциальной психологии (психологии индивидуальных различий).
Отдельная проблема - численность экспериментальной выборки. В зависимости от целей и возможностей она может варьировать от одного испытуемого до нескольких тысяч человек. Количество испытуемых в отдельной группе (экспериментальной или контрольной) в большинстве экспериментальных исследований варьирует от 1 до 100. Рекомендуется, чтобы численность сравниваемых групп была не менее 30-35 человек из соображений статистических: коэффициенты корреляции выше 0,35 при таком количестве испытуемых значимы при p = 0,05.
Если же для обработки данных используется факторный анализ, то существует простое правило: надежные факторы решения можно получить лишь в том случае, когда количество испытуемых не менее, чем в 3 раза, превышает число регистрируемых параметров. Кроме того, как рекомендует Л.В. Куликов, целесообразно увеличивать количество испытуемых, по крайней мере, на 5-10% больше требуемого, поскольку часть из них будет "отбракована" в ходе эксперимента или при анализе экспериментальных протоколов (не поняли инструкцию, не приняли задачу, дали "девиантные" результаты и т.д.).
Что касается состава по полу и возрасту, то рекомендуется (кроме специальных случаев) разбивать общую группу на подгруппы мужчин и женщин и обрабатывать данные отдельно для каждой подгруппы. Возрастной состав определяется исходя из целей исследования. Для ориентировки приведем наиболее распространенную периодизацию возрастов:
1. Новорожденный - 0-10- дней.
2. Грудной - 10 дней - 1 год.
3. Раннее детство - 1-2 года.
4. Первый период детства - 3-7 лет.
5. Второй период детства - 8-12 лет (мальчики), 8-11 лет (девочки).
6. Подростковый - 13-16 (мальчики), 12-15 (девочки).
7. Юношеский - 17-21 (мужчины), 16-20 (женщины).
8. Средний: первый период - 22-35 лет (мужчины), 21-35 лет (женщины); второй период - 36-60 лет (мужчины), 36-55 лет (женщины).
9. Пожилой возраст - 61-75 (мужчины), 55-75 (женщины).
10.Старческий возраст - 75-90 лет.
11.Долгожители - 90 лет и старше.
Литература:
- Готтсданкер Р. Основы психологического эксперимента. М.: МГУ, 1982.
- Экспериментальная психология / Под ред. П. Фресса и Ж. Пиаже. Вып. 1-2. М.: Прогресс, 1966.
- Куликов Л.В. Психологическое исследование. СПб.: Наука,
1994.
Экспериментальные переменные и способы их контроля.
Экспериментатор проверяет гипотезу о причинной связи двух явлений, А и В. Понятие "причинность" является одним из наиболее сложных в науке. Существует ряд эмпирических признаков причинной связи между двумя явлениями. Первый признак - разделенность причины и следствия во времени и предшествование причины следствию. Если исследователь обнаруживает изменения в объекте после экспериментального воздействия, по сравнению с аналогичным объектом, который таковому не подвергался, у него есть повод говорить о том, что экспериментальное воздействие стало причиной изменения состояния объекта. Наличие воздействия и сравнение объектов являются необходимыми условиями такого вывода, ибо не всегда предшествующее событие - причина последующего. Отлет гусей на юг отнюдь не является причиной выпадения снега через месяц. Второй признак - наличие статистической связи между двумя переменными (причиной и следствием). Изменение величины одной из переменных должно сопровождаться изменением другой. Иначе говоря, между переменными должна наблюдаться либо линейная корреляция, как между уровнем вербального интеллекта и школьной успеваемостью, либо нелинейная корреляция, как между уровнем активации и степенью эффективности научения (закон Йеркса-Додсона).
Наличие корреляции - недостаточное условие для вывода о причинно-следственной связи, так как связь может быть случайной или обусловленной третьей переменной.
Третий признак - причинно-следственная связь регистрируется, если экспериментальная процедура исключает иные возможности объяснения связей А и В, кроме как причинной, и все другие альтернативные причины возникновения явления В исключены.
Проверка экспериментальной гипотезы о причинной связи двух явлений производится следующим образом. Экспериментатор моделирует предполагаемую причину: она выступает в качестве экспериментального воздействия, а следствие - изменение состояния объекта - регистрируется с помощью какого-нибудь измерительного инструмента.
Экспериментальное воздействие служит для изменения независимой переменной, которая является непосредственной причиной изменения зависимой переменной. Так, экспериментатор, предъявляя испытуемому сигналы различной околопороговой громкости, изменяет его психическое состояние - испытуемый либо слышит, либо не слышит сигнал, что приводит к различным моторным или вербальным ответам ("да" - "нет", "слышу" - "не слышу").
Внешние ("прочие") переменные экспериментальной ситуации экспериментатор должен контролировать. Среди внешних переменных выделяют: 1) побочные переменные, которые порождают систематическое смешение, ведущее к появлению неожиданных данных (фактор времени, фактор задачи, индивидуальные особенности испытуемых); 2) дополнительную переменную, которая существенна для изучаемой связи между причиной и следствием. При проверке частной гипотезы уровень дополнительной переменной должен соответствовать ее уровню в изучаемой реальности. Например, при изучении связи уровня развития непосредственного и опосредованного запоминания дети должны быть одного возраста. Возраст в этом случае - дополнительная переменная. Если же проверяется общая гипотеза, то эксперимент проводится при разных уровнях дополнительной переменной, т.е. с участием групп детей разного возраста, как в известных экспериментах А.Н. Леонтьева по изучению развития опосредованного запоминания. Дополнительная переменная, особо значимая для эксперимента, называется "ключевой". Контрольной переменной называется дополнительная переменная, которая в факторном эксперименте становится второй основной.
Суть эксперимента состоит в том, что экспериментатор варьируя независимой переменной, регистрирует изменение зависимой переменной и контролирует внешние (побочные) переменные.
Исследователи различают разные виды независимой переменной: качественную ("есть подсказка" - "нет подсказки"), количественную (уровень денежного вознаграждения).
Среди зависимых переменных выделяются базисные. Базисная переменная - единственная зависимая переменная, на которую оказывает влияние независимая переменная.
Какие независимые, зависимые и внешние переменные встречаются при проведении психологического эксперимента?
3.1. Независимая переменная.
Исследователь должен стремиться оперировать в эксперименте только независимой переменной. Эксперимент, где это условие соблюдается, называется чистым экспериментом. Но чаще всего в ходе эксперимента, варьируя одну переменную, экспериментатор изменяет вместе с тем и ряд других. Это изменение может быть вызвано действием экспериментатора и обусловлено связью двух переменных.
Центральная проблема при проведении экспериментального исследования - выделение независимой переменной и ее изоляция от других переменных.
В качестве независимых переменных в психологическом эксперименте могут выступать: 1) характеристики заданий; 2) особенности ситуации (внешнии условия); 3) управляемые особенности (состояния) испытуемого.
Последние часто называют "переменными организма". Иногда выделяют четвертый вид переменных - константные характеристики испытуемого (интеллект, пол, возраст и т.д.), но, они относятся к дополнительным переменным, поскольку на них нельзя воздействовать, а можно лишь учесть их уровень при формировании экспериментальных и контрольных групп.
Характеристики задания - то, чем может манипулировать экспериментатор более или менее свободно. По традиции, идущей от бихевиоризма, считается, что экспериментатор варьирует только характеристиками стимулов (stimulus variables), но в его распоряжении гораздо больше возможностей. Экспериментатор может варьировать стимулы или материал задания, изменять тип ответа испытуемого (вербальный или невербальный ответ), менять шкалу оценивания и т.д. Он может варьировать инструкцию, меняя цели, которые должен достичь испытуемый в ходе выполнения задания. Экспериментатор может варьировать средства, которые имеет испытуемый для решения задачи, и ставить перед ним препятствия. Он может изменять систему поощрений и наказаний в ходе выполнения заданий и т.д.
К особенностям ситуации следует отнести те переменные, которые непосредственно не входят в структуру экспериментального задания, выполняемого испытуемым. Это может быть температура в помещении, обстановка, наличие внешнего наблюдателя и т.д.
Эксперименты по выявлению эффекта социальной фасилитации (усиления) проводились по следующей схеме: испытуемому давалась какая-либо сенсомоторная или интеллектуальная задача. Он сначала выполнял ее в одиночку, а затем в присутствии другого человека или нескольких людей (последовательность, разумеется, менялась в разных группах). Оценивалось изменение продуктивности испытуемых. В этом случае задача испытуемого оставалась неизменной, изменялись лишь внешние условия эксперимента.
Что может варьировать экспериментатор?
Во-первых, это физические параметры ситуации: расположение аппаратуры, внешний вид помещения, освещенность, звуки и шумы, температура, размещение мебели, окраска стен, время проведения эксперимента (время суток, длительность и т.д.). То есть все физические параметры ситуации, не являющееся стимулами.
Во-вторых, это особенности общения и взаимодействия испытуемого (испытуемых) и экспериментатора.
Судя по публикациям в научных журналах, за последние годы резко возросло количество экспериментальных исследований, в которых применяется варьирование внешних условий.
К "организменным переменным", или неуправляемым характеристикам испытуемых, относятся физические, биологические, психологические, социально-психологические и социальные признаки. Традиционно их относят к "переменным", хотя большинство из них является неизменным или относительно неизменным на протяжении жизни. Влияние дифференциально-психологических, демографических и прочих константных параметров на поведение индивида изучают в корреляционных исследованиях. Однако авторы большинства учебников по теории психологического метода, такие, как В.-Дж.Андервуд или М. Мэтлин, относят эти параметры к числу независимых переменных эксперимента.
Как правило, в современном экспериментальном исследовании дифференциально-психологические особенности индивидов, такие, как интеллект, пол, возраст, социальное положение (статус) и т.д., учитываются в качестве дополнительных переменных, которые контролируются экспериментатором в общепсихологическом эксперименте. Но эти переменные могут превращаться во "вторую основную переменную" в дифференциально-психологическом исследовании, и тогда используется факторный план.
3.2. Зависимая переменная.
Психологи имеют дело с поведением испытуемого, поэтому в качестве зависимой переменной выбираются параметры вербального и невербального поведения. К ним относятся: число ошибок, которое совершила крыса, пробегая лабиринт; время, которое затратил испытуемый при решении задачи, изменения мимики его лица при просмотре эротического фильма; время двигательной реакции на звуковой сигнал и т.д.
Выбор поведенческого параметра определяется исходной экспериментальной гипотезой. Исследователь должен максимально конкретизировать, т.е. добиться того, чтобы зависимая переменная была операционализирована - поддавалась регистрации в ходе эксперимента.
Параметры поведения условно можно разделить на формально-динамические и содержательные. Формально-динамические (или пространственно-временные) параметры достаточно легко поддаются аппаратурной регистрации. Приведем пример этих параметров.
1. Точность. Наиболее часто регистрируемый параметр. Поскольку большинство заданий, предъявляемых испытуемому в психологических экспериментах, являются задачами на достижения, то точность или противоположный параметр - ошибочность действий - будет главным регистрируемым параметром поведения.
2. Латентность. Психические процессы протекают скрытно от внешнего наблюдателя. Время от момента предъявления сигнала до начала выбора ответа называется латентным временем. В некоторых случаях латентное время является важнейшей характеристикой процесса, например, при решении мыслительных задач.
3. Длительность, или скорость выполнения. Является характеристикой исполнительного действия. Время между выбором действия и окончанием его выполнения называют скоростью действия (в отличие от латентного времени).
4. Темп, или частота действий. Важнейшая характеристика, особенно при исследовании простейших форм поведения.
5. Продуктивность. Отношение числа ошибок или качества выполнения действия ко времени выполнения. Служит важнейшей характеристикой при исследовании научения, познавательных процессов, процессов принятия решения и т.д.
Содержательные параметры поведения предполагают категоризацию формы поведения либо в терминах обыденного языка, либо в терминах той теории, предположения которой проверяются в данном эксперименте.
Распознание различных форм поведения - дело специально обученных экспертов и наблюдателей. Требуется немалый опыт, чтобы безошибочно различать разные уровни агрессии или удивления, характеризовать один поступок как проявление покорности, а другой - как проявление подобострастия.
Проблема фиксации качественных особенностей поведения решается посредством: а) обучения наблюдателей и разработки карт наблюдения; б) измарения формально-динамических особенностей поведения с помощью тестов.
Зависимая переменная должна быть валидной и надежной. Надежность переменной проявляется в устойчивости ее регистрируемости при изменений условий эксперимента в течении времени. Валидность зависимой переменной определена только в конкретных условиях эксперимента и применительно к отдельной гипотезе.
Можно выделить три типа зависимых переменных: 1) одномерную; 2) многомерную; 3) фундаментальную. В первом случае регистрируется лишь один параметр, и именно он считается проявлением зависимой переменной (между ними существует функциональная линейная связь), как, например, при изучении времени простой сенсорной реакции. Во втором случае зависимая переменная многомерна. Например, уровень интеллектуальной продуктивности проявляется во времени решения задачи, его качестве, трудности решенной задачи. Эти параметры могут фиксироваться независимо. В третьем случае, когда известно отношение между отдельными параметрами многомерной зависимой переменной, параметры рассматриваются в качестве аргументов, а сама зависимая переменная - качестве функции. Например, фундаментальное измерение уровня агрессии F(а) рассматривается как функция отдельных ее проявлений (аi): мимики, пантомимики, брани, рукоприкладства и др.
F(а) = f(а1,a2,...an)7.
Существует еще одно важное свойство зависимой переменной, а именно - сензитивность (чувствительность) зависимой переменной к изменениям независимой. Суть в том, что манипуляция независимой переменной влияет на изменения зависимой. Если же мы манипулируем независимой переменной, а зависимая не изменяется, то зависимая переменная несензитивна по отношению к независимой. Два варианта проявления несензитивности зависимой переменной получили название "эффект потолка" и "эффект пола". Первый случай встречается тогда, когда предъявляемая задача так проста, что уровень ее выполнения много выше всех уровней независимой переменной. Второй эффект, напротив, возникает тогда, когда задание настолько сложно, что уровень его выполнения оказывается ниже всех уровней независимой переменной.
Итак, как и прочие компоненты психологического исследования, зависимая переменная должна быть валидна, надежна, обладать чувствительностью к изменению уровня независимой переменной.
Существуют два основных приема фиксации изменений зависимой переменной. Первый применяется наиболее часто в экспериментах с участием одного испытуемого. Изменение зависимой переменной регистрируется во время эксперимента вслед за изменением уровня независимой переменной. Примером является фиксация результатов в экспериментах по научению. Кривая научения представляет собой классический вариант тренда - изменения успешности выполнения заданий от числа проб (времни проведения эксперимента). Для обработки таких данных применяется статистический аппарат анализа трендов. Второй прием фиксации изменения уровня независимой переменной называется отсроченным измерением. Между воздействием и эффектом проходит определенный промежуток времени, его длительность устанавливается по времени отдаленности следствия от причины. Например, прием дозы алкоголя увеличивает время сенсомоторной реакции не сразу, а по прошествии определенного времени. То же самое можно сказать о влиянии заучивания конкретного количества иностранных слов на успешность перевода текста на редкий язык: эффект появляется не сразу (если появляется).
3.3. Отношения между переменными.
В основе построения современной экспериментальной психологии лежит формула К. Левина - поведение есть функция личности и ситуации:
В = f(P;S).
Необихевиористы ставят в формулу вместо P (личность) О (организм), что более точно, если считать испытуемыми не только людей, но и животных, а личность редуцировать к организму.
Как бы то ни было, а большинство специалистов по теории психологического эксперимента, в частности Мак Гиган, считают, что в психологии существуют два типа законов: 1) "стимул - ответ"; 2) "организм - поведение".
Первый тип законов обнаруживается в ходе экспериментального исследования, когда стимул (задача, ситуация) - это независимая переменная, а зависимая переменная - ответ испытуемого.
Второй тип законов является продуктом метода систематического наблюдения и измерения, поскольку свойствами организма управлять с помощью психологических средств нельзя.
Существуют ли "пересечения"? Разумеется. Ведь в психологическом эксперименте зачастую учитывается влияние так называемых дополнительных переменных, большинство из которых является дифференциально-психологическими характеристиками. Следовательно, есть смысл добавить в список и "системные" законы, описывающие влияние ситуации на поведение личности, обладающей определенными свойствами.
В классическом психологическом эксперименте устанавливается функциональная зависимость вида:
R = f(S),
где R - ответ, а S - ситуация (стимул, задача). Переменная S систематически варьируется, а детерминируемые ею изменения ответа испытуемого фиксируются. В ходе изучения проявляются условия, при которых испытуемый ведет себя тем или иным образом. Результат фиксируется в форме линейной или нелинейной зависимости.
Другой тип зависимостей символизируется как зависимость поведения от личностных свойств или состояний организма испытуемого:
R = f(O) или R = f(P).
Исследуется зависимость поведения испытуемого от того или иного состояния организма (болезни, усталости, уровня активации, фрустации потребностей и т.д.) или от личностных свойств (тревожности, мотивации и т.д.). Исследования проводятся с участием групп людей, различающихся по данному признаку: свойству или актуальному состоянию.
Естественно, эти две строгие зависимости являются простейшими формами отношений между переменными. Возможны и более сложные зависимости, устанавливаемые в конкретном эксперименте, в частности, факторные планы позволяют выявить зависимости вида R = f(S1,S2), когда ответ испытуемого зависит от двух варьируемых параметров ситуации, а поведение является функцией состояния организма и среды.
Остановимся на формуле К. Левина. В общей форме она выражает идеал экспериментальной психологии: возможность предсказать поведение конкретной личности в определенной ситуации. Переменная "личность", которая входит в состав этой формулы, вряд ли может рассматриваться лишь как "дополнительная". Традиция необихевиоризма предлагает использовать тармин "промежуточная" переменная. В последнее время за такими "переменными" - свойствами и состояниями личности - закрепился термин "переменная модератор", т.е. посредник.
Рассмотрим основные возможные варианты отношений между зависимыми переменными. Существует как минимум шесть видов связи переменных:
- первый, он же простейший, - отсутствие зависимости. Зависимая переменная не чувствительна к изменению независимой.
- монотонно возрастающая зависимость наблюдается тогда, когда увеличению значений независмой переменной соответствует изменение зависимой переменной.
- монотонно убывающая зависимость наблюдается, если увеличению значений независимой переменной соответствует уменьшение уровня зависимой переменной.
- нелинейная зависимость U - образного типа обнаруживается в большинстве экспериментов, в которых выявляются особенности психической регуляции поведения.
- инвертированная U - образная зависимость получается в многочисленных экспериментальных и корреляционных исследованиях как в психологии личности, мотивации, так и в социальной психологии.
- последний вариант зависимости обнаруживается не так часто, как предыдущие, - сложная квазипериодическая зависимость уровня зависимой переменной от уровня независимой.
При выборе способа описания работает "принцип экономии": простое описание лучше, чем все другие эквивалентные по успешности описания. Любое простое описание лучше, чем комплексное. Поэтому аргументы, распространенные в отечественных научных дискуссиях, типа "Все гораздо сложнее на самом деле, чем представляет автор" по меньшей мере бессмысленны. Тем более, что никто не знает, как "на самом деле".
Так называемое "комплексное описание", "многомерное описание" есть зачастую просто попытка уйти от решения научной проблемы, способом маскировки личной некомпетентности, которую хотят скрыть за путаницей корреляционных связей и сложносоставленными формулами, где все всему равняется.
3.4. Контроль переменных.
Следует различать контроль независимой переменной и контроль "прочих" или внешних (побочных и дополнительных переменных). Контроль независимой переменной состоит в ее активном варьировании или знании закономерности ее изменения. Второй смысл понятия "контроль" - управление внешними, "прочими" переменными эксперимента. Влияние внешних переменных сводится к эффекту смешения.
Различают два основных способа контроля независимой переменной. Эти способы лежат в основе двух типов эмпирического исследования: активного и пассивного. Напомним, что в психологии к активным относятся деятельностный метод (эксперимент) и коммуникативный (беседа), а к пассивным - наблюдение и измерение. Пассивные методы называют также методами систематизированной регистрации, или систематизированного наблюдения (включая в него и процедуру измерения).
В эксперименте контроль независимой переменной производится с помощью активного манипулирования, варьирования. При систематизированном наблюдении (также - измерении) контроль осуществляется за счет отбора (селекции) требуемых значений независимой переменной из числа уже существующих переменных. Примером активного контроля является, например, изменение громкости сигнала, подаваемого экспериментатором в наушники. Примером пассивного контроля может служить разбиение группы учеников на неуспевающих, среднеуспевающих и высокоуспешных при исследовании влияния уровня успешности обучения на статус личности в учебной группе.
При планировании исследования следует иметь в виду, что принципы, предъявляемые к формированию плана для активного и пассивного исследований, одни и те же, за исключением контроля эффектов, связанных с экспериментальным воздействием,
Существует несколько основных приемов контроля влияния внешних ("прочих") переменных на результат эксперимента:
1) элиминация внешних переменных;
2) константность условий;
3) балансировка;
4) контрбалансировка;
5) рандомизация.
Эти приемы, разумеется, не позволяют полностью избежать воздействий со стороны "прочих" переменных, однако их выполнение является своеобразной профилактической процедурой: мытье рук перед едой не дает 100%-ной гарантии от заболевания дизентерией, но существенно снижает вероятность заболевания.
3.5. Определение внешней переменной.
Рассмотрим последовательно различные способы контроля внешних переменных.
1. Элиминация. Наиболее простой по сути, но не по возможностям осуществления "радикальный" способ контроля. Экспериментальную ситуацию контролируют таким образом, чтобы исключить какое-либо присутствие в ней внешней переменной. Например, в психофизических лабораториях часто создают экспериментальные камеры, изолирующие испытуемого от внешних звуков, шумов, вибрационного воздействия и электромагнитных полей. Но зачастую элиминировать влияние внешних переменных невозможно. Например, трудно представить себе, как можно исключить влияние таких переменных, как пол, возраст, интеллект.
2. Создание константных условий. Если внешние переменные не удается исключить из экспериментальной ситуации, то исследователю приходится делать их неизменными. При этом влияние внешней переменной остается неизменным на всех испытуемых, при всех значениях независимой переменной и на протяжении всего эксперимента. Однако эта стратегия не позволяет полностью избежать эффекта смешения: данные, полученные при константных значениях внешних переменных, можно переносить только на те реальные ситуации, в которых значения внешних переменных такие же, какими они были при исследовании. Исследователь стремится сделать неизменными внешние пространственно-временные условия проведения эксперимента. В частности, экспериментальные пробы или наблюдение за поведением проводятся со всеми испытуемыми в одно и то же время суток и в один и то же день недели, например в понедельник в 9 часов утра. Однако это не гарантирует от эффекта смешения.
Следует стандартизировать технику проведения исследования и оборудования экспериментальных помещений (звуки, ароматы, окраску стен, вид фурнитуры, расположение мебели и т.д.).
Исследователь стремится константными дополнительные переменные - уравнять группы испытуемых по основным значимым для исследования индивидуальным характеристикам (уровню образования, полу, возрасту).
Экспериментатор должен предъявлять инструкцию одинаково всем испытуемым (разумеется, исключая те случаи, когда она изменяется в соответствии с планом эксперимента). Он должен стремится сохранять неизменными интонацию и силу голоса. Рекомендуется записывать инструкцию на магнитофон и предъявлять запись (кроме особых случаев).
3. Балансировка. В тех случаях, когда отсутствует возможность создать константные условия проведения эксперимента или константности условий недостаточно, применяют технику балансировки эффекта от действия внешних переменных. Балансировка применяется в двух ситуациях: 1) в том случае, если невозможно идентифицировать внешнюю переменную; 2) в том случае, если ее можно идентифицировать и использовать специальный алгоритм для контроля этой переменной.
Рассмотрим способ балансировки влияния неспецифических внешних переменных. Он состоит в том, что в дополнения к экспериментальной группе в план эксперимента включается контрольная группа. Экспериментальное исследование контрольной группы проводится в тех же условиях, что и экспериментальной. Отличие в том, что экспериментальное воздействие осуществляется только на испытуемых, включенных в экспериментальную группу. Тем самым изменение зависимой переменной в контрольной группе обусловлено лишь внешними переменными, а в экспериментальной - совместным действием внешних и независимой переменных.
Разумеется, при этом нельзя выделить специфическое влияние каждой внешней переменной и особенности такого влияния независимой переменной из-за эффекта взаимодействия переменных.
Для того, чтобы определить, как влияет на зависимую переменную та или иная внешняя переменная, используют план, включающий более чем одну контрольную группу. В общем случае число контрольных групп в экспериментальном плане должно быть N = n + 1, где n - число внешних ("прочих") переменных. Вторая контрольная группа помещается в экспериментальные условия, где исключено действие одной из внешних переменных, влияющих на зависимую переменную экспериментальной и контрольной групп. Различие в результатах 1-й и 2-й контрольных групп позволяет выделить специфическое влияние одной из внешних переменных.
Несколько отличается процедура балансировки при контроле известных внешних переменных. Типичный учет такой переменной - выявление уровня влияния принадлежности испытуемых к тому или иному полу на результаты эксперимента, поскольку известно, что многие данные, полученные на выборке мужчин, невозможно перенести на женскую выборку. Пол - это дополнительная переменная, поэтому планирование сводится к выявлению эффекта действия независимой переменной на зависимую в каждой из двух экспериментальных групп.
Аналогично строится эксперимент по сравнению эффекта различных аппаратурных методик в зависимости от возраста испытуемых и др.
4. Контрбалансировка. Это прием контроля дополнительной переменной чаще всего применяют тогда, когда эксперимент включает в себя несколько серий. Испытуемый оказывается в разных условиях последовательно, и предыдущие условия могут изменять эффект воздействия последующих условий. К примеру, при исследовании дифференциальной слуховой чувствительности не безразлично, какой звук, громкий или более тихий, предъявлялся испытуемому первым, а какой
- вторым. Также при выполнении тестов интеллекта важен порядок предъявления испытуемому задач: от простой к сложной или от сложной к простой. В первом случае более интеллектуальные испытуемые больше утомляются и теряют мотивацию, так как вынуждены решать большее количество задач, чем менее интеллектуальные. При втором варианте предъявления заданий менее интеллектуальные испытуемые испытывают стресс неуспеха и вынуждены решать больше задач, чем их более интеллектуальные коллеги. В этих случаях для ликвидации эффектов последовательности и эффекта последствия используют контрбалансировку. Смысл ее состоит в том, что порядок предъявления разных задач, стимулов, воздействий в одной из групп компенсируется иным порядком предъявления заданий в другой группе.
Контрбалансировка применяется в тех случаях, когда есть возможность провести несколько серий. Следует лишь учитывать, что большое число опытов может вызвать утомление у испытуемого. Но этот план позволяет контролировать эффект последовательности. Однако контрбалансировка не позволяет полностью исключить еще один эффект, а именно - влияние изменения порядка предъявления заданий на значение зависимой переменной. Он называется дифференцированным переносом: переход от ситуации 1 (когда она создается первой) к ситуации 2 отличается от перехода от ситуации 2 (когда она создается первой) к ситуации 1. Этот эффект приводит к тому, что реальные различия между двумя разными экспериментальными ситуациями при регистрации преувеличиваются.
Итак, техника контрбалансировки заключается в том, что каждый испытуемый получает более чем один вариант воздействия (АВ или ВА) и эффект последовательности целенаправленно распределяется на все экспериментальные условия.
При балансировке каждый испытуемый получает лишь одно экспериментальное воздействие - внешняя переменная балансируется за счет выявления эффекта ее действия на членов экспериментальной группы, по сравнению с эффектом, полученным при исследовании контрольной группы. Испытуемый может оказаться только в экспериментальной или же только в контрольной группе и получить воздействие какой-нибудь внешней переменной в обеих группах. Балансировка используется при исследовании независимых групп, тогда как контрбалансировка применяется в исследованиях с повторяющимся воздействиями.
5. Рандомизация. Рандомизацией называется процедура, которая гарантирует равную возможность каждому члену популяции стать участником эксперимента. Каждому представителю выборки присваивается порядковый номер, а выбор испытуемых в экспериментальную и контрольную группы проводится с помощью таблицы "случайных" чисел. Рандомизация является способом, позволяющим исключить влияние индивидуальных особенностей испытуемых на результат эксперимента.
Рандомизация применяется в двух случаях: 1) когда известно, как управлять внешними переменными в экспериментальной ситуации, однако у нас нет возможности использовать одну из предшествующих техник контроля; 2) когда мы предполагаем оперировать какой-либо внешней переменной в экспериментальной ситуации, однако не можем ее специфицировать и применить другие техники.
Если предположить, что значение дополнительной переменной (переменных) подчиняется вероятностным законам (например, описывается нормальным распределением), то в состав экспериментальной и контрольных групп войдет выборка, которая имеет те же уровни дополнительных переменных, что и генеральная совокупность.
По мнению многих специалистов, в том числе Кэмпбелла, уравнивание групп посредством процедуры рандомизации является единственно надежным способом элиминации влияния внешних (дополнительных) переменных на зависимую. Кэмпбелл определяет рандомизацию как универсальный способ уравнивания групп перед экспериментальным воздействием. Другие способы, например метод попарного сравнения, характеризуются им как малонадежные и ведущие к невалидным выводам.
И в заключение: следует обратить особое внимание на приведенную схему, в которой отображен, предложенный Мак Гиганом алгоритм пошагового контроля влияния внешних переменных на зависимую переменную.
4. Измерение.
4.1. Элементы теории измерений.
Измерение, как уже ранее отмечалось, может быть самостоятельным исследовательским методом, но может выступать и как компонент целостной процедуры эксперимента.
Как самостоятельный метод, он служит для выявления индивидуальных различий поведения субъекта и отражения им окружающего мира, а также для исследования адекватности отражения (традиционная задача психофизики) и структуры индивидуального опыта.
Измерение включается в контекст эксперимента как метод регистрации состояния объекта исследования и соответственно изменения этого состояния в ответ на экспериментальное воздействие.
Исследования, проводимые по плану временных проб, зачастую сводятся лишь к измерениям особенностей поведения испытуемых через различные промежутки времени. Время выступает в этом случае как единственная переменная, воздействующая на объект.
На основе теории измерения строятся психологические тесты. Тест - сокращенная по времени и упрощенная процедура психологического измерения, применяемая для решения практических (иногда - исследовательских) задач.
В чем же заключается сущность психологического измерения?
В психологии различают три основные процедуры психологического измерения. Основанием для различения является объект измерения. Во-первых, психолог может измерять особенности поведения людей для того, чтобы определить, чем один человек отличается от другого с точки зрения выраженности тех или иных свойств, наличия того или иного психологического состояния или для отнесения его к определенному типу личности. Психолог, измеряя особенности поведения, определяет сходства или различия людей. Психологическое измерение становится измерением испытуемых.
Во-вторых, исследователь может использовать измерение как задачу испытуемого, в ходе выполнения которой он измеряет (классифицирует, ранжирует, оценивает и т.п.) внешние объекты: других людей, стимулы или предметы внешнего мира, собственные состояния. Часто эта процедура оказывается измерением стимулов. Понятие "стимул" используется в широком смысле, а не в узкопсихофизическом или поведенческом. Под стимулом понимается любой шкалируемый объект.
В-третьих, существует процедура так называемого совместного измерения (или совместного шкалирования) стимулов и людей (испытуемых). При этом предполагается, что "стимулы" и "испытуемые" могут быть расположены на одной оси. Поведение испытуемого рассматривается как проявление взаимодействия личности и ситуации. Подобная процедура применяется при тестировании знаний и задач по Кумбсу, Гуттману или Рашу.
Внешне процедура психологического измерения ничем не отличается от процедуры психологического эксперимента. Более того, в психологической исследовательской практике "измерение" и "эксперимент" часто используются как синонимы. Однако при проведении психологического эксперимента нас интересуют причинные связи между переменными, а результатом психологического измерения является всего лишь отнесение испытуемого либо оцениваемого им объекта к тому или иному классу, точке шкалы или пространству признаков.
В строгом смысле слова психологическим измерением можно назвать лишь измерение поведения испытуемых, т.е. измерение в первом значении этого понятия.
Психологическое измерение стимулов является задачей, которую выполняет не экспериментатор, а испытуемый в ходе обычного психологического (точнее - психофизического) эксперимента. В этом случае измерение используется только как методический прием наряду с другими методами психологического исследования; испытуемый же "играет роль" измерительного прибора. Поскольку результаты такого рода "измерений" интепретируются на на основе той же модели измерений, а обрабатываются с применением тех же математических процедур, что и результаты измерения поведения испытуемых, в психологии принято употреблять понятие "психологическое измерение" в двух различных смыслах.
Процедура психологического измерения состоит из ряда этапов, аналогичных этапам психологического экспериментального исследования.
Основой психологических измерений является математическая теория измерений - раздел психологии, интенсивно развивающийся параллельно и в тесном взаимодействии с развитием процедур психологического измерения. Сегодня это - крупнейший раздел математической психологии.
С математической точки зрения измерением называется операция установления взаимно однозначного соответствия множества объектов и символов (как частный случай - чисел). Символы (числа) приписываются вещам по определенным правилам.
Правила, на основании которых числа приписываются объектам, определяют шкалу измерения.
В настоящее время под измерением понимается конструирование любой функции, которая изоморфно отображает эмпирическую структуру в символическую структуру. Совсем не обязательно, что такой структурой должна быть числовая. Это может быть любая структура, с помощью которой можно измерить характеристики объектов, заменив их другими, более удобными в обращении (в том числе и числами).
Подробные математические основания теории психологических измерений изложены в монографии А.Д. Логвиненко "Измерения в психологии: математические основы", 1993 год.
4.2. Виды измерений.
В психологии используется множество конкретных измерительных методик. Удобную классификацию психологических измерений дал С.С. Паповян. Будем придерживаться ее в дальнейшем изложении.
Методы измерений могут быть классифицированы по различным основаниям:
1) процедуре сбора "сырых" данных;
2) предмету измерения;
3) виду используемой шкалы;
4) типу шкалируемого материала;
5) моделям шкалирования;
6) числу мерностей (одномерные и многомерные);
7) мощности метода сбора данных (мощные или слабые);
8) типу ответа индивида;
9) какими они являются: детерминистскими или вероятностными.
Для психолога экспериментатора главными основаниями являются процедура сбора данных и предмет измерения.
Чаще всего применяются следующие процедуры субъективного шкалирования:
- метод ранжирования. Все объекты представляются испытуемому одновременно, он должен их упорядочить по величине измеряемого признака.
- метод парных сравнений. Объекты предъявляются испытуемому попарно (число предъявлений равно числу сочетаний (n)). Испытуемый оценивает сходства - различия между членами пар.
- метод абсолютной оценки. Стимулы предъявляются по одному. Испытуемый дает оценку стимула в единицах предложенной шкалы.
- метод выбора. Индивиду предлагается несколько объектов (стимулов, высказываний и т.д.), из которых он должен выбрать те, которые соответствуют заданному критерию.
По предмету измерения все методики делятся на: а) методики шкалирования объектов; б) методики шкалирования индивидов; в) методики совместного шкалирования объектов и индивидов.
Методики шкалирования объектов (стимулов, высказываний и др.) встраиваются в контекст экспериментальной или измерительной процедуры. По своей сути они не являются задачей исследователя, а представляют собой экспериментальную задачу испытуемого. Исследователь использует эту задачу для выявления поведения испытуемого (в данном случае - реакции, действий, вербальных оценок и др.), чтобы знать особенности их психики. Поэтому нет оснований причислять эти техники к методам психологического измерения поведения, если под измерением понимать только задачу экспериментатора.
При субъективном шкалировании испытуемый выполняет функции измерительного прибора, а экспериментатор мало интересуется особенностями "измеряемых" испытуемым объектов и исследует сам "измерительный прибор".
Парадигма субъективного шкалирования перешла в другие области психологии из психофизики, где классификация задач испытуемого в эксперименте очень хорошо разработана. Это нельзя сказать о других областях психологии.
Но по укоренившейся традиции методики и модели субъективного шкалирования рассматриваются в одном разделе с техниками и моделями измерения поведения. Традиция эта связана с тем, что и при "шкалировании объектов", и при "шкалировании индивидов" в ходе обработки и интерпретации данных используются сходный математический аппарат.
Процедуре одномерного и многомерного субъективного шкалирования посвящена обширная научная и учебная литература (см. "Список литературы").
Остановимся на моделях совместного шкалирования объектов и испытуемых. Модели делятся на два вида: детерминистические и вероятностные. Суть этих моделей в том, что объекты, и индивиды, которые высказывают суждения об объектах, "отображаются" на одну шкалу на основании обработки данных поведенческого измерения либо субъективного шкалирования.
Основными детерминистическими моделями являются метод развертывания К. Кумбса и шкалограмный анализ Л. Гутмана. К вероятностным моделям относится латентно-структурный анализ IRT (item response theory). Здесь же мы кратко остановимся на детерминистических моделях.
Метод развертывания Кумбса исходит из предположения, что объекты и индивиды могут быть размещены на шкале одномерного признака. Индивид может предпочитать один объект другому. Существует "идеальная точка" индивида - субъективный эталон. Индивид предпочитает тот стимул, который "ближе" к субъективному эталону.
Процедура измерения состоит в следующем. Испытуемому предъявляются пары стимулов, которые он сравнивает. Формируется матрица частоты предпочтений стимулов размером m x n (m - стимулы, n - индивиды). В клеточках матрицы - относительные частоты предпочтений.
Шкалограмный анализ Гутмана используется для построения опросников. Наиболее часто применяется при дихотомической оценке ответа испытуемого ("да" - "нет", "решил" - "не решил").
Предполагается следующее: принятие индивидом пункта (решение задачи, ответ "да" и т.д.) означает то, что его шкальное значение не меньше величины пункта. Если индивид решает данную задачу, то он решает любую другую (более легкую) задачу. Принятие индивидом пункта опросника или правильное решение задачи обозначается как "1", непринятие пункта или неверное решение - "0".
В ходе обработки строки и столбцы исходной матрицы данных представляются так, чтобы она соответствовала "совершенной" шкалограмме: матрица выше диагонали, т.е. верхняя правая часть матрицы должна состоять из единиц, а нижняя левая - включать только нули. Порядок индивидов по строкам должен соответствовать порядку заданий по столбцам по величине выраженности свойства.
Задания 1 2 3 4 5 6 Испытуемые 1 1 1 1 1 1 1 2 0 1 1 1 1 1 3 0 0 1 1 1 1 4 0 0 0 1 1 1 5 0 0 0 0 1 1
Практически никогда идеальная шкалограмма не получается.
Оценка одномерности признака предложена Гутманом и называется коэффициентом воспроизводимости:
R = 1 - e/nK,
Где е - число "ошибок" в откликах испытуемых,
n - количество испытуемых,
k - число заданий.
Существует также модификация модели Гутмана, описывающая процедуру с несколькими вариантами ответов.
Литература:
- Психологические измерения. М.: Мир, 1976.
- Паповян С.С. Математические методы в социальной психологии. М.: Наука, 1983.
- Клайн П. Справочное руководство по конструированию тестов. Киев, 1994.
- Дюк В.А. Компьютерная психодигностика. СПб.: Братство,
1994.
5. Типы измерительных шкал, применяемых в психологии, социологии и маркетинге.
5.1. Элементы теории шкал.
Измерительная шкала - основное понятие, введенное в психологию в 1950 году С.С. Стивенсом; его трактовка шкалы и сегодня используется в научной литературе.
Итак, приписывание чисел объектам создает шкалу. Создание шкалы возможно, поскольку существует изоморфизм формальных систем и систем действий, производимых над реальными объектами.
Числовая система является множеством элементов с реализованными на нем отношениями и служит моделью для множества измеряемых объектов.
Различают несколько типов таких систем и соответственно несколько типов шкал. Операции, а именно - способы измерения объектов, задают типы шкалы. Шкал в свою очередь характеризуется видом преобразований, которые могут быть отнесены к результатам измерения. Если не соблюдать это правило, то структура шкалы нарушится, а данные измерения нельзя будет осмысленно интерпретировать.
Тип шкалы однозначно определяет совокупность статистических методов, которые могут быть применены для обработки данных измерения.
Шкала (лат. scala - лестница) в буквальном значении есть измерительный инструмент.
П. Суппес и Дж. Зиппес дали классическое определение шкалы: "Пусть А - эмпирическая система с соотношениями (ЭСО), R - полная числовая система с соотношениями (ЧСО), f - функция, которая гомоморфно отображает А в подсистему R (если в области нет двух разных объектов с одинаковой мерой, что является отображением изоморфизма). Назовем шкалой упорядоченную тройку ".
Обычно в качестве числовой системы R выбирается система действительных чисел или ее подсистема. Множество А - это совокупность измеряемых объектов с системой отношений, определенной на этом множестве. Отображение f - правило приписывания каждому объекту определенного числа.
В настоящее время определение Суппеса и Зиппеса уточнено. Во-первых, в определение шкалы вводится G - группа допустимых преобразований. Во-вторых, множество А понимается не только как числовая система, но и как любая формальная знаковая система, которая может быть поставлена в отношение гомоморфизма с эмпирической системой. Таким образом, шкала - это четверка . Согласно современным представлениям, внутренней характеристикой шкалы выступает именно группа G, а f является лишь привязкой шкалы к конкретной ситуации измерения.
Существуют следующие основные типы шкал: наименований, порядка, интервалов, отношений. Ряд специалистов выделяют также абсолютную шкалу и шкалу разностей.
5.2. Шкалы наименований или номинативные шкалы.
Шкала наименований получается путем присвоения "имен" объектам. При этом нужно разделить множество объектов на непересекающиеся подмножества.
Иными словами, объекты сравниваются друг с другом и определяется их эквивалентность - неэквивалентность. В результате процедуры образуется совокупность классов эквивалентности. Объекты, принадлежащие одному классу, эквиваленты друг другу и отличны от объектов, относящихся к другим классам. Эквивалентным объектам присваиваются одинаковые имена.
Операция сравнения является первичной для построения любой шкалы. Для построения такой шкалы нужно, чтобы объект был равен или подобен сам себе (х=х для всех значений х), т.е. на множестве объектов должно быть реализовано отношение рефлексивности. Для психологических объектов, например испытуемых и психических образов, это отношение реализуемо, если абстрагироваться от времени. Но поскольку операции попарного (в частности) сравнения множества всех объектов эмпирически реализуются неодновременно, то в ходе эмпирического измерения даже это простейшее условие не выполняется.
Следует запомнить: любая шкала есть идеализация, модель реальности, даже такая простейшая, как шкала наименований.
На объектах должно быть реализовано отношение симетрии (R(X=Y)->R(Y=X) и транзитивности R(X=Y,Y=Z)->R(X=Z). Но на множестве результатов психологических экспериментов эти условия могут нарушаться.
Кроме того, многократное повторение эксперимента (накопление статистики) приводит к "перемешиванию" состава классов: в лучшем случае мы можем получить оценку, указывающую на вероятность принадлежности объекта к классу.
Таким образом, нет оснований говорить о шкале наименований (номинативной шкале или шкале строгой классификации) как простей-
шей шкале, начальном уровне измерения в психологии.
Существуют более "примитивные" (с эмпирической, но не с математической точки зрения) виды шкал: шкалы, основанные на отношениях толерантности; шкалы "размытой" классификации и т.п.
О шкале наименований можно говорить в том случае, когда эмпирические объекты просто "метятся" числом. Примером являются номера на майках футболистов: цифру "1" по традиции получает вратарь, и это указывает на то, что по своей функции он отличен от всех остальных игроков; но его функция на футбольном поле эквивалентна функции других вратарей, если не учитывать качество игры.
В принципе вместо чисел при использовании шкалы наименований необходимо применять другие символы, ибо числовая шкала (натуральный ряд чисел) характеризуется разными системами операций.
Итак, если объекты в каком-то отношении эквивалентны, то мы имеем право отнести их к одному классу. Главное, как говорил Стивенс, не приписывать один и тот же символ разным классам или разные символы одному и тому же классу.
Для этой шкалы допустимо любое взаимно однозначное преобразование.
Несмотря на тенденцию "завышать" мощность шкалы, психологи очень часто применяют шкалу наименований в исследованиях. "Объективные" измерительные процедуры при диагностики личности приводят к типологизации: отнесению конкретной личности к тому или иному типу. Примером такой типологии является классификация темперамента: холерик, сангвиник, меланхолик и флегматик.
В "субъективной" психологии измерения используются также как классификации. Примеры: сортировка объектов по Гарднеру, метод константных стимулов в психофизике и т.д.
Исследователь, пользующийся шкалой наименований, может применять следующие инвариантные статистики: относительные частоты, моду, корреляции случайных событий, критерий x2.
5.3. Шкалы порядка или ординарные шкалы.
Порядковая шкала образуется, если на множестве реализовано одно бинарное отношение - порядок (отношения "не больше" и " меньше"). Построение шкалы порядка - процедура более сложная, чем создание шкалы наименований.
На шкале порядка объект может находится "между" двумя другими, причем если а "больше" b, b "больше" с, то а "больше" с (правило транзитивности отношений).
Классы эквивалентности, выделенные при помощи шкалы наименований, могут быть упорядочены по некоторому основанию. Различают шкалу строгого порядка (строгая упорядоченность) и шкалу слабого порядка (слабая упорядоченность). В первом случае на элементах множества реализуются отношения "не больше" и "меньше", а во втором - "не больше или равно" и "меньше или равно".
Шкала порядка сохраняет свои свойства при изотонических преобразованиях. Все функции, которые не имеют максимума (монотонные), отвечают этой группе преобразований.
Значения величин можно заменять квадратами, логарифмами, нормализовать и т.д. При таких преобразованиях значений величин, определенных по шкале порядка, место объектов на шкале не изменяется, т.е. не происходит инверсий.
Еще Стивенс высказал точку зрения, что результаты большинства психологических измерений в лучшем случае соответствуют лишь шкалам порядка.
Шкалы порядка широко распространяются в психологии познавательных процессов, экспериментальной психосемантике, социальной психологии: ранжирование, оценивание, в том числе педагогическое, дают порядковые шкалы. Классическим примером использования порядковых шкал является тестирование личностных черт, а также способностей. Большинство же специалистов в области тестирования интеллекта полагают, что процедура измерения этого свойства позволяет использовать интервальную шкалу и даже шкалу отношений.
Как бы то ни было, эта шкала позволяет ввести линейную упорядоченность объектов на некоторой оси признака. Тем самым вводится важнейшее понятие - измеряемое свойство, или линейное свойство, тогда как шкала наименований использует "вырожденный" вариант интерпретации понятия "свойство": "точечное" свойство (свойство есть - свойства нет).
Переходным вариантом шкалы можно считать дихотомическую классификацию, проводимую по принципу "есть свойство - нет свойства" (1;0) при 1>0. Дихотомическое разбиение множества позволяет применять не только порядок, но и метрику. Для интерпретации данных, полученных посредством порядковой шкалы, можно использовать более широкий спектр статистических мер (в дополнение к тем, которые допустимы для шкалы наименований).
В качестве характеристики центральной тенденции можно использовать медиану, а в качестве характеристики разброса - процентили. Для установления связи двух измерений допустима порядковая корреляция (t-Кенделла и p-Спирмена).
Числовые значения порядковой шкалы нельзя складывать, вычитать, делить и умножать.
5.4. Шкалы интервалов.
Шкала интервалов является первой метрической шкалой. Собственно, начиная с нее, имеет смысл говорить об измерениях в узком смысле этого слова - о введении меры на множестве объектов. Шкала интервалов определяет величину различий между объектами в проявлении свойства. С помощью шкалы интервалов можно сравнивать два объекта. При этом выясняют, на сколько более или менее выражено определенное свойство у одного объекта, чем у другого.
Шкала интервалов очень часто используется исследователями. Классическим примером применения этой шкалы в физике является измерение температуры по Цельсию. Шкала интервалов имеет масштабную единицу, но положение ноля на ней произвольно, поэтому нет смысла говорить, во сколько раз больше или меньше утренняя температура воздуха, измеренная шкалой Цельсия, чем дневная.
Значения интервальной шкалы инвариантны относительно группы аффинных преобразований прямой. То есть мы имеем право изменять масштаб шкалы, умножая каждое значение на константу, и производить ее сдвиг относительно произвольно выбранной точки на любое расстояние вправо или влево (прибавлять и отнимать константу).
Интервальная шкала позволяет применять практически всю параметрическую статистику для анализа данных, полученных с ее помощью. Помимо медианы и моды для характеристики центральной тенденции используется среднее арифметическое, а для оценки разброса
- дисперсия. Можно вычислять коэффициенты асимметрии и эксцесса и другие параметры распределения. Для оценки величины статистической связи между переменными применяется коэффициент линейной корреляции Пирсона и т.д.
Большинство специалистов по теории психологических измерений полагают, что тесты измеряют психические свойства с помощью шкал интервалов. Прежде всего это касается тестов интеллекта и достижений. Численные значения одного теста можно переводить в численные значения другого теста с помощью линейного преобразования: xi = ax + b.
Ряд авторов полагают, что относить тесты интеллекта к шкалам интервалов нет оснований. Во-первых, каждый тест имеет "нуль" - любой индивид может получить минимальный балл, если не решит ни одной задачи в отведенное время. Во-вторых, тест имеет максимум шкалы - балл, который испытуемый может получить, решив все задачи за минимальное время. В-третьих, разница между отдельными значениями шкалы не одинакова. По крайней мере, нет никаких теоретических и эмпирических оснований утверждать, что 100 и 120 баллов по шкале IQ отличаются на столько же, на сколько 80 и 100 баллов.
Скорее всего, шкала любого теста интеллекта является комбинированной шкалой, с естественным минимумом и\или максимумом, но порядковой. Однако эти соображения не мешают тестологам рассматривать шкалу IQ как интервальную, преобразуя "сырые" значения в шкальные с помощью известной процедуры "нормализации" шкалы.
5.5. Шкалы отношений.
Шкала отношений - наиболее часто используемая в физике. По крайней мере, идеалом измерительной процедуры является получение таких данных о выраженности свойств объекта, когда можно сказать, во сколько раз один объект больше или меньше другого.
Это возможно лишь тогда, когда помимо определения равенства, рангового порядка, равенства интервалов известно равенство отношений. Шкала отношений отличается от шкалы интервалов тем, что на ней определено положение "естественного" нуля. Классический пример - шкала температур Кельвина.
В психологии шкалы отношений практически не применяются. Одним из исключений являются шкалы оценки компетентности, основанные на модели Раша. Действительно, вполне можно представить уровень "нулевой" осведомленности испытуемого в какой-то области знаний или же "нулевой" уровень владения каким-либо навыком. Авторы стохастической теории теста доказывают, что, ведя единую шкалу "трудности задачи - способности испытуемого", модно измерить во сколько раз одна задача труднее другой или же один испытуемый компетентнее другого.
Значения шкалы отношений инвариантны относительно преобразования вида: xi=ax. Значения шкалы можно умножать на константу. К ним применимы статистические меры.
Измерения массы, времени реакции и выполнения тестового задания - области применения шкалы отношений.
Отличием этой шкалы от абсолютной является отсутствие "естественной" масштабной единицы.
5.6. Другие шкалы.
а. Дихотомическая классификация часто рассматривается как вариант шкалы наименований. Это верно, за исключением одного случая, когда мы измеряем свойство, имеющее всего лишь два уровня выраженности: "есть - нет", так называемое "точечное" свойство. Примеров таких свойств много: наличие или отсутствие у испытуемого какой-либо наследственной болезни (дальтонизм, болезнь Дауна, гемофилия и др.), абсолютного слуха и др. В этом случае исследователь имеет право проводить "оцифровку" данных, присваивая каждому из типов цифру "1" или "0", и работать с ними, как со значениями шкалы интервалов.
В ряде пособий неверно утверждается, что шкала наименований различает предметы по проявлению свойства, но не различает их по уровню проявления свойства. Шкала наименований вообще не основана на понятии "свойство", которое вводится, лишь начиная со шкалы порядка, а базируется на представлении о "типе" - множестве эквивалентных объектов. Для того чтобы ввести понятие "свойство", требуется ввести отношения не между объектами, а между классами (типами) эквивалентных объектов (которые, конечно, могут содержать всего лишь один объект).
б. Шкала разностей, в отличие от шкалы отношений, не имеет естественного нуля, но имеет естественную масштабную единицу измерений. Ей соответствует аддитивная группа действительных чисел. Классическим примером этой шкалы является историческая хронология. Она сходна со шкалой интервалов. Разница лишь в том, что значения этой шкалы нельзя умножать (делить) на константу. Поэтому считается, что шкала разностей - единственная с точностью до сдвига. Некоторые исследователи полагают, что Иисус Христос родился за четыре года до общепринятого начала нашего христианского летоисчисления. Можно использовать мусульманское летоисчисление или же от сотворения мира. Кому как нравится.
В психологии шкала разностей используется в методиках парных сравнений.
в. Абсолютная шкала является развитием шкалы отношений и отличается от нее тем, что обладает естественной единицей измерения. В этом ее сходство со шкалой разностей. Число решенных задач ("сырой" балл), если задачи эквивалентны, - одно из проявлений абсолютной шкалы.
В психологии абсолютные шкалы не используются. Данные, полученные с помощью абсолютной шкалы, не преобразуются, шкала тождественна сама себе. Любые статистические меры допустимы.
г. В литературе, посвященной проблемам психологических измерений, упоминаются и другие типы шкал: ординальная (порядковая) с естественным началом, лог-интервальная, упорядоченная метрическая и др. О свойствах порядковых шкал с естественным началом упоминалось в данном разделе.
Все написанное выше относится к одномерным шкалам. Шкалы могут быть и многомерными: шкалируемый признак в этом случае имеет нулевые проекции на два (или более) соответствующих параметра. Векторные свойства, в отличие от скалярных, являются многомерными.
5.7. Шкальные преобразования.
Возможны два варианта шкальных преобразований:
1) повышение мощности шкалы;
2) понижение мощности шкалы.
Вторая из процедур является тривиальной. Поскольку все возможные процедуры преобразований, которые приемлемы для более мощной шкалы (например, шкалы интервалов), допустимы и для менее мощной шкалы (например шкалы порядка), то у нас есть право рассматривать данные, полученные с помощью интервальной шкалы, как порядковые или, допустим, порядковую шкалу - в качестве номинальной.
Другое дело, если (по каким-либо соображениям) у нас возникает потребность перейти от шкалы наименований к шкале порядка и т.д. Для этого требуется вводить необъективные (с позиции математической теории измерений) допущения и эмпирические приемы, базирующиеся лишь на интуиции и правдоподобных рассуждениях. Но в большинстве случаев производится эмпирическая проверка: в какой мере данные, полученные с помощью более "слабой" шкалы, удовлетворяют требованиям более "мощной" шкалы.
Рассмотрим переход от шкалы наименований к порядковой шкале. Естественно, для этого нужно упорядочить классы по некоторому основанию. Предположим, что принадлежность объекта к некоторому классу есть случайная функция. Тогда переход от номинативной шкалы к шкале порядка возможен в том случае, если существует упорядоченность классов. Во-первых, для каждого элемента существует модальный класс, вероятность принадлежности к которому значимо больше, чем к другим классам. Во-вторых, для каждого элемента существует только одна функция вероятностной принадлежности к множеству классов, такая, что эти классы можно упорядочить единственным образом. Проще говоря, каждый класс должен иметь только двух соседей: "слева" и "справа", а порядок соседства определяется эмпирической частотой попадания элементов в различные классы. В "свой" класс элемент попадает чаще, в соседние со "своим" - реже и в отдаленные - еще реже. При обработке данных осуществляется эмпирическая проверка каждой тройки классов на стохастическую транзитивность. Преобразование шкалы порядка в шкалу интервалов - более частный вариант. Он подробно описан в литературе, посвященной теории психологических измерений, в частности в теории тестов.