<< Пред.           стр. 6 (из 7)           След. >>

Список литературы по разделу

  ?
 
  Таблица 8.8
  Ранги четырех школьниц по привлекательности (X) и популярности(Y)
 
 Случай
  Переменная X (ранг по привлекательности) Переменная F (ранг по популярности) Ольга 1 1 Светлана 2 3 Марьяна 3 2 Наташа 4 4
  Для простейшего случая таблицы сопряженности 2 x 2 существует более простая в вычислительном отношении формула:
 
  ?
 где a, b, с, d - частоты в клетках таблицы (см. табл. 8.4)200.
  Отметим здесь, что направление связи далеко не всегда очевидно, т. е. не всегда можно уверенно утверждать, какая из переменных является зависимой. Если исследователь решит, что независимой является переменная, расположенная по горизонтали (а не по вертикали, как в нашем примере), он сможет подсчитать другую величину "тау-коэффициента", на этот раз идя "от строк" и выполнив все операции в обратном порядке. (Для четырехклеточных таблиц величины "тау" по строкам и по столбцам будут равны.)
  Примером ПУО-коэффициента, специально предназначенного для измерения связи двух ординальных (т. е. измеренных на порядковом уровне) переменных, может служить коэффициент "гамма". "Гамма" измеряет относительное уменьшение ошибки предсказания ранга конкретного наблюдения по зависимой переменной. Для того чтобы вручную рассчитать значение "гаммы" для небольшой выборки, нужно упорядочить наблюдения по независимой и зависимой переменным, как это показано в таблице 8.8 для данных о внешней привлекательности (экспертные оценки) и популярности школьниц (данные опроса одноклассников).
  Далее нужно сравнивать случаи (т. е. школьниц) попарно, определяя, сходится или расходится порядок расположения двух этих случаев по двум переменным. Если упорядочения сходятся, пара называется согласованной, если они не сходятся, то пару нужно считать несогласованной. Результаты анализа для данных таблицы 8.8 представлены в таблице 8.9.
  Предполагается, что если согласованных (т. е. правильно предсказывающих порядок по зависимой переменной) пар больше, чем несогласованных, связь между переменными велика. Если несогласованных пар больше, то связь отрицательна (чем выше ранг по одной переменной, тем ниже ранг по другой). Если же различие между числом согласованных и несогласованных пар невелико, то связь между переменными просто отсутствует. Поэтому формула для "гаммы" такова:
 
 
 где Ns - число согласованных пар,
 Nr - число несогласованных пар.
  Таблица 8.9
  Попарные сравнения рангов по переменным X и Y
 
 Пара
  Порядок по
 X*
  Порядок по Y*
  Знак пары
 ("+" - согласованная,
 "?" - несогласованная) Ольга - Светлана O > C O > C + Ольга - Марьяна O > M O > M + Ольга - Наташа О > Н О > Н + Светлана - Марьяна С ? М М > С ? Светлана - Наташа С ? Н С > Н + Марьяна - Наташа М > Н М > Н +
  * Примечание. Здесь использованы лишь начальные буквы имен, т. е. "О > С" означает, что ранг Оли выше ранга Светы.
 
  Для данных, используемых в нашем примере:
 
  О том, как измерить связь (корреляцию) количественных переменных, мы поговорим немного позже, сделав одно важное отступление.
 
  Метод уточнения в анализе связи между переменными
  Обнаружив наличие взаимосвязи между двумя переменными и оценив интенсивность этой связи с помощью какого-либо коэффициента, исследователь стремится проинтерпретировать эту взаимосвязь в терминах причин и следствий. Иными словами, конечной целью измерения взаимосвязи между переменными является подтверждение (или опровержение) каких-то содержательных предположений, касающихся причинного механизма, порождающего найденную взаимосвязь. Однако, как уже говорилось, само по себе наличие связи между двумя переменными еще не доказывает, что эта связь может быть описана моделью "причина - следствие". (А нулевой коэффициент сопряженности - еще не свидетельство отсутствия всякой причинной зависимости.)
  Необходимо, во-первых, найти подтверждения того, что связь не является обратной. Если, например, мы обнаружили высокую корреляцию между полученным образованием и престижностью профессии или между алкоголизмом у родителей и алкоголизмом у детей, то таким подтверждением служит естественная упорядоченность событий: обучение обычно предшествует работе, а проблемы родителей - проблемам детей. Во-вторых, нужно исключить альтернативные объяснения обнаруженной взаимосвязи. Во многих случаях существуют вполне правдоподобные гипотезы, объясняющие найденную зависимость воздействием третьей переменной (или нескольких переменных). Возможно, например, что на избирательную активность влияет не столько пол избирателя, сколько его доход. Так как оплата труда женщин в среднем ниже, чем мужчин, женщины реже проявляют политическую активность. Соответственно сравнение женщин, имеющих высокооплачиваемую работу, и мужчин в этом случае не выявит никаких различий в отношении к выборам.
 
 
 
 
 
 
 
 
 
  Рис. 19. Модель "ложной взаимосвязи"
 
  Возьмем другой пример. В исследовании было показано, что существует сильная взаимосвязь между престижностью учебного заведения, где было получено высшее образование, и престижностью работы. Значит ли это, что при найме на работу потенциальные работодатели принимают во внимание рейтинг вуза, в котором проходил обучение соискатель? Вполне возможно. Но даже основываясь исключительно на здравом смысле, легко найти и другие объяснения обнаруженному факту. Может быть, шансы окончить престижное учебное заведение во многом зависят от социально-экономического статуса родителей? Не исключено также, что при устройстве на работу "папины связи" играют столь же существенную роль. В этом случае исходная простая модель "престижное образование ? престижная работа" требует уточнения и дополнения: и качество образования, и успешность карьеры зависят от социально-экономического статуса родителей. Заметьте, что такое уточнение вовсе не отменяет исходного факта - эмпирической взаимосвязи между образованием и карьерой, - оно лишь вводит более сложную модель причинной связи, показывая механизм воздействия третьей переменной (статуса родителей).
  Классический подход к анализу взаимосвязи с введением дополнительных, контрольных переменных в социологии и сопредельных дисциплинах получил название метода уточнения. Метод уточнения был детально разработан в 1940-1950-е гг. П. Лазарсфельдом, С. Стауффером, П. Кендалл и их сотрудниками для анализа элементарных таблиц сопряженности и взаимосвязей номинальных признаков201. Однако общая логика этого подхода используется, как мы увидим позднее, и в более сложных техниках статистического анализа, и при изучении количественных данных.
  Для того чтобы произвести уточнение причинной модели, нужно сделать какие-то содержательные предположения о том, является ли контрольная (третья) переменная предшествующей либо опосредующей. Если контрольная переменная предшествует во времени и независимой и зависимой переменным, то она воздействует на них как общая причина, порождая эмпирическую взаимосвязь между переменными. Эта взаимосвязь, однако, не является причинной связью, так как объясняется влиянием третьей, контрольной переменной. Причинная модель для этого случая, часто обозначаемого как "ложная взаимосвязь", приведена на рисунке 19.
  Таблица 8.10
  Зависимость общего самочувствия от лечения при контроле хронической заболеваемости (N = 1000 чел.), %
 
 Самооценка
 общего самочувствия
  Больные Здоровые регулярно посещают врача редко посещают врача регулярно посещают врача редко посещают врача хорошее
 плохое 20% 18% 88% 87% 80% 82% 12% 13%
  Предположим, что нам удалось установить, что 79% людей, регулярно посещающих врача, оценивают свое самочувствие как "плохое", тогда как среди людей, посещающих врача реже одного раза в год, доля оценивших таким образом свое самочувствие составила 15%. Если принять установленную взаимосвязь за собственно причинную, мы придем к несколько необычному выводу: чем чаще человек посещает докторов, тем хуже он себя чувствует. Предположим, однако, что мы имеем возможность проверить альтернативную гипотезу: люди, страдающие хроническими болезнями, и чаще обращаются за медицинской помощью, и больше подвержены плохому самочувствию. Для того чтобы узнать, сохранится ли исходная взаимосвязь "регулярные посещения врача ? плохое самочувствие" при введении контрольной переменной, нам нужно построить так называемые условные (иногда - частные) таблицы сопряженности, где разные группы сравнивались бы при одном (постоянном) уровне объясняющего фактора. Иными словами, нужно построить одну условную таблицу "посещение х самочувствие" для людей, страдающих хроническими болезнями, и другую таблицу - для здоровых. В каждой из этих таблиц объясняющая переменная будет поддерживаться на постоянном уровне. Пусть, например, мы получим две частные таблицы, объединенные в таблицу 8.10.
  Анализ этих двух частных таблиц показывает, что частота посещений врача не оказывает сколько-нибудь заметного влияния на общую оценку самочувствия. Иными словами, метод уточнения в данном примере позволил продемонстрировать, что исходно установленная эмпирическая сопряженность признаков является ложной и может получить объяснение при введении контрольной переменной.
  В том случае, когда контрольная переменная опосредует исходное взаимоотношение202 двух переменных, метод уточнения позволяет выявить собственно механизм влияния независимой переменной на зависимую (см. рис. 20).
 
 
 
 
  Рис. 20. Модель с опосредующей переменной
 
  В таких случаях говорят о том, что контрольная переменная интерпретирует исходную взаимосвязь. Например, исследователь, установивший влияние образовательного уровня родителей на успехи детей в учебе, должен показать, каков механизм такого влияния. В частности, он может предположить, что образованные родители внимательнее следят за интеллектуальным развитием своих детей, активнее стимулируют любые успехи в этой сфере. Если же сравнить учебные успехи тех детей, родители которых занимают "активно-стимулирующую" позицию, то различия в успеваемости между детьми более образованных и менее образованных родителей будут несущественными. Заметим, однако, что здесь исходное отношение не исчезает (как в случае ложной взаимосвязи), а лишь проясняется, получает дополнительную интерпретацию в терминах опосредующей переменной. Для "стимулируемых" детей учебные успехи не зависят от уровня образования родителей. То же отношение верно и для "нестимулируемых" детей.
  Иногда в результате уточнения исходной модели в одной из частных таблиц сохраняется высокий уровень взаимосвязи двух переменных, а в другой таблице взаимосвязь уменьшается или исчезает, т. е. коэффициент сопряженности приближается к нулю. В этом случае говорят о спецификации исходной модели: введение третьей переменной позволяет определить специфические условия, при которых наблюдается установленное ранее отношение двух переменных. Например, исследователь может обнаружить, что в центральноафриканских деревенских общинах частота коллективных жертвоприношений местным духам зависит от среднемесячного количества осадков. Очевидное объяснение заключается в том, что люди тем чаще обращаются за помощью к сверхъестественным силам, чем больше они нуждаются в дожде. Можно также предположить, что исходная взаимосвязь "засуха - коллективные жертвоприношения" будет менее значительной для тех традиционных сообществ, которые располагают устойчивыми ресурсами пресной воды (например, водой из близлежащей реки или озера) и, следовательно, не испытывают столь сильной зависимости от атмосферных осадков. В этом случае частная таблица сопряженности для деревенских общин, живущих вдали от постоянных источников пресной воды, покажет исходный или более высокий уровень взаимосвязи между засухами и жертвоприношениями, тогда как во второй частной таблице, построенной для речных или приозерных деревень, эта взаимосвязь окажется нулевой.
  Анализ таблиц сопряженности и метод уточнения - это наглядные и достаточно эффективные средства, используемые в проверке гипотез о взаимозависимости переменных. Однако этим подходам присущи определенные ограничения. Самые существенные из таких ограничений связаны, во-первых, с тем, что проводя перегруппировку количественных переменных в номинальные или ординальные (т. е. разбивая доход на "высокий" и "низкий", а интеллект - на "средний" и "выше среднего"), мы теряем существенную информацию о вариации признака внутри качественных градаций, внутри клеточек таблицы сопряженности, хотя эта информация содержится в "сырых" данных. Кроме того, для уточнения исходной причинной модели нам может потребоваться не одна, а две или четыре дополнительные переменные. Однако с введением новых контрольных переменных число частных таблиц сопряженности будет возрастать по степенному закону. Даже если все наши переменные будут иметь лишь две градации, общее количество клеток в частных таблицах сопряженности будет возрастать как степень двух, т. е., скажем, при четырех контрольных дихотомических переменных нам придется иметь дело с 64-клеточной общей таблицей сопряженности. Соответственно число наблюдений, "случаев", приходящихся на каждую клетку таблицы, будет уменьшаться, а получаемые нами результаты окажутся более подверженными влиянию случайной ошибки выборки.
  По этим причинам многие исследователи используют несколько более сложные статистические методы анализа, свободные от описанных ограничений.
 
  Корреляция, частная корреляция, регрессия
  При анализе связи между переменными, измеренными на интервальном уровне, часто используют графическое представление такой связи, называемое диаграммой рассеивания. На диаграмме рассеивания каждое наблюдение, т. е. каждый "случай", изображается точкой в двухмерной системе координат. Значение независимой переменной для данного наблюдения определяет положение соответствующей точки относительно оси X, а значение зависимой переменной задает вторую координату точки - по оси Y. Иными словами, перпендикуляр, опущенный из точки-"случая" на ось X, соответствует измеренному уровню независимой переменной, тогда как перпендикуляр, опущенный на ось Y, будет точно соответствовать наблюдавшемуся уровню зависимой переменной.
  Пусть, например, мы располагаем данными о бюджетах 10 партий и о числе полученных этими партиями мест в парламенте. Исходя из гипотезы о влиянии размера партийного бюджета (X) на полученное в результате выборов число депутатских мандатов (Y), мы можем построить диаграмму рассеивания, подобную изображенной на рисунке 21.
 
 
 
  Рис. 21. Диаграмма рассеивания, отражающая связь величины партийного бюджета в млн. руб. (X) с количеством
  мест в парламенте (Y) для 10 политических партий
 
  Каждая точка на рисунке соответствует одной из десяти партий. Невзирая на некоторые "аномальные" случаи, подобные обведенным кружками, диаграмма довольно ясно показывает, что всякое приращение в размерах партийной кассы (сдвиг вправо по оси Х) влечет за собой увеличение парламентского представительства (сдвиг вверх по оси ординат). Между переменными X и Y существует линейное отношение: если одна переменная возрастает по величине, то это же происходит и с другой. Помимо указания на природу отношения двух переменных, диаграмма на рисунке 21 позволяет также сделать некоторые предположения об интенсивности, силе этого отношения. Очевидно, что чем более компактно, "скученно" располагаются точки-наблюдения вокруг пунктирной прямой линии (описывающей идеальное линейное отношение X и Y), тем сильнее зависимость. На рисунке 22 приведены еще три диаграммы рассеивания.
 
 
 
  Рис. 22. Диаграммы рассеивания для гипотетических данных
 
  Очевидно, что на рисунке 22а какая-либо связь между X и Y попросту отсутствует. На рисунке 226 воображаемая прямая линия (отмечена пунктиром) пересекла бы диаграмму сверху вниз, из левого верхнего в правый нижний угол. Иными словами, линейная связь в этом случае имеет обратное направление: чем больше X, тем меньше зависимая переменная Y. Заметим также, что "кучность" расположения точек вдоль воображаемой прямой на рисунке 226 не очень велика, а значит и связь (корреляция) между переменными не только обратная, отрицательная, но еще и не очень сильная, умеренная. Наконец, на рисунке 22в зависимую и независимую переменную связывает явно нелинейное отношение: воображаемый график нисколько не похож на прямую линию и напоминает скорее параболу203. Отметим, что методы анализа, о которых сейчас пойдет речь, не годятся для этого нелинейного случая, так как обычная формула для подсчета коэффициента корреляции даст нулевое значение, хотя связь между переменными существует.
  Существует обобщенный показатель, позволяющий оценить, насколько связь между переменными приближается к линейному функциональному отношению, которое на диаграмме рассеивания выглядит как прямая линия. Это коэффициент корреляции, измеряющий тесноту связи между переменными, т. е. их тенденцию изменяться совместно. Как и в рассмотренных выше мерах связи качественных признаков, коэффициент корреляции позволяет оценить возможность предсказания значений зависимой переменной по значениям независимой. Общая формула для вычисления коэффициента корреляции Пирсона включает в себя величину ковариации значений X и Y. Эта величина (Sxy) характеризует совместное изменение значений двух переменных. Она задается как сумма произведений отклонений наблюдаемых значений X и Y от средних соответственно, т. е. деленная на количество наблюдений. Чтобы понять "физический смысл" ковариации, достаточно обратить внимание на следующее свойство: если для какого-то объекта i в выборке оба значения ??i и ?i ? окажутся высокими, то и произведение на будет большим и положительным. Если оба значения (по Х и по Y ) низки, то произведение двух отклонений, т.е. двух отрицательных чисел, также будет положительным. Таким образом, если линейная связь Х и Y положительная и велика, сумма таких произведений для всех наблюдений также будет положительна. Если связь межу Х и Y обратная, то многим положительным отклонениям по Х будет соответствовать отрицательные отклонения по Y, т.е. сумма отрицательных произведений отклонений будет отрицательной.
  Наконец, при отсутствии систематической связи произведения будут иногда положительными, иногда отрицательными, а их сумма (и, следовательно, ковариация Х и Y) будет, в пределе, равная нулю. Таким образом, ковариация показывает величину и направление связи, совместного изменения Х и Y. Если разделить ковариацию Sxy на стандартные отклонения Sx и Sy (чтобы избавиться от влияния масштаба шкал, в которых измеряются Х и Y ), то мы получим искомую форму коэффициента корреляции Пирсона (rxy):
 
 
  Более удобная для практических вычислений расчетная формула выглядит так:
 
 
 
  Несмотря на несколько устрашающий вид, расчетная формула очень проста. Для "ручного" вычисления rху вам понадобятся лишь пять величин: суммы значений по Х и Y суммы квадратов значений по X и Y суммы произведений Х и Y по всем объектам-"случаям" . В таблице 8. 11 приведены данные о максимальных дневных и ночных температурах, зарегистрированных в 10 городах204.
  Просуммировав значения в столбцах, мы получим и Возведя каждое из значений X и Y в квадрат и просуммировав, мы найдем, что и Сумма попарных произведений Xi и Yi. составит 4359. Вы можете самостоятельно убедиться в том, что подстановка всех значений в расчетную формулу даст (надеюсь) величину rxy = 0,91. Иными словами, корреляция между дневными и ночными температурами воздуха очень высока, но все же отлична от 1,0 (коэффициент корреляции может меняться в пределах от ?1,0 до +1,0). Это отличие, вероятно, объясняется влиянием других факторов (продолжительность дня и ночи, облачность, географическое положение и т. п.). Судя по полученной величине корреляции, знание дневных температур позволяет предсказывать ночные температуры с очень высокой точностью, но не безошибочно.
  Величина, которая равна квадрату коэффициента корреляции Пирсона, т. е. r2, имеет ряд интересных статистических свойств. Отметим сейчас, что r2 является ПУО-мерой связи, подобной обсуждавшимся выше. Можно показать, что она характеризует ту долю дисперсии значений Y, которая объясняется наличием корреляции между Х и Y. (Естественно, величина r2 будет всегда положительной и не может превзойти по абсолютной величине коэффициент корреляции)205. Та часть разброса в значениях Y, которая не может быть предсказана по значениям X,- это дисперсия ошибки нашего прогноза, т. е. 1 ? r2. Необъясненный разброс в значениях Y присутствует в том случае, когда при равных уровнях X (ср., например, дневные температуры в Варшаве и Бонне из таблицы 8.11) сохраняются различия в значениях Y.
  Таблица 8.11
  Максимальные дневные и ночные температуры воздуха в некоторых городах
 
 
 Город
  Дневная температура воздуха (X) Ночная температура воздуха (Y) Лондон 16 11 Париж 21 12 Стокгольм 20 12 Варшава 25 14 Бонн 25 16 Рим 36 23 Тель-Авив 31 23 Анкара 32 15 Каир 36 22 Москва 16 8 N=10
  Коэффициент корреляции позволяет оценить степень связи между переменными. Однако этого недостаточно для того, чтобы непосредственно преобразовывать информацию, относящуюся к одной переменной, в оценки другой переменной. Допустим, мы выяснили, что коэффициент корреляции между переменными "величина партийного бюджета" и "число мест в парламенте" равен 0,8. Можем ли мы теперь предсказать, сколько мест в парламенте получит партия, годовой бюджет которой равен 100 млн. рублей? Похоже, что знание величины коэффициента корреляции нам здесь не поможет. Однако мы можем вспомнить, что коэффициент корреляции - это еще и оценка соответствия разброса наших наблюдений той идеальной модели линейного функционального отношения, которое на рассмотренных выше диаграммах рассеивания (см. рис. 21-22) представлено пунктирными прямыми. Эти линии называют линиями регрессии.
  Если бы все наблюдения аккуратно "укладывались" на линию регрессии, то для предсказания значения зависимой переменной достаточно было бы восстановить перпендикуляр к оси Y из той точки прямой, которая соответствует известному значению X.
  На рисунке 23 показано, как можно было бы графически определить ожидаемые значения Y для гипотетического примера с партийной кассой и местами в парламенте. (Разумеется, найти искомое значение Y можно и без линейки, с помощью вычислений, если известен угол наклона регрессионной прямой и точка пересечения с осью ординат).
 
  Рис. 23. Предсказание значения Y по значению Х для гипотетических данных
 
  Как говорилось выше, линия регрессии не обязательно должна быть прямой, но мы ограничимся рассмотрением самого простого случая линейной зависимости (нелинейные связи во многих случаях также могут быть приближенно описаны линейными отношениями).
  Существуют специальные статистические процедуры, которые позволяют найти регрессионную прямую, максимально соответствующую реальным данным. Регрессионный анализ, таким образом, дает возможность предсказывать значения Y по значениям X с минимальным количеством ошибок. В общем виде уравнение, описывающее прямую линию регрессии Y по X, выглядит так:
 
 где - то предсказываемое значение по переменной Y (в только что рассмотренном примере - количество мест в парламенте), а - это точка, в которой прямая пересекает ось Y (т. е. значение Y для случая, когда Х = 0), и b - коэффициент регрессии, т. е. наклон прямой. Часто удобно измерять обе переменные не в "сырых" шкалах, а в единицах отклонения от среднего. Процедура стандартизации, т. е. перевода исходной шкалы в стандартные Z-оценки, вам уже известна. Преимущество использования стандартизированных переменных в регрессионном анализе заключается в том, что линия регрессии в этом случае проходит через начало координат. Стандартизованный коэффициент регрессии (наклон прямой) обозначают обычно греческой буквой ? (либо лат. b*). Правда, в отличие от b-коэффициента, ? не позволяет прямо заключить, на какое количество исходных единиц возрастет Y при увеличении X на одну единицу (например, насколько увеличится число депутатских мандатов при увеличении бюджета на 1 млн. рублей или насколько увеличивается заработная плата при увеличении стажа работы на один год). С другой стороны, ? позволяет сопоставить влияние на независимую переменную контрольных переменных, измеренных в разных шкалах.
  Социологи обычно осуществляют регрессионный анализ, используя возможности распространенных прикладных пакетов компьютерных программ (например, SPSS). В этом случае для нахождения линии регрессии, лучше всего соответствующей данной выборке наблюдений, которая представлена точками на диаграмме рассеивания, используют метод минимизации взвешенной суммы квадратов расстояний между этими точками и искомой прямой206.
  Хотя здесь не место для обсуждения статистических деталей, мы все же сделаем несколько замечаний, относящихся к осмысленному (или бессмысленному) использованию техники линейной регрессии.
  Во-первых, как и в ранее обсуждавшихся примерах анализа связи, наличие координации, согласованности в изменениях двух переменных еще не доказывает, что обнаруженное отношение носит собственно каузальный характер. Проверка альтернативных причинных моделей, иначе объясняющих эмпирическую сопряженность переменных-признаков, может основываться только на содержательных теоретических представлениях.
  Далее, нужно помнить о том, что регрессионные коэффициенты в общем случае асимметричны. Если мы решим, что это Y, а не X является независимой переменной, то вполне можем рассчитать другую по величине пару коэффициентов - аху и bху. (Заметьте, что порядок букв в подстрочном индексе значим: первой всегда идет предсказываемая переменная, а второй - предсказывающая.) Разумеется, при выборе кандидатов в зависимые и независимые переменные также важны не статистические, а содержательные соображения.
  Если вернуться к затронутой выше взаимосвязи между линейной регрессией и корреляцией, то здесь мы можем сделать следующие дополнения. Пусть все точки-наблюдения аккуратно размещены на регрессионной прямой. Перед нами почти невероятный случай абсолютной линейной зависимости. Зная, например, что коэффициент b (нестандартизованный) равен 313, мы можем утверждать, что именно такова величина воздействия переменной X на зависимую переменную Y. Кроме того, мы можем точно сказать, что единичная прибавка в величине X вызовет увеличение Y на ту же величину, 313 (если, допустим, X - стаж работы, а Y - зарплата, то с увеличением стажа на год зарплата растет на 313 рублей). В этом случае коэффициент корреляции будет равен в точности 1,0, что свидетельствует о сильном, "абсолютном", характере связи переменных. Различие между предсказанными и наблюдаемыми значениями в этом случае отсутствует. Корреляция как мера точности прогноза показывает, что ошибок предсказания просто нет.
  В действительности, однако, из-за влияния других переменных и случайной выборочной ошибки точки-наблюдения обычно лежат выше или ниже прямой, которая, как говорилось, является лишь наилучшим приближением реальных данных. Коэффициент корреляции Пирсона r и величина r2 по-прежнему служат оценкой точности прогноза, основанного на линии регрессии. Вполне возможны ситуации, когда коэффициент регрессии очень велик, воздействие X на Y просто громадно, но корреляция низка и, следовательно, точность прогноза невелика. Нет ничего необычного и в обратной ситуации: воздействие X на Y относительно мало, а коэффициент корреляции и объясненная дисперсия очень велики. Посмотрев на приведенные выше диаграммы рассеивания, можно легко уяснить себе смысл отношения между корреляцией и регрессией: первая имеет прямое отношение к "разбросанности" точек наблюдения (чем выше "разбросанность", тем ниже r2 и ненадежнее прогноз), тогда как коэффициент регрессии описывает наклон, "крутизну" линии. Однако существующее здесь различие не стоит и преувеличивать: регрессионный коэффициент (наклон прямой) для стандартизованных данных в точности равен коэффициенту корреляции Пирсона r207.
  Предположим, что исследователь изучает зависимость между образованием матери (X) и образованием детей (Y). Обе переменные измерены как количество лет, затраченных на получение образования. Найдя достаточно высокую корреляцию между Xи Y - скажем, равную 0,71, - он также находит коэффициенты регрессии а и b и устанавливает, что r2 (называемый также коэффициентом детерминации) в данном случае приближенно равен 0,5. Это значит, что доля вариации в значениях переменной Y (образование детей), объясненная воздействием переменной-предиктора X (материнское образование), составляет около 50% общей дисперсии предсказываемой переменной. Коэффициент корреляции между переменными достаточно велик и статистически значим даже для не очень большой выборки. Следовательно, обнаруженная взаимосвязь переменных не может быть объяснена случайными погрешностями выборки. В пользу предложенной исследователем причинной гипотезы говорит и то обстоятельство, что альтернативная гипотеза - образование детей влияет на образовательный статус родителей - крайне неправдоподобна и может быть отвергнута на основании содержательных представлений о временной упорядоченности событий. Однако все еще не исключены те возможности, которые мы обсуждали в параграфе, посвященном методу уточнения. Иными словами, нам следует считаться с вероятностью того, что какая-то другая переменная (или несколько переменных) определяют и образование родителей и образование детей (например, финансовые возможности либо интеллект). Чтобы проверить такую конкурирующую гипотезу, следует рассчитать так называемую частную корреляцию. Логика расчета частной корреляции совпадает с логикой построения частных таблиц сопряженности при использовании метода уточнения. Построить частные таблицы сопряженности для различных уровней контрольной переменной в случае, когда переменные измерены на интервальном уровне, - это практически неразрешимая задача. Чтобы убедиться в этом, достаточно подсчитать, каким должно быть количество таблиц уже при десяти-двенадцати категориях каждой переменной. Расчет коэффициента частной корреляции - это простейшее средство уточнения исходной причинной модели при введении дополнительной переменной. Интерпретация коэффициента частной корреляции не отличается от интерпретации частных таблиц сопряженности: частной корреляцией называют корреляцию между двумя переменными, когда статистически контролируется, или "поддерживается на постоянном уровне", третья переменная (набор переменных).
  Если, предположим, при изучении корреляции между образованием и доходом нам понадобится "вычесть" из полученной величины эффект интеллекта, предположительно влияющего и на образование, и на доход, достаточно воспользоваться процедурой вычисления частной корреляции. Полученная величина будет свидетельствовать о чистом влиянии образования на доход, из которого "вычтена" линейная зависимость образования от интеллекта.
  Мюллер и соавторы208 приводят интересный пример использования коэффициента частной корреляции. В исследовании П. Риттербэнда и Р. Силберстайна изучались студенческие беспорядки 1968-1969 гг. Одна из гипотез заключалась в том, что число нарушений дисциплины и демонстраций протеста в старших классах учебных заведений связано с различиями показателей академической успеваемости учащихся. Корреляция между частотой "политических" беспорядков и средней успеваемостью оказалась отрицательной (хуже успеваемость - больше беспорядков) и статистически значимой (r = ?0,36). Однако еще более высокой была корреляция между частотой беспорядков и долей чернокожих учащихся (r = 0,54). Исследователи решили проверить, сохранится ли связь между беспорядками и успеваемостью, если статистически проконтролировать влияние расового состава учащихся. Коэффициент частной корреляции частоты беспорядков и успеваемости при контроле расового состава учащихся оказался равным нулю. Исходная корреляция между беспорядками и успеваемостью в данном случае может быть описана причинной моделью "ложной взаимосвязи" (см. рис. 19): наблюдаемые значения этих двух переменных скоррелированы лишь потому, что обе они зависят от третьей переменной - доли чернокожих в общем количестве учащихся. Чернокожие студенты, как заметили исследователи, оказались восприимчивее к предложенным самыми активными "политиканами" образцам участия в политических беспорядках. Кроме того, их успеваемость, помимо всяких политических событий, была устойчиво ниже, чем средняя успеваемость белых.
  Коэффициент частной корреляции между переменными X и Y при контроле дополнительной переменной Z (т. е. при поддержании Z "на постоянном уровне") обозначают как rхy.z. Для его вычисления достаточно знать величины наблюдаемых попарных корреляций между переменными X, Y и Z (N. e. простых корреляций - rxy , ryz , rxz):
 
 
  Как всякая выборочная статистика, коэффициент корреляции подвержен выборочному разбросу. Существует некоторая вероятность того, что для данной выборки будет получено ненулевое значение коэффициента корреляции, тогда как истинное его значение для генеральной совокупности равно нулю. Иными словами, существует задача оценки значимости полученных значений корреляций и коэффициентов регрессии, относящаяся к области теории статистического вывода. Описание соответствующих статистических методов выходит за рамки этой книги, поэтому мы рассмотрим лишь самые общие принципы, позволяющие решать описанную задачу в простых случаях и интерпретировать соответствующие показатели при использовании стандартных компьютерных программ.
  Прежде всего вероятностная оценка коэффициента корреляции подразумевает оценку отношения к его случайной ошибке. Удобная, хотя и не вполне надежная формула для вычисления ошибки коэффициента корреляции (mr) выглядит так209:
 
  Всегда полезно вычислить отношение полученной величины r к его ошибке (т. е. r/тr). В использовавшемся нами примере данных о погоде коэффициент корреляции оказался равен 0,91, а его выборочная ошибка составляет:
 
  Отношение r к тr обозначаемое как t, составит Разумеется, коэффициент, превосходящий свою случайную ошибку почти в 16 раз, может быть признан значимым даже без построения доверительных интервалов.
  Когда значение r не столь близко к единице и выборка невелика, нужно все же проверить статистическую гипотезу о равенстве r нулю в генеральной совокупности. Для этого нужно определить t по формуле:
 
 
 где t - это величина так называемого t-критерия Стьюдента (см. также главу 4), r - выборочный коэффициент корреляции, п - объем выборки. Для установления значимости вычисленной величины t-критерия пользуются таблицами t-распределения для (n ? 2) степеней свободы (см. табл. 4.1). Во многих пособиях по статистике можно найти и готовые таблицы критических значений коэффициента корреляции r для данного уровня значимости ?. В этом случае отпадает необходимость в каких-либо вычислениях t: достаточно сравнить полученную величину коэффициента корреляции с табличным значением210. (Например, величина коэффициента корреляции r = 0,55 будет существенной на уровне значимости р = 0,01 даже для выборки объемом 105, так как критическое значение составляет 0,254.)
 
  Множественная регрессия и путевой анализ
  Выше описывалась модель линейной регрессии для двух переменных. В действительности социолог довольно редко сталкивается со столь простыми моделями данных. Влияние одного фактора обычно может объяснить лишь часть разброса наблюдаемых значений независимой переменной. Метод частной корреляции позволяет нам проконтролировать эффекты воздействия любых других контрольных переменных, которые мы в состоянии измерить. (Стоит снова подчеркнуть здесь, что статистические методы изучения причинных взаимосвязей, в отличие от экспериментальных, позволяют нам контролировать лишь те источники вариации, которые мы способны концептуализировать и измерить.) Однако еще более интересной задачей является контроль одновременного воздействия нескольких независимых на одну зависимую переменную, а также сравнение эффекта воздействия разных независимых переменных и предсказание "отклика" независимой переменной. Именно эти задачи решают методы анализа, о которых пойдет речь в данном параграфе. Наше изложение будет неполным, так как более детальное обсуждение требует дополнительной математической подготовки. Мы будем ориентироваться на сравнительно скромные цели понимания общей логики и интерпретации результатов соответствующих статистических процедур.
  Уравнение множественной регрессии - это определенная модель порождения данных. Важные допущения, принимаемые в этой модели, касаются уже известного вам требования линейности, а также аддитивности суммарного эффекта независимых переменных. Последнее означает, что воздействия разных независимых переменных просто суммируются, а не, скажем, перемножаются (мультипликативный эффект, в отличие от аддитивного, имеет место тогда, когда величина воздействия одной независимой переменной на зависимую, в свою очередь, находится под влиянием другой независимой переменной, т. е. независимые переменные взаимодействуют друг с другом).
  Множественная регрессия во многом аналогична простой (бивариантной) регрессии. Отличие состоит в том, что регрессия осуществляется по двум и более независимым переменным одновременно, причем каждая из них входит в регрессионное уравнение с коэффициентом, позволяющим предсказать значения зависимой переменной с минимальным количеством ошибок (критерием здесь снова является метод наименьших квадратов). Частные коэффициенты в уравнении множественной регрессии показывают, какой будет величина воздействия соответствующей независимой переменной на зависимую при контроле влияния других независимых переменных. Если воспользоваться простейшей системой обозначений, то уравнение множественной регрессии для трех независимых переменных можно записать как:
 
 
 где - это предсказываемое значение зависимой переменной, X1 ... Х3 - независимые переменные, а b1, ... b3 - частные коэффициенты регрессии для каждой из зависимых переменных.
  Коэффициенты b могут быть интерпретированы как показатели влияния каждой из независимых переменных на зависимую при контроле всех других независимых переменных в уравнении. В отличие от коэффициентов частной корреляции коэффициенты регрессии обладают размерностью. Они показывают, на сколько единиц изменится зависимая переменная при увеличении независимой на одну единицу (при контроле всех остальных переменных модели). Пусть, например, мы построили уравнение множественной регрессии, описывающее зависимость дохода от интеллекта (X1) и стажа работы (Х2). Если величина b1 оказалась равной 100, это означает, что каждый дополнительный балл по шкале интеллекта увеличивает доход на 100 рублей. Значение b2 = 950 говорит нам, что год стажа прибавляет 950 рублей. Однако "сырые" оценки интеллекта и стажа измерены в разных единицах. Для определения сравнительной значимости независимых переменных, входящих в уравнение множественной регрессии, мы должны подвергнуть все переменные стандартизации (т. е. перевести их в Z-оценки, см. выше). Стандартизованные коэффициенты множественной регрессии, которые удобнее всего обозначать как b* (либо греч. "бета" - ?), меняются в пределах от ?1,0 до +1,0. Они сохраняют свою величину при изменении масштаба шкалы: переход от измерения возраста в годах к измерению в днях не изменит соответствующий b*.
  Стандартизованные коэффициенты позволяют оценить "вклад" каждой из переменных-предикторов в предсказание значений независимой переменной. Если в примере с влиянием интеллекта и стажа работы на доход окажется, что b1* = 0,25, а b2* = 0,30, то можно заключить, что сравнительная значимость "веса" интеллекта и стажа в предсказании дохода различаются незначительно. Если же для одной переменной b1* = 0,80, тогда как b2* = 0,40, мы можем сказать, что эффект воздействия второй переменной в два раза меньше эффекта первой.
  Чтобы определить ожидаемые значения зависимой переменной для отдельных индивидов, достаточно подставить в уравнение множественной регрессии соответствующие значения переменных-предикторов и вычисленных коэффициентов b. Пусть, например, мы хотим рассчитать прогнозное значение величины дохода для человека, чей коэффициент интеллекта равен 110, а стаж работы - 20 годам. Если b1, как в вышеприведенном примере, составляет 100, b2 = 950, а слагаемое а = 50000, то мы получим:
  ожидаемый доход = 50000 +100 х 110 + 950 х 20 = 80000 руб.
  Множественную регрессию можно использовать и для предсказания средних групповых значений, например среднего дохода мужчин-врачей. Единственное различие в данном случае заключается в использовании средних значений независимых переменных для подстановки в уравнение множественной регрессии. В качестве независимой переменной множественной регрессии могут использоваться и дихотомические переменные, которым приписывают значения 0 и 1 (например, пол). Для того чтобы включить в уравнение номинальную переменную с более чем двумя категориями, нужно создать соответствующее число новых, "фиктивных" переменных, каждая из которых будет кодироваться как 0 или 1 в зависимости от наличия или отсутствия категории-признака. Скажем, состоящую из трех категорий переменную "цвет глаз" можно представить с помощью трех переменных: Х1 - "голубые глаза", Х2 - "карие глаза", Х3 - "зеленые глаза". (Человек с голубыми глазами получит 1 по X1 и 0 по двум другим переменным.)
  Метод множественной регрессии очень популярен среди социологов. Вот, например, как выглядели результаты его применения в исследовании Л. Бэрона и М. Строса, изучавших факторы, влияющие на статистику изнасилований211. Использованная в планировании этого исследования матрица данных включала в себя в качестве объектов ("случаев") различные штаты США. Признаками, по которым описывались штаты, служили около десятка независимых и собственно контрольных переменных, предположительно воздействующих на зависимую переменную, - количество зарегистрированных полицией изнасилований на 100000 населения в год для данного штата (по данным ежегодных статистических отчетов ФБР). Предполагалось, что существующие различия между штатами в уровне изнасилований можно будет объяснить различиями в уровнях независимых переменных. Нужно отметить, что разброс "случаев" по зависимой переменной был весьма велик - от 71,9 на Аляске до 8,2 в Северной Дакоте (1979). Из десятка переменных, включенных в уравнение множественной регрессии, девять оказались статистически значимы. Основные результаты регрессионного анализа для семи переменных представлены в таблице 8.12.
  Таблица 8.12
  Множественный регрессионный анализ статистики изнасилований, 1979 г.212
 
 Независимая переменная
  Коэффициент
 b Коэффициент
 b* Р<
  Индекс совокупного тиража порнографических журналов (SMCX) 6,99
  0,52
  0,001
  Показатель числа убийств и непредумышленных убийств 1,70
  0,55
  0,001
  Показатель числа публичных оскорблений с угрозой применения физической силы 0,04
  0,32
  0,001
  Индекс положения женщин (SWX) 0,43
  0,27
  0,014
  Число грабежей ?0,03 ?0,25 0,052 Процент черного населения ?0,41 ?0,38 0,001 Процент живущих ниже федерального уровня бедности 1,11 0,29
  0,011
 
  Из таблицы видно, что индекс совокупного тиража порнографических журналов (интегральный показатель, учитывающий уровни продаж восьми популярных изданий) имеет коэффициент регрессии 6,99. Это означает, что рост индекса на единицу в среднем увеличивает количество изнасилований почти на 7 случаев (в расчете на 100000 населения). Весьма значительно и влияние числа убийств, что особенно заметно при сравнении стандартизованных коэффициентов (b*), не зависящих от шкалы измерения признака. Фактически количество убийств вносит самый значительный "вклад" в предсказание значений зависимой переменной (b* = 0,55). Интересно отметить, что одна из независимых переменных в описываемом исследовании - индекс положения женщин, рассчитанный на основании 22-х политических, экономических и социальных индикаторов, - при анализе простых взаимосвязей продемонстрировала практически нулевую корреляцию с количеством изнасилований (r = 0,17), причем результаты анализа диаграмм рассеивания также не дали никаких свидетельств в пользу гипотезы о нелинейной связи. Множественная регрессия позволила уточнить первоначальные выводы: при контроле прочих переменных модели, чем выше статус женщин, тем выше уровень изнасилований (результат, которому довольно трудно найти теоретическое объяснение). Использование девяти независимых переменных позволило объяснить 83% дисперсии в показателях количества изнасилований (квадрат коэффициента множественной корреляции r2 составил 0,83).
  При интерпретации результатов множественной регрессии стандартизованные коэффициенты, как уже говорилось, используют в качестве показателей значимости, "вклада" соответствующих переменных. Эта трактовка верна лишь в определенных пределах. При нарушении некоторых условий сравнение абсолютных величин стандартизованных коэффициентов может вести к неверным выводам. Дело в том, что коэффициенты регрессии подвержены влиянию случайных ошибок измерения. Использование ненадежных индикаторов "сдвигает" регрессионные коэффициенты к нулю213. Иными, словами, более надежные индикаторы дают более высокие оценки коэффициентов. Пусть, например, для предсказания риска сердечно-сосудистых заболеваний использовались две независимые переменные индивидуального уровня - "ориентация на достижения" и "склонность подавлять агрессию", - причем шкала для измерения первой обладала более высоким коэффициентом надежности. Если стандартизованный коэффициент регрессии для достиженческой мотивации окажется выше, чем для подавления агрессии, это может рассматриваться как следствие таких содержательных различий между переменными, которые важны с точки зрения теории психосоциальных факторов заболеваемости. Но нельзя исключить и альтернативное объяснение, связывающее более высокий регрессионный коэффициент первой переменной с побочными эффектами методов измерения: влияние ориентации на достижения не превосходит влияния, оказываемого на риск инфаркта склонностью подавлять агрессию, а наблюдаемые различия регрессионных коэффициентов связаны лишь с ненадежностью использованных индикаторов склонности к подавлению.
  Другая проблема, требующая некоторой осторожности в интерпретации коэффициентов регрессии, возникает вследствие того, что модель множественной регрессии не обязывает нас ни к каким строгим предположениям о причинных связях между независимыми переменными. Регрессионное уравнение, образно говоря, не делает никаких различий между собственно независимыми, т. е. теоретически специфицированными, переменными и дополнительными - контрольными, опосредующими и т.п.- факторами, вводимыми в модель с целью уточнения. В тех случаях, когда теоретическая гипотеза, проверяемая в ходе исследования, допускает: 1) существование взаимосвязей между независимыми переменными, 2) наличие прямых и косвенных (опосредованных) влияний, а также 3) использование нескольких индикаторов для каждого латентного фактора, могут понадобиться более совершенные статистические методы. Одна из возможностей здесь - это использование путевого анализа.
  Путевой анализ - один из основных способов построения и проверки причинных моделей в социологии. Многие более продвинутые статистические техники основаны на сходной исследовательской методологии.
  Важным достоинством путевого анализа является то, что он позволяет оценить параметры каузальных моделей, причем в расчет принимаются не только прямые, но и непрямые (опосредованные) влияния. Если, например, в результате корреляционного или регрессионного анализа мы обнаружили, что интеллект (измеренный как IQ) лишь умеренно влияет на доход, нам не следует торопиться с общими выводами. Мы оставили неучтенной возможность того, что интеллект может иметь существенное влияние на образование, которое, в свою очередь, воздействует на последующий доход. Таким образом, нам нужно принять во внимание то, что интеллект - помимо прямого эффекта - может иметь еще и опосредованное, непрямое влияние на доход посредством влияния на образование. Методы, рассматривавшиеся нами до сих пор, описывали только прямые эффекты.
  Путевой анализ включает в себя технику представления прямых и косвенных причинных влияний при помощи специальных диаграмм (потоковых графов). Эти диаграммы часто называют просто причинными (структурными) моделями.
  Последовательно "считывая" такую модель, можно легко определить все пути влияния одной переменной на другую и соответственно оценить величину чистого эффекта. Во многих разделах этой книги причинные модели уже использовались для представления сравнительно сложных причинных гипотез, поэтому общая логика их построения не требует детального обсуждения. Порядок представления переменных на диаграмме отражает предполагаемое направление причинной связи, а диапазон включенных в диаграмму переменных и отношения между ними зависят от принятых исследователем теоретических гипотез. Так называемые путевые коэффициенты, описывающие связи между переменными (связям соответствуют стрелочки на диаграмме), равны стандартизованным коэффициентам множественной регрессии (b*)214.
  Обычно путевую диаграмму рисуют слева направо - от самых "ранних" по порядку следования независимых переменных до зависимой. Путевые коэффициенты часто обозначают латинскими "p" с подстрочными индексами (р21 - это путевой коэффициент для связи между переменными Х1 ? Х2). На рисунке 24 в качестве примера изображена путевая диаграмма, отражающая гипотетические отношения между интеллектом (Х1), образованием (Х2), социально-экономическим статусом (Х3), доходом (Х4) и размерами сбережений (Х5).
  Специальные правила позволяют перевести отношения, изображенные на диаграмме, в совокупность структурных уравнений, описывающих механизмы прямого и опосредованного воздействия одних переменных на другие. На рисунке 24, в частности, видно, что не существует пути для прямого воздействия интеллекта на размеры сбережений, однако общий эффект воздействия интеллекта будет включать в себя совокупность непрямых эффектов: Х1 воздействует на Х5 и через образование (Х2), и через достигнутый статус (Х3), и через доход (Х4). Иными словами, хотя и нельзя утверждать, что склонность откладывать деньги "в кубышку" зависит от умственных способностей, последние влияют и на возможность получения образования, и на статус, и на доход. В свою очередь, люди с определенным социальным и экономическим статусом обнаруживают склонность иметь сбережения.
 
 
 
 
 
 
 
 
  Р21 Р32 Р32
 
 
 
 
 
  Р31 Р53
 
 
 
  Р41 Р43 Р34
 
 
 
 
 
 
  Puc. 24. Путевая диаграмма для примера со сбережениями
 
  В общем случае, полный эффект влияния переменной равен сумме ее непосредственного эффекта и всех косвенных эффектов влияния. Величины возмущений (е2 - е4) на рисунке позволяют оценить, насколько хорошо работает модель, показывая, какая часть дисперсии соответствующей переменной осталась необъясненной. В результате путевой анализ позволяет пересматривать и уточнять исходную теоретическую модель, сравнивать "эффективность" нескольких конкурирующих теорий для объяснения существующей совокупности эмпирических наблюдений. Существуют даже компьютерные программы, осуществляющие автоматический поиск наилучшей структурной модели, т.е. процедуру, сходную с отбором из нескольких существующих теорий такой, которая максимально соответствовала бы полученным в исследовании данным215. Важно, однако, осознавать, что сами по себе результаты применения регрессионных методов и причинных моделей (регрессионные коэффициенты, линии регрессии, путевые диаграммы) решают прежде всего задачу обобщенного описания уже полученных эмпирических данных. Они могут служить надежной основой для интерполяции, оценки положения гипотетических "точек" в пределах ряда наблюдавшихся значений, однако их использование в целях экстраполяции и прогноза может вести к существенным ошибкам в тех случаях, когда такой прогноз не подкреплен более широкой теорией, не сводимой к отдельной модели для конечной совокупности данных. (Достаточно указать в качестве примера на многочисленные ошибочные прогнозы в экономике - науке, где количество эмпирических данных и описывающих их структурных моделей многократно превзошло количество существующих теорий).
  Путевой анализ, как и множественная регрессия, сегодня является частью большинства стандартных статистических программ для компьютера. Не стоит, однако, забывать о том, что при любом уровне прогресса в компьютерном обеспечении задать причинную модель, т.е. совокупность содержательных гипотез, подлежащих статистическому оцениванию, может только сам исследователь.
 
  Дополнительная литература
  Вайнберг Дж., Шумекер Дж. Статистика. М.: Финансы и статистика, 1979.
  Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976.
  Интерпретация и анализ данных в социологическом исследовании. М.: Наука, 1987.
  Татарова Г.Г. Типологический анализ в социологии. М.: Наука, 1993.
  Типология и классификация в социологических исследованиях. М.: Наука, 1982.
  Толстова Ю.Н. Логика математического анализа социологических данных. М.: Наука, 1991.
  Хейс Д. Причинный анализ в статистических исследованиях. М.: Финансы и статистика, 1981.
  Флейс Дж. Статистические методы для изучения таблиц долей и пропорций. М.: Финансы и статистка, 1989.
  Ядов В.А. Социологические исследование: методология, программа, методы. 2-е изд. М.: Наука, 1987. Гл. 5.
 
 
 1 Интересно отметить, что такое понимание не всегда доступно самому исследователю в момент осуществления исследования. Так, Майкельсон до опубликования основных положений теории относительности Эйнштейна, породившей абсолютно новую исследовательскую программу, воспринимал свои опыты не как решающее опровержение теории эфира, а скорее как подтверждение того, что при движении Земли в эфире не возникает так называемый "эфирный ветер" (либо, если возникает, то очень маленький). Подробнее см.: Лакатос И. Фальсификация и методология научно-исследовательских программ. М.: Московский философский фонд "Медиум", 1995.
 2 Данный эксперимент представляет собой упрощенную версию экспериментов, реально проводившихся психологом Э. Толменом.
 3 Примеры влияния так называемых моделей измерения - вспомогательных гипотез, касающихся используемых социологами шкал и индикаторов, на теоретическую интерпретацию результатов исследования, подробнее рассмотрены в гл. 5 и 6.
 4 О том, как происходят такого рода научные революции, можно подробнее узнать из книги Т. Куна "Структура научных революций". См.: Кун Т. Структура научных революций. М.: Прогресс, 1977.
 5 Важно помнить, что за подобными догадками стоят не столько мистическая интуиция или "внутреннее знание", сколько целая система "обыденных социологических теорий", на которой основывают свои повседневные решения и интерпретации и профессиональные социологи, и обычные люди. "Обыденные теории", подобно научным, вполне могут оказаться как полезными, так и бесполезными, как верными, так и ошибочными - поэтому они также нуждаются в формализации, операционализации и проверке.
 6 Подробнее о соотношении исследовательских программ, теоретических моделей и методов исследования в социальных науках см.: Девятко И. Модели объяснения и логика социологического исследования. М.: ИСО РЦГО-TEMPUS/TACIS, 1996.
 7 Полезно различать негативный результат исследования, специально предназначенного для проверки предсказаний теории, и контрпример - наблюдение или исследовательский результат, который противники научной теории предлагают в качестве критического, предположительно не имеющего объяснения с точки зрения этой теории (т. е. контрпример - это такой факт, для которого из теории не удается дедуктивно вывести гипотезу, его предсказывающую).
 8 Заметим, не вдаваясь в детали, что выход из такого теоретического тупика можно найти в принятии базисных предположений других исследовательских программ, например психоаналитической, но за это обычно приходится платить отказом от собственных базисных предположений.
 9 Так, например, холистские исследовательские программы, объясняющие поведение отдельных действующих надындивидуальными, структурными факторами, противостоят индивидуалистским программам, сводящим любое социальное целое к мотивам и поступкам отдельных людей.
 10 Впрочем, для всякого "проступка" обычно находится другое объяснение.
 11 См.: Hammersley M., Atkinson P. Ethnography: Principles in Practice. L.: Tavistock, 1983.
 12 Blumer H. Foreword // Severyn T. Bruyri. The Human Perspective in Sociology: The Methodology of Participant Observation. Englewood Cliffs (N. J.), 1966. P. VI.
 13 См.: LazarsfeldP. F. Qualitative Analysis. Boston: Alien and Bacon, 1972.
 14 См.: Lofland J., Lofland L. H. Analizing Social Settings. Belmont (Ca.): Wadsworth, 1984.
 15 Whyte W. F. Street Corner Society. 2nd ed. Chicago: University of Chicago Press, [1943] 1955.
 16 Festinger L.. Riecken H., Schachter S. When Prophecy Fails. N. Y.: Harper & Row, 1956.
 17 См.: Latoure В., Woolgar S. Laboratory Life. Beverly Hills (Ca.): Sage, 1979, а также Lynch M. Art and Artifact in Laboratory Science. L.: Routledge and Kegan Paul, 1985.
 18 См.: Bosk Ch. L. Forgive and Remember: Managing Medical Failure. Chicago: The University of Chicago Press, 1979.
 19 См.: Morales E. Cocaine: White Gold Rush in Peru. Tuscon: University of Arizona Press, 1989.
 20 См.: Myerhoff B. Number Our Days. N. Y.: Simon and Schuster, 1978.
 21 Hammersley M., Atkinson P. Ethnography: Principles in Practice. P. 2.
 22 См.: Kaplan A. The Conduct of Inquiry. San Francisco: Chandler, 1964.
 23 См.: Glazer В., Strauss A. The Discovery of Grounded Theory. Chicago: Adline, 1967, а также Agar M, H. Speaking of Ethnography. Beverly Hills et al.: Sage, 1986. (Qualitative Research Methods Series. Vol. 2.)
 24 Freilich M. Mohawk Heroes and Trinidad Peasanis // FreilictiM. (ed.) Marginal Natives: Anthropologists at Work. N. Y., 1970.
 25 Glazer В., Strauss A.. Awareness of Dying. Chicago: Adline, 1965.
 26 Boggs V. Finding Your Spot 11 Smith C. D., Kornblum W. (eds.) In the Field: Readings on the Field Research Experience. N. Y., 1989. P. 147-152.
 27 См.: Merton R. K. Introduction: Notes on Problems-Finding in Sociology // Merton R. K., Broom L, Cottrell L. S., Jr. (eds.) Sociology Today. N. Y, 1959. Vol. 1.
 28 Более подробное и вполне ясное изложение можно найти в книге: Agar М. Н. Speaking of Ethnography.
 29 Ibid. Р. 12.
 30 Agar M. И. Op. cit. P. 20.
 31 Подробнее об этом см.: Geertz С. From the Native's Point of View: On the Nature of Anthropological Understanding // Rabinow P., Sullivan W. M. Interpretive Social Scena: A Reader. Berkeley, 1979.
 32 В одной из работ 3. Баумана сделана попытка показать, что эта роль посредника и переводчика в наше время вытесняет традиционную роль социолога-эксперта, дающего советы просвещенным правителям. Бауман подчеркивает, Однако, следующее важное обстоятельство: посредническая роль социолога и - шире - интеллектуала, его открытость к пониманию разных "способов жизни" не должны вести к отказу от его собственной традиции рационального объяснения и интеллектуальной честности. См.: Ваитап Z. Legislators and Interpreters. Cambridge: Polity Press, 1987.
 33 См.: Forgensen D. L. Participant Observation: A Methodology for Human Studies. Newbury Park et al.: Sage, 1989. P. 19-20. (Applied Social Research Methods Series. Vol. 15.)
 34 Glazer В., Strauss A. The Discovery of Grounded Theory.
 35 Glazer В., Strauss A. L. Awareness of Dying.
 36 Ibid. P. 8.
 37 Ibid. P. IX.
 38 См., в частности: Schutz A. The Phenomenology of the Social World / Transl. by G. Walsh, F. Lehnert. Evanston: Northwestern University Press, 1967; Blumer H, Symbolic Interactionism. Englewood Cliffs: Prentice Hall, 1969, а также применительно к методам социального исследования: Denzin N. Interpetive Interactionism. L. et al.: Sage, 1989.
 39 Thomas W. L, Thomas D. S. The Child in America. N. Y.: Khopf, 1928. Заметим, однако, что эта теоретически продуктивная позиция становится крайне спорной, как только начинает восприниматься как утверждение о возможности полного, безостаточного сведения (редукции) мира поступков, наблюдаемого поведения к миру сознания и смыслов. В этом случае знаменитая фраза становится столь же плоской и бессодержательной, как и противоположная крайняя позиция: поступки, которые люди действительно совершают, реальны по своим последствиям.
 40 Glazer B.. Strauss A. L. Awareness of Dying. P. 9-10.
 41 Glazer В., Strauss A. L. Awareness of Dying. P. 286-293. (Appendix.)
 42 Agar M. H. The Professional Stranger: An Informal Introduction to Ethnography. N. Y. et al.: Academic Press, 1980. P. 61.
 43 См.: Lofland J. Doing Social Life: The Qualitative Study of Human Interaction in Natural Settings. N. Y.: Wiley, 1976.
 44 См.: Goffman E. The Presentation of Self in Everyday Life. N. Y.: Doubleday, 1959.
 45 Под "социальной сконструированностью" здесь достаточно пока понимать смысловую и ценностно-нормативную определенность, то символическое "поле" смыслов, в котором происходит взаимодействие.
 46 Wolfe Т. The Electric Kool-Aid Acid Test. N. Y.: Bantam Books, 1983. Цит. по: Smith C.D., Kornblum W. (eds) In the Field: Readings on the Field Research Experience. N. Y: Praeger, 1989. P. 2-4.
 47 Liebow E. Tally's Corner. L.: Routledge and Kegan, 1967.
 48 Ibid.
 49 Whyte W. F. Op. cit.
 50 Следует упомянуть также более редкий случай, когда ученый, вынужденно и по далеким от науки причинам оказавшийся в некоторой ситуации, решает использовать эту ситуацию в исследовательских целях. В сущности, именно таким образом оказался на Тробриандовых островах выдающийся антрополог Б. Малиновский, интернированный как подданный враждебной державы ("Argonauts of the Western Pacific", 1922). Отечественный исследователь Ю. Д. Карпов, находившийся в административной ссылке в Амурской области в 1969-1972 гг., осуществил комплексный анализ жизни сельской общины (устное сообщение канд. экон. наук, доц. НГУ Е. Е. Горяченко, участвующей в. подготовке материалов исследования Ю. Д. Карпова к изданию).
 51 Morales Е. Cocain. Цит. по: Smith С. D., Kornblum W. (eds.) In the Field: Readings on the Field Research Experience. P. 116.
 52 Галут в пер. с иврита - изгнание, рассеяние.
 53 Чиканос - потомки мексиканских иммигрантов.
 54 Myerhoff B. Op. cit.
 55 Myerhoff B. Op. cit.P. 89.
 56 Hammersley M., Atkinson P. Op. cit. P. 71-72.
 57 Gold R. L. Roles in Sociological Fieldwork // Social Forces. 1958. Vol. 36. P. 217-223. См. также: Junker В. Field Work. Chicago: University of Chicago Press, 1960.
 58 Ольшанский В. Б. Личность и социальные ценности // Социология в СССР. М., 1966. Т. 1.
 59 Hammersley М., Atkinson P. Op. cit. Р. 96.
 60 Mead М. Coming of Age in Samoa. N. Y.: Morrow, 1923.
 61 Freeman D. Margaret Mead and Samoa: The Making and Unmaking of an Anthropological Myth. Cambridge: Harvard University Press, 1983.
 62 Ibid. P. 66-68.
 63 Geertz C. Works and Lives: the Anthropologist as Author. Stanford (Ca.): Stanford University Press, 1988. P. 143-144.
 64 См., в частности: Becker H. S. Doing Things Together: Selected Papers. Evanston (111.): Northwestern University Press, 1986. Part 4.
 65 Hammersley M., Atkinson P. Op. cit. P. 156-157.
 66 Spradley J. P. Participant Observation. N. Y.: Holt, Rinehart & Winston, 1980. P. 78.
 67 Straus A., Corbin J. Basics of Qualitative Research: Grounded Theory Procedures and Techniques. Newbury Park et al.: Sage Publications, 1990. P. 69-72.
 68 Atkinson J. M., Heritage J. (eds.) Structures of Social Action: Studies in Conversation Analysis Cambridge: Cambridge University Press, 1984. P. IX-XVI.
 69 С более точным - хотя и более сложным - описанием теоретических предпосылок анализа разговора лучше познакомиться по записи лекций X. Сакса. См.: .Atkinson J. M., Heritage J. (eds.) Structures of Social Action: Studies in Conversation Analysis. P. 21-27. Ch. 2 ("Notes on Methodology").
 70 Ibid. P. 191- 222.
 71 Ibid. P. 191.
 72 Ibid. P. 192.
 73 Ibid. P. 193.
 74 Thomas N. Out of Time: History and Evolution in Anthropological Discourse. Cambridge: Cambridge University Press, 1989. P. 9.
 75 Robinson W. S. The Logical Structure of Analytic Induction // Amer. Sociological Review. 1951. Vol. 16. P. 813.

<< Пред.           стр. 6 (из 7)           След. >>

Список литературы по разделу