7.5. Необихевиористическое направление. Теория Б.Ф. Скиннера

Необихевиористическое направление (от греч. neos - новый и англ. behavior - поведение) является историческим преемником 3-го этапа развития психологии.
Бихевиоризм опирался на теорию условных рефлексов, разработанную русским физиологом Иваном Петровичем Павловым (1849- 1936).

Рис. 32. Выработка условных рефлексов у собаки

  Опыты И.П. Павлова по выработке условных рефлексов у собак получили широкую известность (рис. 32). Когда собаке давали пищу (безусловный раздражитель ), у неё выделялась слюна, т.е. возникал безусловный пищевой слюноотделительный рефлекс. Для того чтобы выработать условный рефлекс, за некоторое время до кормления включали звонок. Раздавался звук, т.е. безразличный (нейтральный) для слюноотделительного рефлекса раздражитель. После нескольких сочетаний включения звонка с кормлением один лишь звук вызывал слюноотделение у собаки - даже в том случае, если пищи в кормушке не было. Другими словами, у собаки вырабатывался условный рефлекс на звук звонка, который становился для неё сигналом появления пищи (этот раздражитель из нейтрального превращался в условный).
  Подача пищи после звука звонка была названа подкреплением. Подкрепление способствует формированию и закреплению условного рефлекса. Когда у собаки уже был выработан прочный условный рефлекс, звонок включали, а пищу не давали. И.П. Павлов отметил, что после нескольких таких случаев у собаки, в конце концов, совсем прекращалось слюноотделение на звук звонка. Этот процесс был назван угасанием условного рефлекса. Он демонстрирует, что подкрепление важно и значимо не только для приобретения условных рефлексов, но и для их сохранения.
  Основал бихевиористическое направление американский психолог Джон Бродес Уотсон (1878-1958) . Зачем объяснять поведение человека, спрашивал он, с позиции структур и процессов, скрытых «внутри» личности (инстинктов, архетипов, мотивов, ценностей и т.д.), если их нельзя «увидеть» и измерить? Именно внешнее поведение легче всего поддаётся наблюдению и изучению объективными методами - в отличие от сознания, чувств человека и пр. Поэтому, по его мнению, чтобы психологию «принимали всерьёз», чтобы она приблизилась к естественным наукам, единственным её предметом должно стать поведение человека.
  Согласно Д.Б. Уотсону, к изучению поведения человека нужно применять те же методы, что и к изучению поведения животных, оперируя двумя основными понятиями - «стимул» и «реакция». Он считал, что всё многообразие проявлений человека можно объяснить простой схемой: стимул → реакция (S → R).
  В своих многочисленных опытах по дрессировке крыс Д.Б. Уотсон пользовался методом подкрепления. Те реакции, выработка которых ему была необходима, поощрялись, а все нежелательные влекли за собой наказание. Известен также один опыт на человеке, который он провёл совместно с Розалией Рейнер в 1920 г. Учёные обусловливали эмоциональную реакцию страха у 11-месячного мальчика, известного в истории психологии под именем «маленький Альберт». Как и многие дети, Альберт вначале не боялся живых белых крыс. К тому же его никогда не видели в состоянии страха или гнева. Методика эксперимента состояла в следующем: Альберту показывали прирученную белую крысу (условный стимул) и одновременно за его спиной раздавался громкий удар в гонг (безусловный стимул). После того, как крыса и звуковой сигнал были представлены 7 раз, реакция сильного страха (условная реакция) - плач и запрокидывание - наступала, когда ему только показывали животное. Через 5 дней экспериментаторы показали Альберту другие предметы, напоминающие крысу тем, что они были белые и пушистые. Было обнаружено, что реакция страха у Альберта распространилась на множество стимулов, включая кролика, пальто из котикового меха, маску Деда Мороза и даже волосы экспериментатора. Большинство из этих обусловленных страхов все ещё можно было наблюдать месяц спустя после первоначального воздействия.
  Д.Б. Уотсон считал, что с помощью подкрепления на человека можно влиять, направляя его поведение в нужную сторону. По его мнению, так можно оказывать влияние, например, на формирующуюся личность ребёнка, чтобы получить желаемый результат. Фактически это означало, что из ребёнка можно «вырастить» того, кого угодно - вора или бродягу, представителя любой профессии - независимо от его изначальных способностей, склонностей, происхождения и пр.
  Бихевиоризм получил широкое распространение, и его методы стали активно использоваться в науке (в т.ч. в педагогике) и практике (в т.ч. управленческой).
  Но так же, как психоанализ, бихевиоризм через некоторое время подвергся реформированию, что привело к возникновению направления психологии, получившего название «необихевиоризм».
  Беррес Фредерик Скиннер (1904-1990) - американский психолог, один из представителей необихевиористического направления, разработавший «теорию оперантного научения».
  Б.Ф. Скиннер был против допущения какой-либо «свободной воли» или любого другого «сознательного» явления. По его мнению, человеческий организм - это «чёрный ящик», чьё содержимое (мотивы, влечения, конфликты, эмоции и т.д.) следует исключить из сферы эм- пирического исследования. Он считал, что главная задача психологии заключается в том, чтобы отыскивать причинно-следственные связи между условиями окружающей среды (стимулами) и внешним поведением человека (реакциями).
  Автор разработал ряд концепций, объясняющих развитие лично- сти и её особенности:
  1) личность, по его мнению, определяется двумя факторами: наследственностью и опытом. Поэтому Б.Ф. Скиннер признавал уникальность каждого человека - ведь никто другой, если у него нет идентичного близнеца, не обладает такими же генетическими данными и, безоговорочно, никто другой не имеет такого же личного прошлого;
  2) опыт складывается в процессе научения, результатом которого является приобретение специфического для каждого человека набора поведенческих реакций;
  3) существует два вида научения - респондентное и оперантное. Респондентным научением (от англ. response - ответ) автор называл выработку условных рефлексов, о которой писали И.П. Павлов и Д.Б. Уотсон. При респондентном научении известный стимул предшествует реакции на него (S → R).
  Однако Б.Ф. Скиннер подчёркивал, что поведение животных и человека на самом деле редко объясняется респондентным научением. Например, вы сейчас читаете учебник, чтобы подготовиться к сдаче зачёта. Определённо, это не является вашей реакцией на предшествующий стимул. Наоборот, на ваше поведение воздействует стимульное событие (зачёт), которое наступит позже. Так как этот тип поведения предполагает, что вы активно воздействуете на окружение с целью изменить события каким-то образом, Б.Ф. Скиннер назвал его оперантным (от англ. to operate - оказывать влияние).
  Оперантное научение предполагает следующий алгоритм: человек спонтанно производит некоторое действие (оперантную реакцию или оперант) → если последствия благоприятны для него (т.е. получено позитивное подкрепление), то вероятность того, что он повторит это действие, возрастает (оперантная реакция «обусловливается»), а если последствия неблагоприятны (т.е. позитивное подкрепление не получено, а получено негативное подкрепление или наказание), то вероятность того, что он повторит это действие, снижается. Другими словами, подкреплённое поведение стремится повториться, а поведение неподкреплённое или наказуемое имеет тенденцию не повторяться или подавляться. Например, вы скоро перестанете улыбаться человеку, который в ответ на вашу улыбку всегда бросает на вас сердитый взгляд.
  Необходимо подчеркнуть следующее:
  - во-первых, Б.Ф. Скиннер считал, что невозможно объяснить, откуда изначально берётся действие (оперантная реакция) человека;
  - во-вторых, по мнению автора, оперантное научение чаще контролируется негативным подкреплением и наказанием, чем позитивным подкреплением.
  Б.Ф. Скиннер, считавший, как и Д.Б. Уотсон, очевидной связь между принципами поведения животных и человека, доказывал существование оперантного научения с помощью опытов на крысах.
  Крысу помещали в клетку (известную как «ящик Скиннера»), где были только рычаг и миска для еды. Сначала она демонстрировала множество оперантов: ходила, принюхивалась, почёсывалась, чистила себя и т.д. В конце концов, в ходе своей ознакомительной деятельности крыса нажимала на рычаг, в результате чего получала шарик пищи, автоматически доставляемый в миску под рычагом. Так как реакция нажатия рычага первоначально имела низкую вероятность возникновения, её следует считать чисто случайной по отношению к питанию. Однако если крысу до опыта на несколько часов лишали еды, то в клетке после первого случая подачи пищи она начинала проводить больше времени рядом с рычагом, нажимать его всё быстрее и быстрее. Другими словами, нажатие рычага постепенно становилось наиболее частой (высоковероятной) реакцией крысы. То есть происходило оперантное научение. Если в последующих опытах пища постоянно не появлялась вслед за нажатием рычага (т.е. не было позитивного подкрепления), крыса по прошествии некоторого времени переставала его нажимать (т.е. происходило угасание реакции);
  4) существуют разные типы, виды и режимы подкрепления, которые влияют на эффективность оперантного научения. Б.Ф. Скиннер разработал подробную концепцию подкрепления:
  а) он выделил два типа подкрепления - первичное и вторичное. Первичное подкрепление - это событие или объект, которое само по себе обладает подкрепляющими свойствами. Ценностное значение таких стимулов для человека не зависит от научения: они ценны потому, что с их помощью удовлетворяются органические потребности. Для людей первичными подкрепляющими стимулами, по мнению автора, являются пища, вода, физический комфорт и секс.
  Вторичное (условное) подкрепление - это событие или объект, которое при жизни человека в результате научения наделяется подкрепляющими свойствами. Такие стимулы становятся для человека ценными, т.к. ассоциируются с первичным подкреплением. Б.Ф. Скиннер приводил в качестве примеров вторичных подкрепляющих стимулов деньги, хорошие оценки, внимание и одобрение окружающих.
  Важными для формирования вторичного подкрепления являются две закономерности:
  - генерализация стимула. Когда стимул ассоциируется у человека с более чем одним первичным подкреплением, он становится обобщённым, т.е. его подкрепляющие свойства распространяются на разные формы поведения. Например, сами по себе деньги не могут удовлетворить ни одной органической потребности. Однако благодаря системе культурного обмена они позволяют человеку получать всё, что он захочет, а потому становятся для него мощным генерализованным подкрепляющим стимулом.
  Б.Ф. Скиннер подчёркивал, что этот закон распространяется и на негативный опыт. Так, если вы один раз подверглись нападению со стороны человека, принадлежащего к определённой этнической группе (например, китайца), этого может быть достаточно для того, чтобы вы в дальнейшем избегали контактов со всеми представителями данной группы.
  Согласно автору, проявлением этого же закона является то, что поведение, усиленное (подкреплённое) в одной ситуации, весьма вероятно, повторится не только в такой же ситуации, но и в других, похожих на неё. Например, ребёнок, которого похвалили за утончённые манеры дома, скорее всего, будет аналогичным образом вести себя в гостях, в кафе и т.д. Без этого наш поведенческий набор, отмечал Б.Ф. Скиннер, был бы так сильно ограничен и хаотичен, что ежедневно мы подолгу размышляли бы над тем, как реагировать на каждую новую ситуацию;
  - различение стимулов. Способность к различению, согласно Б.Ф. Скиннеру, приобретается благодаря подкреплению оперантных реакций в присутствии одних стимулов и неподкреплению - в присутствии других. Так, ребёнок научается различать домашнюю собачку и злобного пса, автомобилист - зелёный и красный сигналы светофора, диабетик - пищу с большим и малым содержанием сахара и т.д.;
  б) Б.Ф. Скиннер выделил три вида подкрепления - позитивное подкрепление, негативное подкрепление и наказание. Позитивное подкрепление, по мнению автора, является наиболее эффективным методом поощрения желательного и устранения нежелательного поведения. Например, осуждённые преступники содержатся в невыносимых условиях во многих карательных учреждениях. Автор считал, что именно это обстоятельство препятствует их реабилитации, о чём свидетельствует высокий уровень рецидивов (повторных нарушений закона). С его точки зрения, если урегулировать условия окружения в тюрьме таким образом, чтобы законопослушное поведение позитивно подкреплялось, то это значительно увеличит эффективность реабилитации людей, преступивших закон.
  При негативном подкреплении человек, столкнувшись с неприятным или болевым стимулом, начинает регулировать своё поведение так, чтобы снизить вероятность его повторного появления. Например, учитель сообщает ученикам: «Если вы будете полноценно работать на уроках, тогда вам не нужно будет выполнять домашнее задание». Дети, скорее всего, будут старательно заниматься в классе. При этом их поведение, основанное на желании избежать неприятного стимула (выполнения домашних заданий), будет негативно подкреплённым.
  Цель наказания - побудить людей не вести себя определённым образом. Б.Ф. Скиннер выделил два вида наказания. Позитивное наказание представляет собой неприятный или болевой стимул, который следует за нежелательным поведением. Так, если дети плохо себя ведут, их шлёпают или бранят; если студенты пользуются шпаргалками на экзамене, их исключают из вуза; если взрослых ловят на краже, их штрафуют или сажают в тюрьму. Негативное наказание представляет собой устранение возможного позитивного подкрепляющего стимула. Например, если дети себя плохо ведут, им запрещают смотреть телевизор.
  По мнению автора, наказание является самым неэффективным методом контроля поведения, поскольку из-за своей угрожающей природы оно вызывает отрицательные эмоциональные и социальные побочные эффекты (тревогу, страх, потерю самоуважения и уверенности в себе и др.). Он подчёркивал, что поведение, за которым последовало наказание, может опять повториться - после того, как исчезнет вероятность наказания. Например, ребёнок, которого отшлёпали за то, что он ругался в доме, может свободно делать это в другом месте;
  в) Б.Ф. Скиннер выделил четыре режима подкрепления в соответствии с двумя основными параметрами - временем и количеством оперантных реакций человека:
  - режим подкрепления с постоянным интервалом предполагает, что подкрепление наступает через равные промежутки времени. Примерами такого режима являются выплата заработной платы раз в неделю, месяц и т.д., проведение экзаменационных сессий в вузах и т.п. Б.Ф. Скиннер отметил, что при таком режиме существует феномен «паузы сразу после подкрепления». Например, после успешной сдачи сессии студенты буквально устраивают себе «перерыв» в обучении;
  - режим подкрепления с вариативным интервалом. В данном случае человек не может точно предвидеть, через какое время будет следующее подкрепление. По мнению автора, это препятствует угасанию оперантной реакции. Примером такого режима являются «неожиданные» контрольные работы, которые преподаватель вуза устраивает с разной частотой - то 1 раз в 3 дня, то 1 раз в 3 недели. Согласно Б.Ф. Скиннеру, от студентов при этом можно ожидать длительного сохранения высокого уровня прилежания, т.к. они не могут предугадать, в какой момент их знания подвергнутся проверке;
  - режим подкрепления с постоянным соотношением предполагает, что подкрепление зависит от определённого количества реакций человека. Примером такого режима является оплата труда, зависящая от количества единиц (товаров, услуг и т.д.), которые произведёт или продаст сотрудник. По мнению автора, такой режим очень эффективен, т.к. чем больше человек действует (реагирует), тем большее подкрепление он получает;
  - режим подкрепления с вариативным соотношением. В данном случае человек не может прогнозировать, через какое количество его действий (реакций) будет подкрепление, но знает, что оно будет. В качестве наиболее драматического примера такого режима Б.Ф. Скиннер рассматривал азартные игры. Игрок не может бросить игру, несмотря на то, что очень много проиграл (или выиграл ничтожно мало), т.к. он надеется, что в следующий раз «сорвёт куш».
  Б.Ф. Скиннер получил значительное количество экспериментальных данных, подтверждающих его концепции. Идея о том, что поведение можно достоверно определить, предсказать и проконтролировать условиями окружения, нашла широкое применение в управлении персоналом, программировании и других сферах практики.
  Существует, кроме того, бихевиоральная терапия, в которой используются принципы оперантного научения. Многие психологические проблемы в ней рассматриваются как следствие неудачного научения: некоторые люди не знают, как быть дружелюбными, как вести разговор, как адекватно выразить свой гнев, как отклонить неразумную просьбу и т.д. Терапевты осуществляют помощь путём позитивного подкрепления желательного поведения клиента. Человек в присутствии терапевта как бы «репетирует» новое поведение, а затем применяет его в реальной жизни.

Содержание

Вперед