Индивидуально-приспособительная деятельность животных: ассоциативное обучение, когнитивные процессы
Зорина Зоя Александровна, Полетаева Инга Игоревна
Общая характеристика тех проявлений индивидуальной приспособительной деятельности, в основе которых лежит обучение. Краткое описание классических и инструментальных условных рефлексов. Примеры методов исследования процессов обучения, в частности анализируется формирование пространственных представлений. Ассоциативные процессы, отражающие механизм образования условных рефлексов, сопоставляются с основными видами когнитивной деятельности. Описание методов обучения (дифференцировки и их системы, выбор по образцу), по которым можно судить о способности животных к обобщению и умозаключению.
Индивидуально-приспособительная деятельность животного, т.е. адаптация особи к конкретным условиям среды, позволяет ему с большим или меньшим успехом выживать, преодолевая трудности и опасности повседневного существования. Эта деятельность многообразна по составу и включает приобретенные компоненты разной природы. Рассмотрим виды индивидуально-приспособительного поведения, в основе которых лежат процессы обучения.
1. Обучение и пластичность.
Из существующих в настоящее время определений феномена ВлобучениеВ» предпочтение отдается определению У. Торпа (Thorpe, 1963).
Обучение тАФ это появление адаптивных изменений индивидуального поведения в результате приобретения опыта.
На обучении основаны события естественной жизни животных, например формирование навыков отыскания определенной пищи, избегания опасных участков местности, выбора удобных троп, взаимодействия с сородичами и животными других видов и т.п. В лабораторных опытах можно наблюдать, как животное обучается действиям, заданным экспериментатором. Примерами могут быть ВлслюнныеВ» условные рефлексы собаки, т.е. выделение слюны уже в момент попадания животного в комнату, где в процессе опытов оно получало подкормку; отыскание крысой выхода из лабиринта; избегание болевого раздражения; клевание птицей кнопки при действии определенных стимулов и т.п.
Способность к обучению базируется на присущем центральной нервной системе свойстве пластичности.
Пластичность тАФ это свойство системы изменять свою реакцию на внешние воздействия как результат тех или иных внутренних преобразований на основе предшествующих воздействий.
Она проявляется в способности системы изменять реакции на повторяющийся многократно раздражитель, а также в случаях его совместного действия с другими факторами. Пластичность может иметь разную направленность: чувствительность к раздражителю может повышаться тАФ это явление называется сенсишизацией, или снижаться, тогда говорят о привыкании.
По определению нейрофизиологов, анализирующих пластические изменения в мозге (Конорски, 1970; Котляр, 1986),
пластичность тАФ это относительно устойчивые функциональные изменения в системах нейронов, которые по длительности превышают время обычных синаптических процессов и определяют эффективность и направленность межнейронных связей.
Это достаточно формальное определение показывает, что изменения ответа системы при повторном действии стимула можно описать на языке математики.
2. Классификация форм индивидуально-приспособительной деятельности.
Формы обучения животных весьма разнообразны и обычно их подразделяют на три основные категории: неассоциативное обучение, ассоциативное обучение и когнитивные процессы. О. Меннинг (1982) и Д. Дьюсбери включали в свои классификации также и Влинсайт-обуче-ниеВ» (см. 3.4.5). Приводим систематизированный перечень этих феноменов (по данным разных авторов).
Классификация включает некоторые сведения об элементах рассудочной деятельности, которым посвящена основная часть пособия. Ряд авторов выделяют в своих книгах раздел ВлComplex cognitionВ», который соответствует разделу ВлКогнитивные процессыВ» настоящей главы, а также содержанию ряда следующих глав, где рассматривается формирование у животных понятий, усвоение языков-посредников и т.д.
Для изучения механизмов обучения нередко используют различные модели, в том числе так называемые клеточные аналоги обучения или процесс посттетанической потенциации (см. гл. 9 и, например: Шеперд, 1987).
Классификация форм обучения и когнитивных процессов [составлена нами на основе классификаций О. Меннинга (Manning, Dawkins, 1992), тАФ Д. Дьюсбери (1981), Р. Томаса (Thomas, 1996), Дж. Пирса (Реагсе, 1998) и др.].
> Неассоциативное обучение:
тАФ привыкание.
> Ассоциативное обучение:
классические условные рефлексы;
инструментальные условные рефлексы.
> Когнитивные процессы:
латентное обучение;
выбор по образцу;
обучение, основанное на представлениях о:
* пространстве;
* порядке стимулов;
* времени (Обширный экспериментальный материал по восприятию и оценке животными параметров времени в книге не затронут, поскольку эти вопросы практически не имеют прямой связи с проблемой мышления животных);
* числе.
тАФ элементарное мышление (Классификация видов мышления животных рассматривается в главе 4).
Далее рассматриваются основные формы обучения, приведенные в схеме классификации.
2.1. Неассоциативное обучение (привыкание).
Неассоциативное обучение (привыкание) заключается в ослаблении реакции при повторных предъявлениях раздражителя.
Изначально любой раздражитель (стимул), действующий на органы чувств животного, вызывает у него соответствующую ответную реакцию: поворот головы в сторону света или звука, отдергивание конечности и др., у моллюсков тАФ втягивание жабр и т.д. При повторном систематическом предъявлении того же стимула реакция постепенно ослабевает и может исчезнуть совсем, т.е. происходит привыкание к раздражителю. Так, например, только что установленное в огороде чучело распугивает птиц, однако с течением времени их страх ослабевает и они перестают реагировать на этот предмет.
Привыкание тАФ наиболее примитивная форма обучения, отчетливо выраженная даже у низших организмов тАФ беспозвоночных животных. Его успешно исследуют на имеющих простую нервную систему ки-шечно-полостных, червях, моллюсках, насекомых. Для изучения привыкания используются также модельные системы тАФ так называемые клеточные аналоги привыкания или срезы мозга.
Более строго привыкание определяют как снижение вероятности появления реакции или уменьшение интенсивности при неоднократном повторении вызывающего ее раздражителя. Ослабление ответной реакции можно считать истинным привыканием только в том случае, когда оно обусловлено изменениями в ЦНС, а не адаптацией рецепторов или утомлением.
Применение какого-либо нового стимула прекращает процесс привыкания к прежнему раздражителю, и угасшая было реакция на исходный раздражитель полностью восстанавливается. Для привыкания характерно и так называемое спонтанное восстановление, если действие стимула временно прекращается. Более подробные сведения о свойствах процесса привыкания можно найти в учебниках Кэнделла (1987), Шеперда (1987) и Эккерта и др. (1991).
2.2. Ассоциативное обучение.
При ассоциативном обучении в ЦНС формируется временная связь между двумя стимулами, один из которых изначально был для животного безразличен, а другой выполнял роль вознаграждения или наказания.
Формирование этой связи обнаруживается в виде изменений в поведении животного, которые в зависимости от своей ВлструктурыВ» называются либо классическими, либо инструментальными условными рефлексами.
2.2.1. Основные характеристики условнорефлекторной деятельности
В 1902 году, анализируя нервную регуляцию процесса пищеварения у собак, И.П.Павлов обнаружил так называемое Влпсихическое слюноотделениеВ». Феномен заключался в выделении у животного слюны, которая стекала в пробирку через фистулу на щеке еше до попадания пищи в рот, т.е. заранее, Влв опережающем режимеВ», как только собаку приводили в экспериментальную комнату и помещали в специальный станок (рис.1).
Таким же образом повторное сочетание любого нейтрального для животного раздражения (например, звонка) с кормлением вызывает выделение слюны еще до того, как собака получит пищу.
И. П. Павлов назвал звонок условным сигналом (УС), пищу тАФ безусловным раздражителем (или стимулом), реакцию животного (слюноотделение) в ответ на предъявление пищи тАФ безусловным рефлексом (БР), а в ответ на звонок тАФ условным рефлексом (УР).
Рис. 1. Схема установки по выработке слюнных условных рефлексов в экспериментах И. П. Павлова.
Через фистулу в щеке слюна поступает в устройство, измеряющее ее объем. Перед животным имеется панель, где расположены источники нейтральных раздражителей (света и звука), которые могут стать УС.
Принцип образования условного рефлекса состоит в следующем: действие какого-либо нейтрального (или индифферентного) для животного раздражителя совместно со стимулом, вызывающим у него определенную реакцию (например, отдергивание конечности при болевой стимуляции), приводит к тому, что постепенно этот ранее нейтральный стимул начинает вызывать такую же реакцию.
Предъявление безусловного стимула вслед за условным в процессе выработки УР называется его подкреплением. Если при выработке УР применяется подкрепление, соответствующее имеющейся у животного мотивации (например, пищевое подкрепление в состоянии голода), то оно называется положительным и вырабатываемый УР также называется положительным. Можно выработать УР и с применением отрицательного подкрепления (наказания), т.е. такого воздействия, которого животное стремится избежать. В эксперименте в качестве отрицательного подкрепления чаще всего применяют удар электрического тока, вызывающий отдергивание конечности или перебегание в безопасное отделение камеры. Используют также действие воздушной струи, направленной на роговицу глаза и вызывающей мигание. Динамика реакций мигательной перепоныки кролика при выработке такого УР показана на рис. 2А.
Подкрепление, которое используется для выработки УР, оказывается эффективным, если оно применяется в период достаточно сильного мотивационного возбуждения. Так, удар воздушной струи, направленной на роговицу глаза, может стать отрицательным подкреплением, только если он действительно неприятен животному.
Слюнной и мигательный УР относятся к категории классических (ВлпавловскихВ») условных рефлексов (см. также 2.2.2).
Рис. 2. Изменения условной реакции мигания у кролика.
Безусловный стимул тАФ струя воздуха, направленная на роговицу; условный тАФ звук; А тАФ его угашение; Б тАФ генерализация ответа при использовании в качестве УС тонов разных частот. По оси ординат тАФ доля УР (в %), по оси абсцисс тАФ число предъявлений (А) и частота тона (Б).
На основе изучения слюнных УР у собак И. П. Павлов сформулировал основные общие правила образования УР:
условный сигнал должен предшествовать безусловному раздражению, но не наоборот;
действие условного и безусловного раздражителей должно частично перекрываться во времени;
сочетание условного и безусловного раздражителей должно повторяться многократно.
Эти правила приложимы не только к классическим, но и к инструментальным (см. ниже) УР. И формирование, и проявления уже выработанных слюнных УР у собак в значительной степени чувствительны к влиянию посторонних раздражителей. В лаборатории И. П. Павлова было обнаружено, что любой посторонний и достаточно сильный стимул, подействовавший в течение эксперимента, уменьшает условнорефлекторное слюноотделение у собаки, как бы ВлотвлекаетВ» ее. Павлов объяснял это явление на основе своего понимания механизма формирования УР: вмешательство постороннего стимула вызывает в коре головного мозга собаки сильный очаг возбуждения, который в силу природы условнорефлекторньгх связей подавляет уже сформированный УР, ВлиндуцируяВ» торможение участка коры, ответственного за этот УР. Такое торможение И. П. Павлов назвал внешним.
Помимо внешнего торможения в лаборатории Павлова было описано и внутреннее торможение. Одно из проявлений этого процесса можно наблюдать в опытах, когда предъявление УС перестает сопровождаться подкреплением. Отмена подкрепления ведет к постепенному исчезновению внешних проявлений УР, к его угашению (ход угашения мигательного УР у кролика представлен графически на рис. 2А). Однако этот УР не разрушается, не исчезает и при возобновлении подкрепления восстанавливается. Для восстановления требуется значительно меньшее число сочетаний УС с подкреплением, чем при первоначальном обучении. По Павлову, отмена подкрепления не разрушает УР, а лишь подавляет его в связи с формированием очага внутреннего торможения.
Следует отметить, что для проявления условной связи между двумя стимулами подкрепление не всегда необходимо. В работах И. П. Павлова было показано, что и сами УС в определенных условиях могут действовать как подкрепление. Можно провести опыт, в котором какой-либо УС (УС-1) всегда сочетается с подкреплением и вызывает, например, слюноотделение. Затем некий второй УС (УС-2) многократно применяется вместе с УС-1 (без сочетания с безусловным раздражением). Если после этого применить только УС-2, можно убедиться, что он также вызывает условную реакцию. Это явление было названо условным рефлексом второго порядка.
Несколько отличается от описанного другой опыт, который также показывает, что для формирования УР подача подкрепления не всегда обязательна. Если два УС предъявлять животному совместно (УС-1 + УС-2) много раз еще до применения безусловного стимула, а затем предлагать только сочетание УС-1 и безусловного раздражения, то затем условная реакция проявится при даче одного лишь УС-2. Таким образом, хотя УС-2 никогда сам по себе не подкреплялся, между УС-1 и УС-2 сформировалась связь, которая позволила проявиться условной реакции при действии только УС-2. Процесс формирования связи между индифферентными раздражителями иногда называют сенсорным предобуславливанием {sensory preconditioning, Мак-Фарленд, 1987). Вряд ли это можно считать правильным, потому что обнаружить наличие подобной связи можно лишь с помощью соответствующего тестирования тАФ путем выявления реакции на второй индифферентный стимул.
На основе огромного опыта изучения условных рефлексов у собак И. П. Павлов и его ученики создали учение о высшей нервной деятельности.
Оно базировалось на ряде постулатов, которые довольно хорошо соответствовали накопленным к тому времени экспериментальным данным. Концепция Павлова содержала следующие положения:
высшая нервная деятельность (т.е. образование условных рефлексов) есть результат взаимодействия двух основных нервных процессов тАФ возбуждения и торможения;
при действии УС в коре головного мозга формируется очаг возбуждения;
из этого очага возбуждение иррадиирует (распространяется) по коре; внешнее проявление иррадиации возбуждения тАФ процесс генерализации, т.е. появление УР не только на данный стимул, но и на близкие к нему по параметрам раздражители (например, не только на звуковой тон определенной высоты, который использовался при обучении, но и на другие звуки близких диапазонов) (см. рис. 3.2Б);
свойством генерализации обладает и тормозный процесс;
очаги возбуждения и торможения обладают свойством отрицательной индукции, благодаря которому на периферии очага возбуждения в коре появляется очаг торможения (таким же свойством обладают очаги торможения);
процессы возбуждения и торможения взаимодействуют на основе не только их иррадиации, но и концентрации; если иррадиации нервных процессов соответствует явление генерализации, то концентрация процесса возбуждения проявляется в формировании дифференцировочных условных рефлексов (см. 3.3);
формирование УР заключается в образовании связи между двумя очагами возбуждения, вызванными условным и безусловным раздражителями.
Фундаментальное значение открытия И. П. Павловым условных рефлексов заключается в том, что такой вид психической активности, как ассоциативное обучение, стал предметом экспериментальных физиологических исследований (ранее психологи изучали его только на основе интроспективных заключений).
Павловская концепция физиологии высшей нервной деятельности логично описывала полученные в тот период и теми методами экспериментальные данные. Она сыграла большую роль в науке, объясняя механизм формирования целого ряда сложных поведенческих реакций. Однако постепенно, с расширением методической базы, а также с переходом к экспериментам на других животных, стала очевидной ее ограниченная применимость для объяснения многих фактов, прежде всего потому, что упомянутые закономерности нервных процессов далеко не всегда подтверждались прямыми нейрофизиологическими исследованиями функций головного мозга. Так, например, представления об иррадиации и концентрации нервных процессов не подтвердились при использовании в качестве моделей других УР. В настоящее время отдельные ученые продолжают использовать положения павловской концепции при трактовке результатов изучения высшей нервной деятельности, получаемых традиционными методами павловской школы. В этом нет ничего парадоксального, так как в любой теории, прошедшей проверку временем, основная идея сохраняется.
Сущность павловского учения составляет идея об условных рефлексах как элементарной единице приспособительной деятельности. Методологический подход к изучению высшей нервной деятельности базируется на четырех принципах: детерминизм, анализ и синтез, приуроченность функции к структуре.
Ассоциативное обучение, включающее классические и инструментальные условные рефлексы, интенсивно исследовалось на протяжении всего XX века. Рассмотрим более подробно основные типы условных рефлексов.
2.2.2. Классические условные рефлексы
Условнорефлекторное слюноотделение, которому уделялось основное внимание в лаборатории Павлова, относится к классическим УР.
При выработке классического УР последовательность событий в опыте никак не зависит от поведения животного. Она устанавливается либо экспериментатором, либо специальной программой, в соответствии с которой включаются те или иные стимулы, в ответ на них можно наблюдать образование условных реакций.
В настоящее время в связи с использованием разнообразных экспериментальных животных (не только традиционных собак), а также благодаря разнообразным методам регистрации изучаемых реакций на смену павловской методике классических слюнных УР пришли другие, более удобные лабораторные модели, которые продолжают быть предметом многочисленных исследований (см. также Мак-Фарленд, 1987; Реагсе, 1998).
Разнообразные классические условнорефлекторные реакции можно наблюдать в экспериментах на животных, если проводить полиграфическую регистрацию ряда физиологических процессов организма (ЭКГ, ЭЭГ, плетизмог-рамму и др.). Как и в случае слюнного рефлекса, сочетание положительного (например, пищевого) безусловного раздражения с нейтральным приведет к тому, что последний начнет вызывать изменения в вегетативных функциях организма, которые до этого провоцировались только непосредственно самим безусловным воздействием. Полиграфическая регистрация обычно используется при изучении отрицательных (аверсивных) классических УР. Много работ такого рода проводится также для оценки реактивности нервной системы к действию стрессорных агентов и ее устойчивости к стрессу.
В настоящее время классические УР наиболее часто исследуют на моделях, использующих вкусовое отвращение и реакцию третьего века (мигательной перепонки).
Было, например, обнаружено, что классические УР образуются с разной скоростью в зависимости от того, какие физиологические системы вовлечены в их формирование. Так, УР избегания пищевого яда у крыс (как правило, используют хлорид лития) формируется легко, если введение его в организм сочетается с предложением животному пищи определенного вкуса. Однако УР избегания яда формируется с трудом или не образуется совсем, если его введение сочетается, например, со звуковым раздражением. На схеме (рис. 3.3) показано, как авторы (Garcia et al., 1970) представляют себе гипотетический механизм формирования такого УР вкусового отвращения. Вкусовой стимул, сочетающийся с пищевым отравлением, ведет к образованию УР вкусового отвращения. При сочетании звука с ударом тока образуется УР на боль. В то же время иное сочетание, например вкусового и болевого стимулов, не ведет к образованию УР.
Классический УР тАФ сокращение мигательной перепонки при действии тактильного или звукового УС тАФ обычно изучают на кроликах. При действии на роговицу глаза безусловного раздражителя тАФ воздушной струи (или слабого удара тока) тАФ мигательная перепонка сокращается. Это сокращение можно регистрировать специальным прибором и оценивать его интенсивность. Если безусловное раздражение сочетать с каким-либо нейтральным стимулом, например звуком, то после нескольких сочетаний мигательная перепонка будет сокращаться уже при изолированном действии этого звука, который становится условным сигналом (см. рис. 2).
Рис. 3. Схема, показывающая избирательность ассоциаций между УС и подкреплением при формировании классических УР.
Стимулы | Последствия | |
рвота | боль | |
Сладкий вкус | формирование УР вкусового отвращения | УР не формируется |
Щелчок | УР не формируется | Формирование оборонительного УР |
2.2.3. Инструментальные условные рефлексы (или обучение методом проб и ошибок)
Начало исследований инструментальных УР связано с именем Э. Торндайка (см. 4.1), хотя их анализ проводился и в лаборатории И. П. Павлова.
В лаборатории И. П. Павлова ВлклассическиеВ» УР носили название условных рефлексов 1-го рода, а инструментальные тАФ условных рефлексов 2-го рода. В монографии Ю. Конорски (1969) на большом экспериментальном материале дается анализ сходства и различия между ними.
В опытах с Влпроблемными ящикамиВ» Торндайк наблюдал, как посаженная в ящик кошка ищет выход, пытаясь открыть дверцу разными способами (рис. 3.4А) (для этого нужно было нажать на задвижку или потянуть за пружину). Кошка сначала совершает много разных действий (проб), которые в своем большинстве бывают неверными (ошибки), пока случайно не откроет яшик. При повторении опытов она выходит из ящика все быстрее и быстрее. Идея эксперимента была подсказана Торндайку К. Ллойдом-Морганом, наблюдавшим, как его собака манипулирует с задвижкой калитки, чтобы ВлулизнутьВ» из дома (рис. 3.5). Такое обучение Торндайк и назвал Влметодом проб и ошибокВ». В дальнейшем обучение животного подобным действиям получило название инструментальных (или оперантных) УР.
Торндайк первым предложил количественную оценку динамики обучения животного инструментальному навыку. Для этого он ввел так называемые Влкривые наученияВ», примеры которых приведены на рис. 4Б.
Между классическими и инструментальными УР существуют определенные различия.
Рис. 4. Инструментальные УР.
А тАФ один из вариантов Влпроблемного ящикаВ», предложенный Э. Торндайком для исследования способности животного к решению.задачи методом Влпроб и ошибокВ»; Б тАФ примеры кривых научения при использовании этого метода. По оси ординат тАФ время, затраченное на решение задачи, по оси абсцисс тАФ последовательные предъявления теста.
При классических УР временная связь между условным сигналом и безусловной реакцией возникает непроизвольно при действии безусловного раздражителя (подкрепления).
При инструментальных УР подкрепление, например пища, дается только после того, как животное совершает определенное действие, которое не имеет прямой связи с безусловным раздражителем.
В классическом УР выделение слюны происходит в ответ на контакт пищи с рецепторами полости рта, и эта реакция может стать услов-норефлекторной. В отличие от этого при выработке инструментального УР пищевое подкрепление изначально никак не связано ни с протягиванием лапы, ни с побежкой в лабиринте. Однако мы можем давать животному пищу сразу после того, как оно сделало такое движение, и вскоре животное будет его совершать, чтобы получить подкрепление.
К категории инструментальных УР относится формирование навыка нажатия на рычаг (или клевания кнопки, как на рис. 3.6) для получения порции пищи. После работ Б.Скиннера этот УР стал основным в исследованиях бихевиористов (анализ связей Влстимул-реакцияВ»). К инструментальным УР относится также обучение подопытного животного находить путь к пище или избегать неприятных стимулов в лабиринте. Инструментальным УР является и реакция избегания тАФ навык переходить в тот отсек экспериментальной камеры, где отсутствует болевое подкрепление (рис. 7).
Рис. 5. Рисунок, сделанный по фотографии ВлисторическогоВ» эпизода. Собака К. Л. Моргана научилась открывать задвижку калитки, получая тем самым возможность Влобрести свободуВ». Эта ситуация считается прототипом торндайковского Влпроблемного ящикаВ».
Рис. 6. Камера Б. Скиннера для обучения голубей.
В верхней части левой стенки камеры размещены 3 диска-ВлключаВ». Они различаются не только по положению, но и по цвету лампочки, которая загорается за каждым из них. В кормушку (ниже) подают подкрепление. Клевание ключа (или, например, каждое 5-е клевание) автоматически подает зерно в кормушку.
Рис. 7. Челночные камеры для исследования у лабораторных крыс и мышей реакции активного избегания.
А тАФ современная установка для изучения условной реакции активного избегания, которая обычно состоит из 4 челночных камер с автоматизированным управлением и выводом результатов на экран монитора; Б тАФ отдельная челночная камера.
Включению тока предшествует включение УС тАФ звука или света. Чтобы избежать болевого воздействия, животное перебегает в другую половину камеры. По прошествии небольшого периода времени (как правило, его длину варьируют, чтобы не вырабатывать у животного УР на время) ток включают в той половине камеры, куда оно перед этим перебежало. УР считается выполненным, если животное перебегает в безопасную половину камеры во время действия УС и до включения тока.
Обширные исследования, выполненные сторонниками идей бихевиоризма, привели к появлению целого ряда новых терминов и понятий и созданию специфического языка для описания закономерностей процесса обучения, обнаруженных только благодаря примененным ими подходам. Многие термины сначала использовались как чисто технические тАФ для объективного описания данных (знакомство с ними может помочь при чтении научных статей бихевиористов). К таким терминам, в частности, относятся:
оперантное поведение тАФ спонтанные действия, не вызванные каким-либо очевидным стимулом;
реактивное поведение тАФ всякое поведение, которое совершается в ответ на определенный стимул;
режим подкрепления (reinforcement schedule): соотношение числа реакций (например, нажатий на рычаг) и вознаграждений (например, кусочков пищи; подробнее см. ниже);
постоянный (или переменный) интервал (fixed or variable interval) тАФ
вознаграждение дается через определенные интервалы времени, в период которых животное может осуществлять двигательные реакции (эти интервалы могут быть постоянными или варьировать по длительности), но по истечении этого интервата подкрепляется только первая реакция;
фиксированное (или переменное) соотношение (fixed ratio or variable ratio) тАФ подкрепление дается животному только после того, как оно произведет какое-то количество реакций (нажатий или клеваний. Можно давать подкрепление только после определенного числа реакций (фиксированное соотношение) или это число может каким-то образом варьировать (переменное соотношение);
смежность (contiguity) тАФ этим термином обозначают постулируемое возникновение связей между стимулами и возникающими на их основе реакциями, а также совпадение УС с реакцией животного или УС с подкреплением, которое необходимо для возникновения УР;
ключ (сие) тАФ обычно это либо рычаг, на который нажимает крыса, либо освещенный кружок, по которому наносит удар клювом голубь (этот термин, обычный для работ бихевиористов, не следует путать с термином Влключевой стимулВ», принятым в этологии для обозначения видоспецифических стимулов, вызывающих инстинктивные реакции (см. 2.11).
На рис. 6 схематически изображена камера для выработки инструментальных УР у голубей. Скиннер считал, что любое поведение, относящееся к категории ВлоперантноеВ», можно модифицировать, если при его выполнении давать животному подкрепление. Именно такой подход он предложил как эффективный способ анализа поведения. Если для выработки классических УР необходимы сочетания условных сигналов и подкрепления, то при методике свободного оперантно-го поведения, предложенной Скиннером, экспериментатор сопровождает подкреплением выполнение животным только определенного, намеченного им действия.
Например, крысу можно обучить нажимать на рычаг, если сначала сопровождать подкреплением любые ее действия в той части камеры, где он находится. Постепенно крыса обучается держаться вблизи рычага, и тогда подкрепление дают только, если она касается рычага мордой или лапой (для этого иногда на рычаг даже кладут пишу). Через некоторое время подкрепление дается только после выполнения четких движений тАФ нажатий (одного или нескольких) лапой на рычаг.
Такое постепенное видоизменение поведения животного в результате вмешательства экспериментатора называется методом последовательного приближения или формированием (shaping) поведения.
Деление условных рефлексов на классические и инструментальные, удобное методически, не означает, что они имеют совершенно разную природу. В их основе лежат сходные нейрофизиологические механизмы, а любое ВлчистоВ» инструментальное действие животного всегда сопровождается реакцией, которая относится к классическим УР. И наоборот, в любом ВлчистоВ» классическом УР можно обнаружить двигательный компонент, который по своим свойствам относится к инструментальным (Борукаев, 1982).
О связи классических и инструментальных УР свидетельствует также ВлсамоформированиеВ» условной реакции {autoshaping). Например, если голодного голубя поместить в камеру Скиннера и в течение 5 с освещать ключ для клевания с интервалом в 1 мин, а после прекращения освещения давать порцию пиши, то голубь сначала не обращает внимания на ключ. Однако после нескольких таких сеансов формируется инструментальная реакция, и он быстро начинает клевать ключ независимо от освещения. Постепенно голубь научается клевать ключ только при его освещении, т.е. реакция становится более точной тАФ она самоформируется. В данном случае она очень близка к классическому УР, поскольку голубь клюет ключ как бы вместо зерна, даже в отсутствие подкрепления.
С помощью метода Влпоследовательного приближенияВ» у животных удается сформировать не только клевание ключа при его освещении, но и самые разнообразные, сложные и иногда неожиданные навыки. В опытах Скиннера голуби ВлигралиВ» в пинг-понг, а крысы могли подтянуть к себе с помощью бечевки бильярдный шар, взять его в передние лапы и засунуть в трубку, расположенную на 5 см выше пола клетки (описание экспериментов П. Эпштейна, посвященных формированию сложных навыков у голубей, будет дано в гл. 4.8.2).
Метод последовательного приближения составляет основу дрессировки цирковых и служебных животных. Примером продуктивного использования принципов бихевиоризма, и в частности роли метода последовательного приближения в формировании поведения, является работа знаменитой американской дрессировщицы дельфинов и психолога К. Прайор(1995).
Тезис Скиннера о том, что любые движения, на которые способно животное данного вида, равновероятно можно использовать для инструментального научения, был достаточно обоснованно подвергнут сомнению в работе его коллег - К. и М. Бреландов (Breland, Breland, 1961). Некоторые виды животных при обучении манипуляциям с предметами производят ВлзаданныеВ» экспериментатором действия только после выполнения некоторых врожденных (инстинктивных) действий либо совсем не могут им научиться. Так, например, обучая енота нажимать на рычаг, Бреланды заметили, что нажатию предшествует видоспецифи-ческое движение лап тАФ ВлполосканиеВ», характерное для этого вида при добыче пищи из ручья (за что енота и называют ВлполоскунВ»). На основании таких наблюдений возникло представление о предрасположенности к определенным видам обучения (подробнее см.: Зорина и др., 1999).
Образование инструментальных УР по механизму Влпоследовательного приближенияВ» играет важную роль в организации поведения животных не только в эксперименте, но и в естественных условиях.
Обучение по методу последовательного приближения может происходить самым неожиданным образом. Об этом, в частности, свидетельствует получившая широкую известность в начале XX века история Влумного ГансаВ». Это был конь, который демонстрировал способность ВлсчитатьВ», ВлскладыватьВ», Влизвлекать корниВ», отвечать на вопросы и т.п. (рис. 3.8). Столь ВлразумноеВ» поведение объяснялось тем, что конь научился замечать малоуловимые движения дрессировщика, которые тот непроизвольно совершал, видя, что конь вот-вот даст правильный ответ. Ориентируясь на эти условные сигналы, конь в нужный момент прекращал стучать копытом.
Рис. 8. Инструментальные условные рефлексы у дрессированной лошади Влумного ГансаВ». На фотографии видно, как ударами копыта по специальной доске Ганс сигнализировал ВлправильныйВ» ответ (по Н. Н. Ладыгиной-Котс, 1914).
В начале XX века (1900тАФ1904) барон В. фон Остен, убежденный в огромных умственных способностях лошадей, обучал нескольких из них различению цветов, азбуке и ВлсчетуВ». Узнавание каждой буквы или цифры лошадь обозначала соответствующим числом ударов копыта. Друг фон Остена художник Редлих обучил таким же образом свою собаку. Наиболее способным учеником оказался орловский рысак Ганс, который производил достаточно сложные арифметические подсчеты, отвечал на разнообразные вопросы, а иногда высказывался по собственной инициативе. Так, супруги Н. Н. и А. Ф. Котс, специально приехавшие для знакомства с ним в 1913 году, рассказывали, что после нескольких относительно коротких ответов на вопросы Ганс заявил: ВлВ поле я встретил милую госпожу Краль, которая меня кормилаВ».
Поведение его было столь впечатляющим, что вводило в заблуждение не только публику, но даже членов специальных комиссий, включая Н. Н. Лады-гину-Котс. Предполагали, что хозяин подает коню некие скрытые сигналы (как дрессировщик тАФ цирковым животным), однако его обследовали 13 экспертов (комиссия психолога К. Штумпфа) и не обнаружили никакого обмана. Они засвидетельствовали, что Ганс действительно ВлсчитаетВ» и никаких скрытых сигналов ему не подают. И лишь много позднее наблюдатели постепенно заметили, что Ганс отвечает только на те вопросы, ответ на которые знает сам экспериментатор. Специальный анализ, проведенный психологом О. Пфунгстом, показал, что животное реагирует на мельчайшие непроизвольные (идеомоторные) движения экспериментатора, например на отклонения корпуса на 2 мм, микродвижения бровей, мимику и т.п. Эта невольная подача сигналов происходила, по-видимому, из-за эмоционального напряжения человека, по мере того как число ударов копытом приближалось к искомому, Даже картонный щит, которым пробовал отгородиться от Ганса экспериментатор, не помогал: животное все равно улавливало какие-то только ему понятные знаки для определения правильного ответа.
Для проверки своего предположения Пфунгст специально научил Ганса реагировать на микродвижения, которые он совершал уже сознательно, и продемонстрировал комиссии механизм и природу Влматематических способностейВ» этой лошади.
История Влумного ГансаВ» оставила заметный след в развитии науки о поведении животных:
Вместе с этим смотрят:
Cигнальные пути клеток в онтогенезе животных
Oбыкновенная чесночница (Pelobates fuscus)