загрузка...
 
24.2. СКОЛЬКО ВИДОВ ОБУЧЕНИЯ СУЩЕСТВУЕТ?
Повернутись до змісту

24.2. СКОЛЬКО ВИДОВ ОБУЧЕНИЯ СУЩЕСТВУЕТ?

Говоря о собственном поведении, мы относим к обучению самые разные процессы. Учимся ли мы ездить на велосипеде или оценивать расстояние, заучиваем ли наизусть стихотворение, обучаемся ли переводить с французского, запоминаем ли дорогу к дому — все это мы называем «обучением». По крайней мере на поведенческом уровне анализа процессы, которые мы объединяем понятием «обучение», действительно многообразны. Разнообразие процессов обучения становится еще заметнее, если сравнить различных животных — опи приходят к одинаковым результатам самыми разными способами. Даже у одного и того же животного могут развиться самостоятельные системы памяти. Так, у осьминога зрительная и тактильная память зависит от анатомически обособленных отделов мозга [2660]. Тем не менее было затрачено много усилий, чтобы свести все многообразие примеров обучения к одному-двум основным типам. В какой-то мере это проблема уровня, на котором проводится анализ. Каким бы разнообразием ни отличалось обучение на уровне поведения, на субклеточном уровне оно, возможно, зависит от одних и тех же процессов. Однако, поскольку наши знания об этих процессах очень ограниченны, а обучение обычно определяется по чисто поведенческим реакциям, необходимо оценить разнообразие видов обучения именно на поведенческом уровне.

Кратковременное и долговременное хранение следов памяти

Прежде всего отметим, что обычно проводят разграничение между процессами кратковременного и долговременного (постоянного) хранения следов памяти. Отчасти это разграничение основано на клинических наблюдениях: у человека, перенесшего контузию, память о событиях, непосредственно предшествовавших несчастному случаю, утрачивается, а более ранние впечатления сохраняются. Аналогичные факты были получены и в лаборатории. При выработке условнорефлекторного избегания крысам через разные промежутки времени после каждой попытки наносили сильное электрическое раздражение. Животные, получавшие раздражение через несколько минут после очередной пробы, впоследствии выполняли тест гораздо хуже, чем крысы, получавшие раздражение с большим отставлением [435, 617, 786, 1598]. Сходные эффекты были обнаружены при некоторых других воздействиях, например при действии ряда наркотических препаратов, при «распространяющейся депрессии» корковой активности и других.

Такие данные, по мнению ряда авторов, подтверждают точку зрения, согласно которой подобные воздействия затрагивают в первую очередь восприимчивую к ним систему кратковременного хранения следов памяти (система «кратковременной памяти»). В долговременную память, которая гораздо более устойчива, информация откладывается в более поздние промежутки времени. Поэтому полагают, что указанные воздействия, разрушая кратковременную память, тем самым предотвращают переход информации в долговременную память.

Считается, что кратковременное запоминание отличается от еще более кратковременного перцептивного следа, который исчезает примерно в течение Уг с. Чтобы запоминаемая информация впоследствии оказалась доступной для воспроизведения в процессе припоминания, испытуемый, как было показано, должен отреагировать на нее или во время ее предъявления, пли не позднее Уг с после предъявления [87, 1623]. Принято считать, что кратковременная память отличается также от долговременной. В частности, считают, что кратковременная система, помимо чувствительности к перечисленным выше воздействиям, связана с такой активностью нейронных механизмов, которая со временем затухает сама собой. Напротив, долговременная система запоминания, как полагают, полностью или почти полностью неизменяема, и сохраняемые в ней ассоциации устойчивы даже в отсутствие припоминания. Принято считать, что консолидации следов в долговременной памяти предшествует кратковременная нейронная активность [973]. Бродбент [329] подчеркнул, что емкость механизмов кратковременной памяти ограниченна, и если скорость поступления информации превысит некоторый уровень, то происходит перегрузка; долговременная же память обладает практически неограниченной емкостью. Бродбент (см., например, [330]) считает, кроме того, что па кратковременную память могут воздействовать любые факторы, отвлекающие внимание, тогда как действие на долговременную память информации, предъявляемой между обучением и воспоминанием, зависит от природы этой информации.

Данные, позволяющие говорить о существовании раздельных механизмов кратковременной и долговременной памяти, первоначально были получены в исследованиях на крысах и людях. Однако данные некоторых экспериментов, проведенных на осьминогах, показывают, что этот вывод, по-видимому, справедлив не только для позвоночных. Уэллс [2549] показал, что ослепленный осьминог очень быстро научается отвергать несъедобные объекты, пользуясь тактильной информацией. Если такой объект предъявляют раз за разом в серии тестов, причем осьминог может ощупывать объект только одним щупальцем, то впоследствии только одно это щупальце и будет его отвергать. Однако, если объект предъявлять реже, этот эффект переносится и на другие, «не работавшие» щупальца. По мнению Уэллса [2549], должно пройти некоторое время, чтобы изменения, вызванные обучением одной из конечностей, могли передаться через надглоточные доли мозга на другие конечности.

Хотя по некоторым соображениям выделение кратковременной и долговременной памяти, несомненно, часто бывает полезным, при этом возникает ряд затруднений. Во-первых, по данным разных исследований, время после обучения, в течение которого экспериментальные воздействия все еще могут нарушить запоминание, сильно различается. Это время отчасти зависит от продолжительности и интенсивности электрического раздражения. Так, Алнерн и Мак- гаух [23] обнаружили, что удар электрическим током продолжительностью 0,2 с ухудшает память, только если он наносится сразу же после обучения; в то же время удар длительностью 0,8 с вызывает такой эффект и через 3 ч. Влияние таких воздействий на память может зависеть и от природы самого воздействия. Известно, что углекислый газ вызывает описанный эффект в течение более длительного времени, чем электрический ток [1341, 1893]. Отсюда следует, что различные факторы, вероятно, действуют по-разному, и это затрудняет задачу отыскания единого процесса переноса информации из одного «хранилища» памяти в другое.

Во-вторых, не до конца понятен характер действия электрического раздражения. Предполагалось, например, что оно порождает конфликт [463], вызывая конкуренцию условных рефлексов, или же действует по типу павловского торможения [1512, 1513]. Хотя известно, что именно сам факт нанесения электрического раздражения, а не сопровождающие его судороги вызывает амнезию [1260, 1478], весьма возможно, что удар электрическим током вызывает амнезию на события, имевшие место не более 10 с назад, тогда как долговременные эффекты обусловлены другими последствиями повторяющегося воздействия элоктрического раздражения [434, 15141.

В-третьих, пока еще далеко не ясно, нарушают ли эти экспериментальные воздействия только систему запоминания или они в равной степени могут затрагивать и механизм вспоминания. Как указывает Вейскранц [2532], необходимы дополнительные исследования, в которых время между воздействием и тестом на запоминание изменялось бы. Если по мере увеличения иптервала хранение памяти будет улучшаться, это послужит убедительным доказательством того, что были затронуты механизмы воспроизведения.

Наконец, результаты многих исследований, в частности некоторых экспериментов по запоминанию вербального материала взрослыми испытуемыми, свидетельствуют о том, что между двумя этими видами памяти едва ли существуют четкие границы [1695], т. е. что консолидация следов памяти протекает в несколько этапов [149]. Поэтому вопрос о ценности концепции кратковременной памяти все еще остается открытым.

Классический и инструментальный (оперантный) условные рефлексы

Большинство специалистов по обучению работали только с одним или двумя видами животных, причем некоторые исходили иа предположения, что все разнообразие обучения можно свести к одному типу. Так, Уотсон [2512] и Газри [886] использовали единственный принцип выработки условных рефлексов, или ассоциативного обучения, который имеет общие черты с павловским методом выработки условных рефлексов. О единственном типе обучения говорил также Халл [1185, 1186]. Тем,не менее, вводя различные промежуточные переменные, он смог описать крайне разнообразные поведенческие феномены.

Однако обучение обычно принято исследовать в снтуациях двух различных типов, в связи с чем постулируют существование двух основных форм обучения [1387, 1631, 2125]. Рассмотрим, например, различие между выработкой классического условного рефлекса и выработкой оперантного условного рефлекса по Скиннеру [2225, 2227]. Прежде всего Скиннер выделил два типа реакций: одни из них сразу же вызываются самыми обычными раздражителями (респонденты), а другие до выработки условного рефлекса могут быть не связаны с каким-либо определенным раздражителем (операнты). Например, коленный рефлекс— это респондент; реакция нажатия на рычаг — оперант. Скиннер связывает такое различие двух типов реакций с разными механизмами образования условных рефлексов.

Считается, что на базе реакций типа респондентов вырабатываются классические, или павловские, условные рефлексы. Так, вид пищи вызывает у голодного животного слюноотделение. В этом случае образование условного рефлекса зависит от установления временной связи между раздражителем, который ранее не вызывал слюноотделения (например, звук), и безусловным раздражителем (пища). Повторение такого сочетания раздражителей приводит к тому, что реакцию слюноотделения будет вызывать только звук. Характер условной реакции определяется выбором безусловного раздражителя.

Если же условная реакция не имеет связи с вызывающим ее безусловным раздражителем, то в таком случае мы имеем дело с инструментальным, или оперантньш, условным рефлексом.

В данном же случае выбор реакции определяется не вызывающим ее раздражителем, а установлением временной последовательности между реакцией, выполняемой животным время от времени в данной ситуации, и подкрепляющим раздражителем. Положим, мы хотим выработать у голодного животного реакцию нажатия на рычаг прн предъявлении звукового раздражителя. Разумеется, ни звук, ни пища не вызывают обычно нажатия на рычаг. Но если однажды эта реакция будет выполнена при включенном звуке, а за нею сразу же последует пищевое подкрепление, то вероятность того, что животное вновь нажмет на рычаг, увеличится.

Хотя временная последовательность, в которой звук приводит к реакции нажатия на рычаг, аналогична той, в которой звук вызывает слюноотделение, формирование двух этих связей требует совершенно различных процессов. Поскольку оперантная реакция направлена па окружающую среду, такую условную реакцию называют «инструментальным условным рефлексом». Поведенческие реакции, которые должны привести к вознаграждению, могут быть самыми разными, например это может быть побежка в лабирипте. Отметим, что различие между классическими и инструментальными условными рефлексами проводится прежде всего на уровне различия в методике их выработки; вопрос же о том, до какой степени различаются внут
ренние процессы, лежащие в основе формирования этих реакций, остается пока открытым ([1038, 1989]; см. также разд. 24.3).

Исследование Гриндли [865] на морских свинках было одним из первых, в которых у животных вырабатывались инструментальные рефлексы. Всякий раз как в экспериментальной ситуации животное выполняло в момент звукового сигнала какое-то движение (например, поворачивало голову), оно вознаграждалось пищей. Впоследствии эти подкреплявшиеся движения в обстановке эксперимента появлялись чаще. Таким образом, раздражители, сигнализирующие о наличии экспериментальной ситуации, приводят к выполнению определенной реакции, но они вызывают эту реакцию совсем по-иному, нежели, скажем, свет вызывает сокращение зрачка.

Скиннер [2225] разработал схему экспериментов и экспериментальную установку, в которой животные могли осуществлять вполне доступные для них реакции: крысы нажимали на рычаг, а голуби клевали диск. Подкрепление давалось либо после каждой реакции, либо по заданному режиму. В последнем случае подкреплялась, например, каждая п-я реакция или каждая первая реакция через и с после предыдущей реакции или подкрепления. Такой «режим подкрепления» (см. [696]) сильно влияет на частоту и характер последующих реакций (рис. 184). Отсутствие подкрепления приводит к уменьшению частоты реакции (т. е. к угашению). Частота и характер реакции при угашении сильно зависят от первоначального режима подкрепления; в общем если во время обучения режим подкрепления таков, что переход к условиям угашения не очень заметен, то угашение будет происходить довольно медленно. Однако следует отметить, что утверждение, согласно которому частота реакций при угашении всегда непосредственно зависит от сходства условий подкрепления при обучении и угашении, не доказано однозначно (см., например, [1316]).

Разграничение между классическим и оперантным условными рефлексами подчеркивает методические различия в их выработке. Однако не следует думать, что зти рефлексы формируются непременно независимо друг от друга. Например, во многих ситуациях при образовании классического условного рефлекса изучаемая реакция (например, слюноотделение) сопровождается также реакцией со стороны скелетных мышц, которая может стать условной по схеме оперантных реакций; в тех случаях, когда такие реакции скелетных мышц отсутствуют, выработать условный рефлекс оказывается делом чрезвычайно сложным, хотя это иногда и удавалось [2250, 2656]. И наоборот, во многих случаях выработка инструментальной реакции сопровождается классическим условным рефлексом. Эллисон и Конорский [650] смогли, однако, продемонстрировать независимость инструментальной реакции от классического условного рефлекса. В их опыте собака должна была до тех пор реагировать на первый раздражитель, пока не предъявлялся второй, за которым следовало пищевое подкрепление. Оказалось, что первый раздражитель вызывал инструментальную реакцию, не сопровождавшуюся слюноотделением, тогда как второй вызывал слюноотделение. Так удалось разделить инструментальную и классическую условные реакции.

Вторая проблема, возникающая при сопоставлении классических и инструментальных реакций, касается их связи с висцеральными реакциями и реакциями скелетных мышц. Раньше считалось, что классическая методика применима к первым реакциям, а оперант- ная — ко вторым. Если бы висцеральные реакции можно было сделать условнорефлекторными только путем выработки классического условного рефлекса, то это означало бы, что их можно выработать и поддерживать только с помощью раздражителей, которые вызывали раньше такой же висцеральный ответ. Если бы их можно было сделать инструментальными, то в таком случае их можно было бы и выработать, и поддерживать различными способами. Итак, рассматриваемая проблему имеет большое значение. Миллер [1746] неоднократно пытался опровергнуть распространенную в свое время точку зрения о невозможности выработки висцеральных инструментальных реакций, и целый ряд работ, вышедших недавно из его лаборатории, подтверждает его правоту. Так, было показано, что если у собак, испытывающих жажду, подкреплять водой возникающее время от времени спонтанное слюпоотделение, то происходит постепенное его увеличение, тогда как у собак, вознаграждаемых в моменты отсутствия слюноотделения, оно постепенно уменьшается (рис. 175). Исследование корреляции, проведенное в этом эксперименте, исключает возможность какой-либо реакции со стороны скелетных мышц, которая могла бы играть роль опосредующего механизма [1748]. Еще более показательные результаты получены в работе, в которой использовалась частота сердечных сокращений [2426]. Крыс обучили нажимать на рычаг, причем подкреплением служило электрическое раздражение мозга (см. разд. 9.4 и 12.2). Затем мозг раздражали либо при относительно высокой, либо при относительно низкой частоте сердечных сокращений. Было отмечено соответственное увеличение или уменьшение частоты сердечных сокращений. Поскольку эксперименты проводились на кураризированиых животных, возможность опосредования реакции через скелетную мускулатуру полностью исключалась. В этом эксперименте изменение частоты сердечных сокращений было довольно небольшим, но в другой работе [1749] удалось показать, что, давая подкрепление только при все большем изменении частоты сердечных сокращений, можно изменить ее почти на 20% (рис. 174). Крыс обучали также реагировать изменением частоты сердечных сокращений на разные условные сигналы. В дальнейшем Миллер [1747] и его сотрудники (см. также [584]) показали, что ипструментальное обучение возможно для многих висцеральных реакций, таких, как частота сердечных сокращений, перистальтика кишечника, артериальное давление, образование мочи и общий характер ЭЭГ.

Следует отметить, что различие между скелетной и висцеральной мускулатурой с эмбриологической и филогенетической точек зрения далеко не так абсолютно, как может показаться (см., например, [820]). Например, значительная часть жаберной мускулатуры рыб, хотя и напоминает по своей структуре скелетные мышцы, развивается подобно висцеральным мышцам из латеральной пластинки мезодермы.

Усредненные кривые инструментального обучения кураризировашшх крыс, подкрепляемых раздражением «центра удовольствия» при увеличении (III) или уменьшении (IV) частоты сердечных сокращений [1749].

С точки зрения эмбриологии маловероятно, чтобы регуляция активности этих систем при обучении осуществлялась различными механизмами.

Хотя выделение классических и инструментальных условных рефлексов оказалось очень полезным в лабораторных опытах, все еще существуют значительные разногласия по вопросу о том, насколько глубоки различия йежду ними. Во всяком случае, вряд ли такое четкое разделение существует в природе. В лабораторных экспериментах по выработке инструментальных реакций взаимосвязь между сигнальным раздражителем и оперантной реакцией первоначально отсутствует, тогда как в природе обычно имеется связь между раздражителем и соответствующей реакцией. Например, птенцы выводковых птиц клюют самые разнообразные предметы, контрастирующие с фоном. Хотя при этом им не сразу попадаются съедобные объекты,активность некоторое время сохраняется, что очень важно, поскольку в результате птенец впоследствии научается различать съедобное и несъедобное.

-Как подчеркивалось в гл. 22, все еще мало что известно о формировании и сохранении таких реакций у молодых животных, однако многие их особенности прояснились в результате исследования реакции лакания у взрослых крыс. Обычно эта реакция проявляется в виде ритмических серий, причем одна капля жидкости вызывает у крыс многочисленные лижущие движения. Частота этих движений в серии, по-видимому, не зависит от степени жажды или от концентрации предлагаемого раствора сахара. Однако эта частота возрастает с увеличением размера капли, снижается при неоднократных повторениях, и ее можно сделать условнорефлекторной по классическому методу выработки условного рефлекса. Все это позволяет рассматривать частоту лижущих движений в серии как вызванное поведение с характеристиками фазической реакции. Напротив, общая частота лижущих движений (включая и серии, и промежутки между ними) зависит и от степени жажды, и от концентрации сахара, и от режима подкрепления. Следовательно, эти характеристики питьевого поведения, так же как и первоначальное приближение к поилке, находятся под сильным контролем мотивационных факторов, связанных с актом глотания, и подчиняются они скорее всего закономерностям, которым подчиняется выработка инструментальных условных реакций. Очевидно, таким образом, что механизм контроля лакания у крыс можно до некоторой степени рассматривать как переплетение реакций типа респондентов и оперантов. Однако даже и в этом случае наблюдаются некоторые отклонения от того, чего следовало ожидать; так, частота лизания при режиме подкрепления с фиксированным отношением подкрепляемых и неподкрепляемых нажатий уменьшается в отличие от того, что наблюдается при гораздо чаще изучаемых реакциях клевания или нажатия на рычаг [1188, 1189]. Дальнейшие исследования такого рода раздражителей и реакций могли бы быть крайне интересны как для этологов, так и для специалистов в области теории обучения.

Толменовская концепция способностей (capacity laws)

Теоретики, о которых до сих пор шла речь, работали с небольшим числом видов животных. Если исходить из соображений экономности, то их попытки интерпретировать различные аспекты обучения с помощью ограниченного числа принципов выглядели весьма успешными. Однако по мере увеличения числа исследуемых видов разнородность феноменов обучения проступала более явственно. Об этой разнородности всегда следует помнить. Учитывая это, Толмен [2414, 2415] отказался от мысли классифицировать все многообразие типов обучения и предпринял попытку свести действия животных в более или менее стандартных ситуациях обучения к различным типам способностей к обучению. Ниже мы их перечисляем [1037]:

а)   формальная способность предвидеть результат собственных действий, т. е. способность ожидать появления раздражителя и действовать соответственно с этим;

б)   способность к различению и манипулированию;

в)   способность к сохранению опыта;

г)   способность предвидеть результат собственных действий, необходимая в случае альтернативного выбора в месте разветвления лабиринта, обходггых путей и т. д.;

д)   способность к формированию представлений, позволяющая, например, сравнивать альтернативные возможные пути решения задачи;

е)   «творческая гибкость».

Толмен рассматривал три типа экспериментов по обучению: выработку классических условных рефлексов; обучение методом проб и ошибок в лабиринте; «творческое» обучение. Затем он интерпретировал каждый из этих экспериментов, исходя из приведенной выше классификации способностей, природы предъявляемой информации п способа ее предъявления. Оказалось, что для интерпретации простейших случаев обучения требуется меньше «способностей», о которых говорит Толмен, чем для интерпретации более сложных случаев; так, для классических условных рефлексов требуются только первые чри типа способностей. Обучение методом проб и ошибок включает еще и четвертый тип, а в более сложных случаях оказывается необходимым пятый. Наконец, для творческого обучения необходима также «творческая гибкость».

Классификация типов обучения по Торпу

Торпу [2375] принадлежит обзор, наиболее полно охватывающий вопросы, связанные с обучением у животных; проблему многообразия типов обучения он решает по-своему. Торп использует описательный подход к классификации типов обучения и считает, что у различных видов могут быть и разные механизмы, ответственные за обучение; он оставляет открытым вопрос о том, в какой мере случаи однотипного обучения у представителей разных таксономических типов обусловлены сходными механизмами.

Привыкание

Привыкание определяется как «относительно устойчивое ослабление реакции вследствие многократного предъявления раздражителя без какого бы то ни было подкрепления». Кроме того, оно характеризуется специфичностью в отношении определенного раздражителя; относительная устойчивость привыкания отличает его от процессов утомления и сенсорной адаптации. Классический пример нривыкания дан в работе Хэмфри [1190], в которой описана реакция отдергивания щупальца улитки (Helix albolabris) на механическое раздражение; при многократном раздражении реакция постепенно затухает. Подобные реакции легко обнаружить у любого животного.

Определение Торпа вынуждает нас сделать три замечания. Во- первых, словосочетание «относительно устойчивое», несомненно, вводится для того, чтобы исключить явления кратковременного ослабления реактивности (гл. 13). Следует отметить, что термин «привыкание» часто используется физиологами для обозначения такого рода кратковременных эффектов. Так или иначе, между кратковременным и долговременным явлениями не всегда легко провести границу. Во-вторых, указание на «многократное предъявление раздражителя» отнюдь не исключает непрерывной стимуляции. В-третьих, ссылка на отсутствие подкрепления поднимает один из наиболее интересных вопросов в связи с явлением привыкания, но к этому мы вернемся позднее.

Между процессом привыкания и процессом угашеиия инструментальной реакции существует определенное сходство, поскольку в обоих случаях речь идет об ослаблении силы ответа. Различие между ними зависит главным образом от того, каким образом формировалась реакция первоначально, и возможно, что специалисты по обучению игнорировали ранее явление привыкания именно по этой причине. Однако нужно отметить, что при угашении животное никогда не получает подкрепления, тогда как привыканием называют иногда случаи ослабления реакции, не исключающие наличия подкрепления.

Ввиду того что привыкание, по крайней мере в простых случаях, приводит только к снижению интенсивности или числа реакций, Торп считает эту форму обучения простейшей. Ослабление реактивности (что соответствует формальному критерию привыкания), длящейся в течение нескольких дней, может быть обнаружено даже в случае рефлекторных реакций спинальных крыс [863]. Однако имеется два рода фактов, позволяющих предположить, что явление привыкания не столь просто, как это кажется на первый взгляд. Мы имеем в виду прежде всего полученные Соколовым [2247] данные по угашению ориентировочного рефлекса у собак (гл. 6). Эти факты укладываются в вышеприведенное определение привыкания, однако, по всей вероятности, связаны не только с уменьшением силы реакции, но и с какой-то перестройкой в центральной нервной системе. Пока неясно, возможно ли получить аналогичные результаты на животных с более простой организацией (на улитках, например), но весьма вероятно, что механизм, лежащий в основе привыкания, в значительной мере различается у животных различного филогенетического уровня. В любом случае не известно, как следует интерпретировать эти эксперименты Соколова (гл. 6).

Вторую группу фактов мы также обсуждали ранее. Исследование реакции окрикивания у зябликов показало, что она сопровождается
сложными изменениями, которые могут вызвать впоследствии как усиление, так и ослабление силы реакции, причем действие этих эффектов прекращается с разной скоростью (см. разд. 13.5 и 13.6). Если определить привыкание как ослабление реакции, то оно является результирующей этих процессов и, следовательно, совсем не так просто, как представлялось. С другой стороны, если считать, что к привыканию относятся только сравнительно длительпые процессы ослабления реактивности, то в этом случае его невозможно непосредственно измерить.

Эти замечания никоим образом не умаляют значения явлений, объединенных понятием «привыкание». Нам хотелось лишь подчеркнуть, что они гораздо сложнее, чем кажутся, и что в их основе могут лежать механизмы, сильно различающиеся по своей сложности. Связи привыкания на поведенческом уровне с нервными процессами малой длительности подробно обсуждаются Хорном и Хайндом (в печати).

Классический условный рефлекс

Известно, что образование условного рефлекса возможно просто в результате одновременной стимуляции двух зон коры ([604]; см., однако, [2476]). Кроме того, по-видимому, в процессе его выработки не обязательно и выполнение безусловной реакции; например, у собаки условнорефлекторное слюноотделение происходит, даже если в процессе выработки рефлекса слюноотделение на безусловный раздражитель блокировалось атропином [702], а условнорефлекторная реакция страха может быть выработана и у кураризированного животного [2250]. Бо всяком случае, Торп, как и многие другие авторы, считает, что классический условный рефлекс является искусственно изолированным фрагментом процесса обучения; он считает поэтому, что условный рефлекс едва ли может служить той фундаментальной единицей, из которой строятся более сложные процессы обучения. Он подчеркивает, что условный рефлекс представляет собой, во всяком случае, идеализированное понятие; что раздражители фактически никогда не бывают простыми, ибо высокоорганизованные животные всегда реагируют на ситуацию в целом, различая на ее фоне раздражитель, предъявляемый экспериментатором; что условная реакция в действительности всегда носит «предвосхищающий» характер, поскольку животное ведет себя так, словно оно «ожидает» предъявления безусловного раздражителя, а не просто «соединяет» безусловную реакцию с новым раздражителем.

И в самом деле общепринятая точка зрения на условный рефлекс приводит к упрощению. Условный рефлекс — это нечто большее, чем связь нового раздражителя с безусловной реакцией, поскольку условный ответ редко бывает полностью подобен безусловной реакции и может быть лишь ее фрагментом [1038]. В том случае, когда устраняются ограничения на передвижение животного (необходимые при выработке условных рефлексов), условно
рефлекторная реакция сопровождается поведением, которое кажется наблюдателю поиском безусловного раздражителя.

Наконец, то, что мы обычно называем условным рефлексом, может па самом деле скрывать под собой поведение различной степени сложности. Трудно не согласиться с тем, что условный рефлекс у кольчатых червей — ото не более чем изменение отношения стимул — реакция, однако вполне вероятно, что условнорефлекторное слюноотделение у человека — это не просто переключение связи, по процесс, связанный с гораздо более глубокой перестройкой поведения. Таким образом, как и в случае привыкания, образование классических условных рефлексов, определяемое на уровне поведения, охватывает весьма различающиеся по своей сложности изменения (см. также [1038, 2674]).

Обучение методом проб и ошибок

Торп определяет его как «наступающее в результате подкрепления поискового поведения образование ассоциации между раздражителем или ситуацией и независимым двигательным актом (являющимся фрагментом этого поискового поведения), когда и раздражитель, и двигательный акт предшествуют подкреплению, причем двигательный акт не обязательно является врожденной реакцией на подкрепление» [2375]. Классическим примером может служить обучение животных открывать проблемные ящики и совершать побежки в лабиринте. Торп считает, что обучение методом проб и ошибок всегда включает в себя выработку как классического, так и инструментального условного рефлекса. Он полагает, что инструментальное обучение в чистом виде является такой же искусственно изолированной частью всего процесса обучения, как. и классический условный рефлекс.

Поведение, объединенное под рубрикой обучения методом проб и ошибок, крайне разнообразно по своей сложности. Изменения, отвечающие большинству критериев этого типа обучения, обнаружены у обезглавленных тараканов и даже у фрагмента тела таракана, содержащего брюшной ганглий, пару конечностей и связанные с ними мышцы. Такой препарат помещался над водой таким образом, что если нога таракана была выпрямлена, то цепь замыкалась и через препарат проходил электрический ток. Через несколько минут нога сгибалась и некоторое время оставалась согнутой; при последующем раздражении период, в течение которого она оставалась согнутой, увеличивался. В случае контрольных препаратов, которым наносили такое же число ударов током, но в случайном порядке, независимо от положения конечностей, описанного эффекта не отмечалось [1148, 1963]. Этот эффект сохранялся несколько часов, после чего устойчивость обучения оценить оказывалось невозможным. В дальнейшем Хойл [1160] показал, что управление мышцей, поднимающей конечность, зависит только от частоты поступающей на эту мышцу эфферентной импульсации. Это было установлено воздействием на нерв электрическим тоном в моменты, когда частота импульсов в нем была выше или ниже определенного уровня. Таким образом, у насекомого должна была происходить оценка частоты импульсов в эфферентном нерве и связывание определенных ее значений с избеганием удара. Это может играть важную роль в долговременной регуляции позпых рефлексов [1153].

У разных животных критерии обучения методом проб и ошибок в его общей формулировке охватывают явления, значительно различающиеся по своей сложности. Так, Шнейрла [2141] подчеркивал фундаментальные различия в обучении насекомого и крысы в лабиринте. Насекомое вначале осваивает отдельные точки разветвления и только затем интегрирует свои навыки, формируя тем самым стереотипный путь, тогда как у крыс обучение деталям обстановки и их интеграция происходят с первой же побежки. Кроме тога, обучившись однажды проходить лабиринт, насекомые с трудом обучаются проходить его в обратном направлении или при внесении в него некоторых изменений, тогда как крысы легко справляются с этой задачей (см. также [2535]).

Как и в случае классического условного рефлекса, можно сказать, что обобщения по поводу обучения методом проб и ошибок могут привести к неоправданным упрощениям. Во мнотих случаях такое обучение нельзя описать только как образование новых связей типа стимул — реакция, и поэтому для объяснения требуется постулировать довольно сложные промежуточны« переменные, О чемг мы будем говорить далее (см. разд. 24.4).

Латентное обучение

Торп определяет его как «образование ассоциации между индифферентными раздражителями или ситуациями в отсутствие явного подкрепления». В большинстве экспериментов по обучению в лабиринте животные получают подкрепление в целевой камере. Если крысу ежедневно держать в лабиринте без всякого подкрепления, то число допускаемых ею ошибок уменьшается гораздо медленнее, чем у животных, получающих подкрепление. Однако стоит крысам, не получавшим ранее подкрепления, начать через несколько дней давать и целевой камере подкрепление, как выполнение побежек в лабиринте резко улучшается, быстро достигая уровня, характерного для животных, получавших подкрепление на протяжении всего обучения. Следовательно, животные должны были чему-то научиться уже во время неподкрепляемых проб; обучение их было «латентным» и никак не отражалось на выполнении побежки до тех пор, пока не было активировано поощрением. В этом случае говорят, что крыса первоначально обучается тому, «что куда ведет», точно так же как она обучается взаимоотношению между объектами, когда исследует их повое пространственное расположение (см. разд. 24.4). В общем можно сказать, что крыса «обучается» условным вероятностям связей между раздражителями.

Латентному обучению посвящено множество работ, которые подробно обсуждаются в обзорах Тистельтуэйта [2352], а также Мак- Коркодейла и Мила [1584]. Сюда относятся, в частности, исследования по обучению в лабиринте при подкреплении, не соответствующем ведущей мотивации. Так, голодную, но не испытывающую жажды крысу вынуждают проходить Т-образный лабиринт, в котором один коридор приводит к пище, а другой — к воде. Если впоследствии та же крыса будет испытывать жажду, то она начнет выбирать коридор с водой. Эхо означает, что процесс обучения шел и в отсутствие соответствующей мотивации. В своем критическом обзоре литературы Мак-Коркодейл и Мил [1584] пришли к выводу, что существование латентного обучения подтверждается подавляющим большинством экспериментов.

Существенным элементам определения латентного обучения по Торпу является отсутствие поощрения. Однако одного этого недостаточно, чтобы отличить его от обучения методом проб и ошибок. Как мы увидим, многие теоретики считают, что при обучении методом проб и ошибок подкрепление несущественно; следовательно, оно не отличается в этом отношении от латентного обучения. Даже сторонники представления о подкреплении считают, что никаких различий в данном случае нет; так, Халл [1186] пришел к выводу, что прочность навыка не зависит от величины подкрепления, так что любое «латентное» обучение возможно при некотором минимальном подкреплении, скажем в результате возвращения в привычную кле'т- ку поел« прохождения лабиринта; таким образом, оно неотличимо от обучения методом проб и ошибок (см., однако, [2511]).

В дальнейшем мы увидим, что между этими формами обучения и в самом деле существует тесная связь. По крайней мере у высокоорганизованных животных обучение методом проб и ошибок может состоять из двух процессов: обучение характерным признакам ситуации и использование его для выполнения соответствующих задач. Латентное обучение связано лишь с первым процессом.

Обучение по типу инсайта

По Торпу, это—«образование новой адаптивной реакции в результате инсайта», который определяется как «улавливание отношений». Полемика по вопросу о том, принципиально ли отличается обучение по типу инсайта от обучения методом проб и ошибок или дело здесь только в степени, ведется давно. Этот спор затянулся главным образом потому, что инсайт объясняли формированием понятий, тогда как обучение методом проб и ошибок — образованием ассоциаций. К этому вопросу мы еще вернемся.

Торп относит сюда же и запечатление, но, как. мы отмечали ранее (см. разд. 21.5), характерные особенности запечатления больше зависят от ситуации, чем от самого процесса обучения. Кроме того, к ин- сайту он относит также «подражание», но делает оговорку, что под этим термином часто подразумевают совершенно различные явления поведения, а именно:

Облегчение под влиянием общения с сородичами; здесь имеется в виду выполнение уже имеющегося в репертуаре животного поведенческого акта в результате выполнения его другими особями. Зевание — самый тривиальный пример такого поведения у человека. Поскольку эффект этот проявляется немедленно, обучение здесь совсем необязательно, хотя тенденция к этому виду облегчения может, конечно, зависеть и от обучения.

Местная тенденция к усилению реакций; под этим понимается усиление тенденции реагировать на какую-то деталь окружающей среды в рееультате реакции на нее других особей. Например, распространение навыка открывать молочные бутылки в одной популяции синиц (Parus), описанное Хайндом и Фишером [1068], отчасти зависит именно от этого фактора. Клопфер [1362] более тщательно проанализировал один пример такого рода: зеленушка (Chloris chloris), обучившаяся различать съедобные и несъедобные объекты, начинает ошибаться, если видит, как действует необученная особь. Отмечают и обратное: птица может обучиться избегать потенциально опасной ситуации, наблюдая за поведением уже обученных птиц [1360]; впрочем, когда раздражители не вызывают сильного испуга, это обучение не всегда оказывается успешным [2187].

Истинное подражание; Торп называет этим термином «копирование поведенческих актов или звуков, которые не могут возникнуть иным путем». Он полагает, что, не считая подражания разным звукам у птиц (см. раз. 19.5), подлинное подражание свойственно только приматам (см., например, [961, 1319]). Эта классификация, несомненно, полезна для исследований подражания, хотя многие примеры подражания трудно отнести к какой-то одной из названных категорий. Так, Даусон и Фосс [520] показали, что волнистый попугайчик (Melopsittacus) может научиться снимать крышку с кормушки тем же движением, каким делает это обученная птица, за которой он имел возможность наблюдать; однако этот факт едва ли укладывается в торповскую категорию истинного подражания, так как самый характер движения не был для птицы новым. По описанию ван Лавик-Гудолл [1472], молодые шимпанзе обучаются пользоваться травинками для извлечения термитов (см. разд. 19.3) в присутствии матери; это позволяет предположить, что подражание в данном случае относится ко всем трем категориям.

В заключение снова приведем два важных замечания относительно классификации типов обучения, подчеркнутые самим Торном. Во-первых, между приведенными категориями нет четких границ и они частично перекрываются. Во-вторых, в каждой из них можно обнаружить примеры, сильно различающиеся по сложности. Следует отметить, что все категории обучения, выделяемые Торпом,
могут быть связаны с перцептивным обучением (разд. 20.3 и 24.4), причем его вклад и важность этого вклада различны в зависимости от реакции и от типа, к которому относится животное.



загрузка...