24.4. ТЕОРИЯ «ПОЗНАНИЯ» (COGNITIVE THEORY) И ТЕОРИЯ S-R-СВЯЗЕЙ

Обучение, по крайней мере у высших животных, редко сводится лишь к простому изменению отношений между внешними раздражителями и реакциями. Поэтому многие теоретики заполняли «пространство» между стимулом и реакцией различным гипотетическим содержанием, хотя единого взгляда на природу этих внутренних событий не существует. Психологи, стоящие на бихевиористских позициях, считают, что эти события представляют собой скрытые последовательности стимул — реакция, и особо подчеркивают роль кинестетических раздражителей как факторов, ответственных за интеграцию поведения. С другой стороны, сторонники теории «познания» придают особое значение перестройке центральных нервных процессов, причем эти процессы, как полагают, отличны от формирования цепей стимул — реакция. Различие этих подходов проще всего выразить следующим образом: для того чтобы объяснить процесс обучения в лабиринте на основе связей стимул — реакция, необходимо выяснить, какие реакции должны быть осуществлены на соответствующие раздражители, тогда как объяснение с точки зрения теории «познания» предполагает формирование некой «мысленной схемы» лабиринта, т. е. знания того, «что куда ведет», или вероятности следования друг за другом определенных раздражителей. В действительности большинство экспериментов по обучению можно интерпретировать на основе обеих точек зрения, и приверженцы обоих направлений обнаруживают замечательную изобретательность, привлекая для доказательства своих теорий все новые и новые факты [1882]. Спор этот не нов, и мы не станем вдаваться во все его детали, одпако имеет смысл рассмотреть некоторые эксперименты, проливающие свет на природу центральных изменений, вовникающих в различных ситуациях, связанных с обучением.

Образование связей между индифферентными раздражителями (сенсорное « предобусловливание »)

Для начала следует обсудить один старый эксперимент. Собаке предъявляли через некоторые интервалы времени звуковой раздражитель, за которым каждый раз следовал зрительный раздражитель; при этом никакого явного обучения не обнаруживалось. Затем вырабатывалась условная реакция на один из этих раздражителей. Оказалось, что эта же реакция может быть вызвана и вторым раздражителем [340]. Следовательно, при первоначальных предъявлениях между этими раздражителями должна была установиться связь. Хотя ранние эксперименты по такому «сенсорному предобусловли- ванию» проводились без адекватного контроля, все же сам факт существования этого вида обучения не вызывает сомнений (см. обзор [2178]). Подобные эксперименты, по-видимому, демонстрируют образование прямых связей между раздражителями, однако их результаты не создают каких-либо серьезных трудностей для теории обучения на основе Э—Б-связей; в самом деле, скрытые последовательности связей Э—И могут служить здесь промежуточными звеньями. Действительно, Паркс [1896] установил, что частое повторение двух таких раздражителей препятствует формированию ассоциации между ними, н, по его мнению, этот факт свидетельствует в пользу той точки зрения, что в сенсорном предобусловливания «посредником» служит ориентировочная реакция.

Перцептивное обучение

Позднее было показано, что особенности перцептивного опыта, приобретенного в процессе развития организма, хотя и никак не обнаруживаются в текущем поведении, могут проявиться в дальнейшем, что можно выявить соответствующими тестами. Мы уже говорили, что крысы, которым в раннем возрасте дают возможность ознакомиться с кругом или с треугольником без какого бы то ни было подкрепления, впоследствии будут обучаться их различению легче, чем крысы, не имевшие предварительного опыта (см. разд. 20.3). Совокупность процессов, увеличивающих готовность или способность организма отвечать на различные изменения внешней стимуляции, называют обычно «перцептивным обучением» [798]. Торп [2375[подчеркивал важность явления перцептивного обучения для самых разных животных. Он полагает, что даже самый простой раздражитель соотносится с другими раздражителями, а потому восприятие всегда охватывает эти отношения. Виды, которым, по Торпу, необходимо перцептивное обучение (гл. 20), используют его для формирования в дальнейшем посредством различных форм обучения способности реагировать на значимые сигналы, исходящие из среды.

Концепция перцептивного обучения в свою очередь не избежала критики прежде всего за неадекватность и неконструктивность определения этого термина [248]. Факт перцептивного обучения может быть обнаружен только по изменениям в поведении; отличается ли этот вид обучения от обучения при классической условной или инструментальной реакции — все еще не ясно. Согласно одному из критериев, о перцептивном обучении можно говорить в том случае, если организм реагирует на определенный тип раздражителя все более и более избирательно в отличие от того, что имеет место при выработке условной реакции, когда реакция животных на другие близкие раздражители постепенно генерализуется. Однако далеко не просто судить о том, что на салюм деле происходит по мере выработки условной реакции — увеличение или уменьшение градиента генерализации [1038]. Так или иначе, трудно обнаружить такой случай формирования условного рефлекса, в котором не участвовало бы перцептивное обучение; в то же время ситуации, в которых формируются условные рефлексы, в операциональном отношении, по-видимому, нисколько не напоминают ситуации, в которых изучается перцептивное обучение.

Вторая трудность возникает в связи с утверждением, что перцептивное обучение не зависит от подкрепления. Так, Керпельман [1335] обнаружил, что если в «предэкспозиционный» период раздражители ежедневно удалять на 2 ч в период кормления, то такое предварительно не подкрепляемое знакомство с раздражителями оказывает меньшее влияние на последующее выполнение крысами задач на различение. Следовательно, как он полагает, здесь важную роль играет дифференцированное подкрепление. Однако уже отмечалось (см. разд. 20.4), что установление «стимулыюго контроля», по-видимому, зависит от дифференцированного подкрепления; это справедливо и для перцептивного обучения, так что различие можег оказаться скорее кажущимся, нежели фактически существующим.

Так или иначе, эксперименты по перцептивному обучению показывают, что опыт может вызвать изменения, которые не выражаются немедленно в изменениях поведения. Это вовсе не обязательно означает, что при таком обучении не имеет места никакая реакция. Мы уже видели, что у высших млекопитающих ознакомление с признаками зрительно-двигательного пространства включает сопоставление стимуляции, поступающей по каналам обратной связи в результате выполнения некоторой реакции, с ожидаемой обратной связью (см. разд. 20.8—20.10); обучение протекает по схеме Э—И—Э, а не точно по схеме Э—Э. Неизвестно, всегда ли перцептивное обучение опосредуется какой-то реакцией (например, движениями глаз).

Двустадийное обучение различению

Во многих экспериментальных ситуациях по исследованию обучения могут возникать такие центральные изменения, которые не проявляются непосредственно в поведении. Лоуренс [1474, 1475] показал, что приобретенная животным способность к различению двух раздражителей до некоторой степени независима от реакции, которую должно при этом выполнить животное. Например, крысы, обученные распознавать два сигнала в одной ситуации, могли переносить полученный опыт па новые ситуации даже в том случае, когда значение этих сигналов менялось на противоположное. Лоуренс интерпретировал эти результаты, предположив существование некой опосредующей реакции, благодаря которой эти сигналы оказываются в большей мере различимыми (см. также [660, 661, 2150]).

Позднее Сазерленд [2309] выдвинул предположение, согласно которому процесс обучения различению состоит из двух стадий. Вначале животное обучается реагировать на те качественные признаки двух ситуаций, по которым они больше всего различаются, например усваивает, что выбор следует делать, скажем, по яркости или форме объектов, а затем уже научается связывать с этими признаками определенные реакции. Сазерленд считает,что подкрепление какой-либо попытки будет увеличивать вероятность того, что впоследствии животное начнет обращать внимание на тот же характерный признак. (Мы уже отмечали, что термином «внимание» часто пользуются, чтобы замаскировать свое незнание. Но в данном случае мы просто хотим показать с его помощью, что поведение животного определяется каким-то одним свойством раздражителя, а не другим; мы предпочитаем говорить о «внимании», а не о «переключении в анализаторах», хотя и тот и другой термины относятся к анализу одного и того же аспекта ситуации.)

Гипотеза двустадийного обучения различению позволяет сказать, влияет ли какой-либо способ обучения на усиление одной из стадий по сравнению с другой, и, таким образом, позволяет учесть многие результаты, которые без этого допущения объяснить было бы весьма сложно. Так, известно, что если крыс или осьминогов сначала обучить различению, а затем изменить значение условных сигналов на противоположное (переделка), то новой задаче они будут обучаться быстрее, если при обучении первой задаче их перетренировали. В соответствии с выдвинутой гипотезой первая стадия, т. е. обучение выделению существенных признаков, продолжается и в период перетренировки (хотя это и не сказывается на выполнении задачи); при изменении значения условных сигналов на противоположное результат этого обучения продолжает сохранять свое значение, и потому перетренированные животные лучше «вооружены» для решения задач типа переделки [1614].

Следовало бы ожидать, что этот эффект перетренировки при переделке наиболее ярко проявится в том случае, когда в процессе первоначального обучения различению будет введено много несущественных признаков и (или) когда существенный сигнал выделяется не очень заметно. При этом перетренированные животные продолжали бы обращать внимание на существенный признак и после изменения значения раздражителей, тогда как у неперетренированных животных внимание скорее всего переключалось бы на признаки, не существенные для соответствующей задачи. В опытах по сериям переделок действительно было показано, что улучшение решения задач у крыс зависит от числа несущественных признаков (см., например, [16141). Точно так же осьминоги гораздо быстрее обучаются переделке после перетренировки в первоначальной задаче на различение, если в нее вводятся несущественные признаки [1620].

Макинтош [1612] объясняет процесс угашения на основе этой же гипотезы у неперетренированных и перетренированных животных. У первых угашение затрагивает главным образом первую стадию обучения распознаванию (выделение существенного признака ситуации), тогда как у вторых оно влияет на вторую стадию (обучение связи реакций с раздражителями). С тех же позиций удается интерпретировать и другие факты: вредные последствия перетренировки на переключение, не связанное с переделкой, некоторые особенности переноса обучения, а также эффект частичного подкрепления (см. [1614-1616, 2320] и обзоры [2314, 2315]).

Одпако некоторые эксперименты, по-видимому, противоречат этой гипотезе. Во-первых, не доказано, что перетренированные животные всегда лучше решают задачи по переделке. Хотя во многих экспериментах на крысах, осьминогах и голубях [2606] был получен положительный эффект, однако даже в опытах на крысах отмечались отклонения от этого правила [1578]. В исследованиях на кошках и обезьянах, многократно использовавшихся в экспериментах [212], цыплятах [1616] и рыбах (Масгоройиз орегсШапэ) [2501] и серебристом карасе [1621] было показано, что перетренировка замедляет обучение при переделках. В экспериментах на котятах, не участвовавших ранее в опытах [1080], не удалось обнаружить облегчения переделки при перетренировке, хотя при этом строго соблюдались условия, которые, по Макинтошу [1612], приводят к положительному эффекту (т. е. наличие многочисленных несущественных признаков и не слишком резкое отличие существенных признаков от остальных, так что они первоначально не вызывают пристального внимания) .

Однако, как полагают Макинтош и др. [1621], такие результаты могут объясняться тем, что у изученных животных перетренировка не оказывает дифференцированного влияния на две стадии обучения.

В подтверждение этой точки зрения они приводят следующие данные: если перетренировка облегчает переделку, то у неперетренированных животных первая стадия угасает быстрее, чем процесс, связанный с присоединением реакции к раздражителю. Если же такого облегчения переделки не отмечается, то угашение обеих стадий происходит примерно с одинаковой скоростью, сколько бы ни продолжалась перетренировка. (При этом оба варианта могут встречаться как у представителей одного вида, так и у представителей разных вддов.) Кроме того, Макинтош [161Й] подтвердил вывод, согласно которому перетренировка облегчает переделку при решении сложных задач на различение и при использовании большего подкрепления.

Еще одно затруднение связано с тем, что животные быстрее обучаются задачам на различение, если два раздражителя предъявляются одновременно [2499] и если оба они оказываются значимыми.

Обычно предполагается, что животное затрачивает на освоение каждого из раздражителей столько времени, сколько бы это заняло, если бы раздражители предъявлялись по отдельности. Но это противоречит теории Сазерленда, согласно которой чем больше внимания животное обращает на один раздражитель и соответственно чем лучше усваивает его, тем меньше оно может обучиться другим; поэтому скорость обучения при одновременном предъявлении обоих раздражителей будет меньше, чем при предъявлении их по отдельности [2319]. В пользу этой точки зрения можно привести следующий факт. Если крысам дается задача с двумя значимыми раздражите л я.ми, то при некотором фиксированном числе попыток наблюдается отрицательная корреляция между количеством информации, усвоенной крысами о каждом из признаков [2318]. Еще одно следствие гипотезы Сазерленда, согласно которому при предъявлении двух значимых раздражителей крысы должны хуже усвоить один из раздражителей, чем при предъявлении только одного значимого раздражителя, нашло лишь частичное подтверждение. Когда использовались зрительные раздражители, крысы, которым предъявляли два значимых раздражителя, освоили один из них лучше, чем крысы, которым предъявляли лишь один значимый раздражитель. Однако если один раздражитель был зрительным, а другой тактильным, то большему научились крысы, которым предъявлялся лишь один значимый раздражитель [2317]. Как бы то ни было, все это детали теории, не затрагивающие основного положения о том, что процесс различения происходит в две стадии.

Третья трудность связана с тем, что крысы, перетренированные при обучении задаче по различению положения в пространстве, обучаются переделке не быстрее, чем неперетренированные. Макинтош [1617] объясняет это расхождение с результатами, полученными в экспериментах со зрительным различением, тем, что обычно в этих последних присутствуют и несущественные признаки, тогда как в задачах на различение положения в пространстве такие признаки
отсутствуют. Кроме того, он предполагает, что при перетренировке происходит постепенный переход с внешнего контроля на проприо- цептивный, а переделка не может осуществляться до тех пор, пока не будет восстановлен внешний контроль (см. также [1575]).

Наконец, следует упомянуть эксперимент Зигеля [221?]. Хотя он и подтверждает некоторые данные относительно причин влияния перетренировки на осуществление переделки, однако заставляет сделать вывод, что теория двустадийности все же не совсем верна. Крыс тренировали или подвергали перетренировке в задаче на различение, в которой предъявлялось два набора раздражителей (животное должно было отличать черные фигуры от белых или от фигур, имеющих текстуру). Затем им давались задачи на различение при одновременном или последовательном предъявлении раздражителей, причем в этих тестах либо значение раздражителей менялось на противоположное (изменение в пределах одной модальности), либо существенными становились другие раздражители (изменение модальности). Как и ожидалось, облегчающий эффект перетренировки сказался на выполнении задач при одновременном предъявлении раздражителей и изменении в пределах одной модальности. Однако в случаях изменения модальности в задачах, когда раздражители предъявлялись одновременно, перетренировка не оказывала неблагоприятного влияния, хотя этого можно было ожидать в случае, если первоначальное обучение осуществлялось со значимыми раздражителями одной модальности. Кроме того, в то время как в тестах с последовательно предъявленными раздражителями при изменении в пределах одной модальности обучение шло быстрее, чем в задачах с последовательным предъявлением раздражителей и с изменением модальности, перетренировка не облегчала дальнейшего обучения в задачах с последовательно предъявляемыми раздражителями при изменении в пределах одной модальности и не затрудняла дальнейшего различения в задачах с последовательно предъявляемыми раздражителями при изменении модальности. Это тщательно проведенное исследование позволило Зигелю высказать предположение, что некоторые не укладывающиеся в теорию результаты можно попять, если исходить из допущения, что животные должны преодолевать первоначально имеющееся предпочтение определенного положения. Впрочем, эти интересные результаты скорее поддерживают, нежели опровергают гипотезу двустадийного обучения.

Итак, хотя точка зрения на обучение различению как на двустадийный процесс имеет достаточно веские доказательства, она встречает некоторые возражения. Если попытки формализации этой гипотезы [1575], быть может, пока преждевременны, все же есть все основания возражать против интерпретации процесса обучения различению на основе простых связей стимул — реакция, по крайней мере в случае обучения крыс и осьминогов.
Обучение пространственному расположению объектов («рефлекс на место»)

Эксперименты по усвоепию расположения объектов в пространстве («рефлекс на место» — place learning) показали, что иногда освоение лабиринта гораздо проще объяснить на основе теории «познания», а не исходя из представления о последовательностях стимул — реакция. Согласно упрощенному варианту теории «стимул — реакция», у животного, освоившего лабиринт, вырабатывается фиксированная последовательность движений от исходной точки к цели. Однако некоторое экспериментальное нарушение такой последовательности движений не препятствовало достижению цели. Обученные крысы даже при тяжелых повреждениях мозжечка, вызывавших у них значительные нарушения двигательных функций, справлялись с задачами в лабиринте [1461].

В эстакадном лабиринте крыс можно обучить либо пространственному навыку (животное обучается идти всегда в одно и то же место независимо от последовательности поворотов налево и направо), либо какой-то определенной реакции (например, поворотам налево). Оказалось, что если животное имеет возможность воспринимать внешние относительно лабиринта объекты, то оно легче усваивает именно пространственный навык [2416], тогда как в противном случае легче происходит обучение данной реакции [280]. Таким образом, освоение лабиринта может происходить либо с помощью пространственных навыков, либо с помощью обучения реакциям, либо с помощью того и другого вместе — роль каждого из элементов зависит от доступных животному раздражителей, а также от стадии обучения [1322]. Другие экспериментаторы исследовали возможности выбора альтернативных путей нри блокировании главного пути к цели. В целом у крыс отмечалось явное предпочтение вариантов, которые свидетельствуют в пользу «рефлекса па место», хотя оказалось, что на формирование «мысленной схемы» влияют, как это ни странно, такие факторы, как «ширина дорожки», и что эта «схема» отнюдь не является буквальным чертежом лабиринта [524, 1318, 2015]. Здесь стоит отметить, что в случае проблемы ориентации нтиц при перелетах (гл. 7) теория «стимул — реакция» также не в состоянии дать какого-либо правдоподобного объяснения.

Имеются и другие эксперименты по обучению в лабиринте, свидетельствующие в пользу теории «нознания»; было показано, чю в лабиринтах определенных типов крысы, но-видимому, осваивают разные способы решения, которые испытывают последовательно, пока не добьются успеха [408]. Эги результаты также проще интерпретировать па основе теории «нознания».

Итак, исходя из результатов всех этих экспериментов, мы приходим к выводу, что многие феномены обучения нельзя адекватно описать только при помощи последовательностей стимул — реакция. Тот, кто вопреки всему предпринял бы такую попытку, вынужден был бы предположить, что скрытые и явные реакции организма регулируются разными поведенческими законами, но такой вывод приводит к абсурду, заставляя отказаться от теории последовательностей в—И.

Пока в этом разделе мы анализировали факты, полученные главным образом в лабораторных экспериментах на крысах. Перейдем к обсуждению некоторых исследований, проведенных на других животных (многие из этих работ мы рассматривали раньше); для объяснения всех описашшх явлений, по-видимому, требуется ввести допущение об изменении в центральной нервной системе, которое первоначально может не зависеть от каких-либо изменений во внешне проявляемом поведении и которое не так-то просто истолковать на основе представления о «скрытых» последовательностях стимул — реакция.

а. Ориентация. Многие реакции ориентации у насекомых включают либо движение, которое сходно определяется стимуляцией двух разных видов (например, на свет и силу тяжести), либо движение, связь которого с раздражением одного вида изменяется со временем. Такое поведение проще объяснить, предположив существование контрольной системы с переменной внутренней моделью (золльверт), а не на основе множественных механизмов последовательностей стимул — реакция, каждый из которых «обслуживает» свой вид ориентации наряду с дополнительным механизмом, осуществляющим выбор между ними (гл. 7). Хотя эти случаи ориентации у насекомых гораздо проще ранее обсуждавшихся здесь примеров, они представляют особый интерес в том отношении, что указывают па существование механизма, принцип действия которого может быть объяснен на основе как последовательностей стимул — реакция, так и теории «познания»

б. Образ искомого, ожидание подкрепления и избирательное внимание. Поисковое поведение в значительной степени состоит из сканирования окружающей среды, которое продолжается до тех пор, пока животное не столкнется с определенным набором раздражителей. Такой тип поведения можно понять, если предположить, что животное использует некий «образ искомого». Иными словами, поиск связан не только с изменениями поведения, но и с изменениями реактивности, которые непосредственно в поведении не проявляются (гл. 5). Аналогично, как мы видели, избирательное внимание обусловлено функционированием центральных механизмов, чувствительных к тонким оттенкам стимуляции, и не может быть понято исходя из представления о действии пассивного периферического фильтра (гл. 6).

в. Привыкание. Некоторые эксперименты Соколова по угашению ориентировочного рефлекса (см. разд. 0.4), по-видимому, могут быть объяснены лишь изменениями центрального происхождения. Сам Соколов определяет этот процесс как формирование «нервной модели». Введение этого псевдофизиологического термина позволяет объяснить данное явление не в большей степени, чем описание его на основе теории «познания», хотя и дает толчок для дальнейших исследований (см. разд. 6.3 и обсуждение О. С. Виноградовой и Хорна в книге Хорна и Хайнда, в печати).

г. Обучение песне. Формирование видовой песни у зябликов (как мы выяснили в гл. 19), по-видимому, вначале связано с выработкой внутренней модели (золльверт), а затем с подгонкой реакций голосового аппарата, продолжающейся до тех пор, пока не будет достигнуто соответствие с этой моделью.

д. Запечатление. Этот вид обучения, связанный с реакцией следования у выводковых птиц, мы обсуждали в гл. 21. В этом случае освоение птицами определенных раздражителей определяет способность реагировать впоследствии на эти раздражители в других ситуациях. Бейтсон показал [167], что воздействия в раннем возрасте, определяющие эффективность раздражителей, вызывающих реакцию следования в экспериментах по запечатлению, влияют также на скорость обучения, когда те же самые раздражители применяются в задачах на различение, хотя в последнем случае ответная реакция совершенно иная. Понятно, что это явление гораздо легче описать исходя из представления о первоначальном усвоении характерных признаков объекта, чем с точки зрения функционирования последовательностей стимул — реакция.

е. Формирование понятий. Долгое время проблема способности животных к формированию понятий была поводом для всевозможных домыслов, и лишь недавно она стала объектом экспериментального изучения. Гернштейн и Лавленд [1020] смогли обучить голубей реагировать на наличие или отсутствие человека на предъявляемых им фотографиях. Люди на снимке могли находиться в любом месте, быть одетыми или раздетыми, это могли быть взрослые или дети, причем в самых разных позах, они могли иметь черную, белую или желтую кожу — разнообразие было таково, что простая характеристика раздражителя практически исключалась. Таким образом, эти эксперименты позволяют предполагать у голубей весьма высокоразвитую • способность к формированию понятий (см. также [1375, 1732]).

Сходный подход использовал Лер [1479]. Он обучал двух обезьян отбирать три изображения различных насекомых одинакового цвета, игнорируя изображения увядших листьев, плодов, веток и т. п., сходных по размерам и цвету. На последних этапах обучения они действительно чаще выбирали изображения насекомых, предпочитая их изображениям других естественных объектов. Подобные результаты были получены и в опыте, в котором обезьяны избирательно рваги' ровали на изображения цветков, игнорируя изображения других частей растений. Однако обобщение в этом случае, по-видимому, зависело от немногочисленных критериев, общих для предъявляемых изображений цветков; поэтому едва ли здесь можно говорить о механизме формирования понятий.
Итак, мы теперь ясно видим, что обучение, которое на первый взгляд заключается лишь в изменениях связей между стимулами и реакциями, на самом деле связано с перестройкой центральных нервных процессов, не проявляющейся непосредственно в поведении. Но это отнюдь не означает, что все разновидности обучения должны интерпретироваться именно таким образом. Любой исследователь, изучавший низших животных и знакомый с фиксированными формами их поведения, столь свойственными им, неизбежно приходит к выводу, что адекватно описать некоторые примеры их обучения возможно исходя из представления о цепи стимулов и реакций и, более того, что какой-либо другой путь был бы ошибочным. Поэтому значение такого подхода к обучению заключается в том, что он заостряет внимание на исследовании раздражителей, контролирующих в конечном счете исследуемые реакции.

Економіка Маркетинг Менеджмент Фінанси Податки Культурологія
Бухгалтерський облік Політологія Страхування Політекономія Історія

загрузка...