загрузка...
 
24.5. РОЛЬ ПОДКРЕПЛЕНИЯ В ФОРМИРОВАНИИ СВЯЗЕЙ СТИМУЛ - РЕАКЦИЯ
Повернутись до змісту

24.5. РОЛЬ ПОДКРЕПЛЕНИЯ В ФОРМИРОВАНИИ СВЯЗЕЙ СТИМУЛ - РЕАКЦИЯ

Проблема роли подкрепления при обучении была предметом спора ученых различных школ. По мнению одних, единственным условием формирования связи между раздражителем и реакцией является их совпадение во времени — обучение благодаря «совпадению». Но поскольку связи образуются далеко не между всеми стимулами и реакциями, имевшими место при формировании ассоциации, необходимо объяснить, почему в данной ситуации животное обучается че- му-то определенному и пе учится чему-то другому. Сторонники гипотезы обучения благодаря совпадению, пытаясь ответить на этот трудный вопрос, выдвинули несколько предположений. Так, Газри [8861 считал, что подкрепление, даваемое после реакции, как бы «изымает» животное из данной обстановки и тем самым предотвращает возможность того, чтобы образовалась связь между другими раздражителями, непосредственно предшествующими подкреплению, и другими реакциями. Эстес [662] допускает наличие некоторого механизма отбора раздражителей: только те из них будут связаны с реакцией, которые оказались отобранными в момент ее выполнения. Согласно предположению Толмена [2415], выбор раздражителей, на которые организм будет обращать внимание и вследствие этого начнет ассоциировать их между собой или с реакцией, определяется мотивационным состоянием; в этом случае вознаграждение подтверждает ожидания относительно особенностей окружающей среды.

Однако другие исследователи считали близкое совпадение стимулов и реакций во времени необходимым, но не достаточным условием обучения. По их мнению, за выполнением реакции также должно следовать некоторое «подкрепляющее» событие. Например, при образовании инструментальной условной реакции таким подкрепляющим агентом можно назвать событие, которое при совпадении во времени с реакцией способствует увеличению частоты выполнения этой реакции. Когда речь идет только о контроле поведения, такого операционального определения вполне достаточно; установить, какие именно факторы выступают для определенной реакции в роли подкрепления, можно непосредственно эмпирическим путем [2225]. Однако можно выдвинуть некоторые общие положения, выходящие за рамки указанного определения, и затем подвергнуть их экспериментальной проверке. Например, одно из таких положений заключается в том, что раздражитель, служивший подкреплением в одной ситуации, будет выступать в том же качестве и в другой; при этом необходимо установить границы этого обобщения для разных реакций и животных. Аналогичный подход, целью которого является анализ природы подкрепления, заключается в обобщенном определении условий, которые обеспечивают подкрепляющий эффект одних событий в отличие от других. Наиболее плодотворными оказались теории, основывающие эффект подкрепления на удовлетворении той или иной биологической потребности или побуждения (ослабление побуждения), на устранении раздражителей, связанных с таким побуждением (ослабление потребности, обусловленной наличием раздражителя), или на появлении раздражителей, ранее связанных с побуждениями (вторичное подкрепление) (см., например, [1186, 1750]). Однако теперь становится все более очевидным, что, хотя эти теории и сохраняют некоторую эвристическую ценность (см., например, [1742]), они далеко не так всеобъемлющи, как полагали прежде. Мы пока не можем предложить какой-либо удовлетворительной теории, однако считаем полезным рассмотреть некоторые данные, подчеркивающие трудности, с которыми сталкиваются имеющиеся теории. «Побуждение» мы будем здесь рассматривать как полезную промежуточную переменную (гл. 8).

Согласно теории ослабления побуждения в ее первоначальном варианте, обучение реакциям происходит вследствие ослабления факторов, которые эти реакции вызвали. Однако, по крайней мере в некоторых случаях, подкреплением могут служить раздражители, связанные с завершающими реакциями, хотя факторы, вызвавшие соответствующую реакцию, все еще присутствуют. Например, когда животное пьет раствор сахарина, это и уменьшает дальнейшее его потребление, и служит подкреплением, несмотря на то что сахарин не является питательным веществом [1751, 2197].

Хотя сахарин и не ослабляет потребности в пище, он уменьшает ее потребление. Этот факт находится в полном соответствии с той точкой зрения, что подкрепляющий эффект связан не с ослаблением потребности или с устранением вызывающих то или иное поведение факторов, а с ослаблением «побуждения», проявлением которого является готовность животного к осуществлению данной формы поведения. В ряде экспериментов действительно была установлена корреляция между эффективностью раздражителя как фактора, приводящего какой-то тип поведения к завершению, и эффективностью этого раздражителя в качестве подкрепления. Например,молоко при введении непосредственно в желудок по сравнению с тем же молоком, потребляемым обычным порядком, не только значительно слабее подавляет поглощение пищи, по и оказывается менее эффективным подкреплением при выполнении реакции нажатия на рычаг. Еще менее эффективно в этом отношении введение непосредственно в желудок физиологического раствора [233, 1377, 1751]. Остается открытым вопрос о том, одинаковы ли завершающий и подкрепляющий эффекты стимуляции. Имеются некоторые данные о различии их временных параметров; так, подкрепляющий эффект наполнения желудка развивается медленнее, чем эффект насыщения (см. также [915]).

Однако подкрепление не обязательно связано с ослаблением побуждения. Шеффилд и др. [2198] показали, что интромиссии служили для самцов крыс подкреплением и в том случае, если эйякуляция экспериментально предотвращалась. Поскольку, вероятно, интромиссии усиливают, а не ослабляют тенденцию проявлять половое поведение, подкрепление, по-видимому, ассоциируется не с уменьшением, а с усилением побуждения. Хотя позднее было обнаружено, что интромиссии с последующей эйякуляцией служат более эффективным подкреплением, чем одни интромиссии [1285, 2560], это объяснение остается в силе. В любом случае эффективность в качестве подкрепления таких факторов, как контакт с самкой в анэструсе, интромиссии и эйякуляция, зависит от индивидуалыюг.0 опыта самца. Уэйр [2498] показал, что все эти факторы влияют на латентный период садки у самцов крыс, не имевших опыта спаривания, одинаково, но по мере приобретения опыта эйякуляция становится у них наиболее эффективным подкреплением. Однако наши знания о половом поведении не позволяют интерпретировать этот случай на основе теории ослабления побуждения, поскольку интромиссии и эйякуляция оказывают на последующую реактивность сложное влияние (см. разд. 15.2). В данном случае вызывает сомнение пригодность концепции унитарного побуждения. Пищевое и половое поведение прекращаются в результате действия целого ряда различных механизмов обратной связи (гл. 10 и 15); подкрепляющий эффект может определяться целым рядом различных последствий реакции (см., например, [2238, 2239]); на эффективность подкрепления может влиять взаимодействие этих последствий [2285].

Хотя некоторые из рассмотренных примеров как будто бы свидетельствуют о том, что осуществление завершающей реакции (например, акта еды) не обязательно для получения эффекта подкрепления (см. также [465], цит. на стр. 252), другие данные показывают, что поведение при завершающих реакциях (или раздражители, возникающие в результате его осуществления) может служить подкреплением. В самом деле, описаны многочисленные случаи, когда один лишь факт выполнения реакции без какого-либо явного ослабления побуждения мог действовать как подкрепление. Так, Кинг и Вейсман [1346] обнаружили, что хомячки (Реготузсиз) будут нажимать на рычаг, позволяющий им получать песок, который они роют. Стимуляцией гипоталамуса можно заставить крыс что-нибудь грызть, и возможность грызть при этом служит для них подкреплением [2023]. У приматов подкреплением служит даже игра [1669]. Теория Ирсмака [19521 «о преобладающей реакции» является крайним выражением рассматриваемой точки зрения; он считает, что любая доминирующая реакция способна играть роль подкрепления для предшествующей более слабой реакции. Например, крысы, испытывающие жаяеду, будут пробегать в колесе больше, если им во время движения колеса давать возможность пить; с другой стороны, они будут чаще лить, если возможность попасть в колесо будет им предоставляться только после того, как они попьют. Аналогично у детей, которые берут конфеты из автомата, скорость поедания конфет увеличивается, когда скорость, с которой они по'лучают конфеты (первоначально она выше, чем скорость поедания конфет) начинает зависеть от нее. Следовательно, можно прийти к выводу, что поведенческие акты не обязательно должны иметь завершающий ларактер (т. е. приходиться на конец цепи поведенческих актов), для того чтобы служить подкреплением. Однако возникает вполне уместный вопрос: какой из двух совершенно различных ответов организма считать доминирующим, если они несоизмеримы? Кроме того, здесь все еще можно говорить о наличии побуждения, ослабляющегося в результате выполнения известной реакции; в данном случае, например, это побуждение «поиграть» с конфетным автоматом [1038].

Как правило, невозможно отделить подкрепляющий эффект выполнения реакции от подкрепляющего эффекта раздражителей, которые ее вызвали. Так, Томпсон [2358] установил, что для сиамских бойцовых рыбок (ВеНа эркпскпв) подкреплением может служить их отражение в зеркале; и движущаяся, и неподвижная модели оказались менее эффективным подкреплением, чем зеркало, и к тому же еще н менее эффективными как факторы, вызывающие демонстрационное поведение (см. также [1103]). Поэтому Томпсон полагает, что раздражители, наиболее эффективно вызывающие демонстрацию, будут и наилучшим подкреплением, хотя он и отмечает, что решающим здесь, возможно, является сам факт выполнения реакции. Однако некоторые раздражители оказываются эффективными, хотя вызывают всего лишь ориентировочную реакцию. Стивенсон [2292, 2293] показала, что для самцов зябликов, которым вводили тестостерон, подкреплением служила их видовая песня, хогя при ее звучании отмечалась лишь ориентировочная реакция (см. разд. 19.4). В подобных случаях, по-вндимому, эффективность раздражителя в качестве подкрепления определяется его адаптивной значимостью в жизни вида. Именно поэтому, как установила Стивенсон, видовая песня для самцов зяблика не имела подкрепляющего значения зимой, а белый шум юй же интенсивности, что и песня, не мог служить подкреплением для птиц даже после введения тестостерона. Батлер [383, 388]обнаружил, что для макак-резусов возможность видеть других обезьян была более эффективным подкреплением, чем предъявление собак, игрушек и т. п.

Выяснилось тем не менее, что некоторые раздражители (или изменения раздражителя), по-видимому малосущественные в естественной жизни животного, могут выступать в качестве подкрепления (см. обзор [1352]). В ряде работ было обнаружено, что крысы обучаются реакции нажатия на рычаг, если после нее увеличивается освещенность [803, 1197, 1351, 1357, 1581, 2327]. Аналогичные результаты получены на обезьянах [726]. В других экспериментах получали противоположный эффект: животные нажимали на рычаг для уменьшения освещенности [155, 713, 1317, 2017]; было также показано, что подкреплением может служить включение и выключение света. Не все эксперименты, однако, приводят к положительным результатам. Среди факторов, благоприятствовавших выработке подкрепляемой светом реакции нажатия на рычаг, наиболее эффективными оказались средние значения интенсивности света; оптимальная величина освещенности зависела от возраста и предыдущего опыта животного [502, 1354, 1497, 1552, 2017], а скорость реакции — от степени голода или жажды [443, 516, 717, 1338].

Эффект подкрепления при включении и выключении раздражителя, возможно, связан с такими свойствами ситуации, как новизна [234] и (или) сложность [140]. Барри и Сайме [1551 обнаружили, что включение и выключение света подкрепляло реакцию нажатия на рычаг у крыс, а Премак и др. [1953] нашли, что частота этой же реакции, подкрепляемой светом, будет увеличиваться по мере удлинения периода пребывания (до опыта) в полной темноте (см. также [2017]). Однако какова точно роль новизны в данном случае — неясно. Берлайн и др. [236] установили, что знакомые раздражители (изменения света или звук зуммера) служат подкреплением для крыс в шумном помещении, тогда как в тихом помещении были получены прямо противоположные результаты. Отсюда они делают вывод, что график зависимости ценности подкрепления от степени активации имеет вид перевернутого и (см. разд. 9.3), причем степень активации возрастает при увеличении степени новизны раздражителя и исходного уровня активации животного. Но поскольку фактор новизны явно присущ многим подкрепляющим ситуациям (см. ниже), сохранение реакции нажатия па рычаг на протяжении многих дней скорее свидетельствует о том, что в данном случае этот фактор не играет особой роли; Каванау [1307] обнаружил, что хомячки (Рего- тузеиз) способны активно контролировать интенсивность освещения в своих клетках на протяжении нескольких месяцев.

Не исключено, что изменение раздражителя само служит подкреплением. В таком случае частота реакции нажатия на рычаг должна увеличиваться при изменении освещенности в любую сторону (разумеется, до какого-то предела). Хотя Локкард [1553] и отрицал такую возможность, более поздние эксперименты Мак-Колла [1580,1581) в значительной мере свидетельствуют в пользу этой точки зрения; оказалось, что частота данной реакции зависит именно от степени изменения, а не от определенных величин интенсивности света. Степень изменений, предпочитаемая животным, зависит от условий выращивания и режима содержания в темноте [2092]. Мак-Колл отмечает, что этот эффект накладывается на другие виды предпочтений, подчеркивая, что крысы — ночные животные. В более позднем эксперименте, поставленном с целью сравнить относительную роль изменения и предпочтения раздражителей, Локкард обнаружил Ц5541, что изменение раздражителя играло роль только вначале, тогда как предпочтение становилось все более важным в процессе проведения тестов.

Существует еще одна возможность, а именно что подкрепляющий эффект света отчасти обусловлен его ролью в зрительной исследовательской активности. Поэтому Робинсон [2026] утверждал, что если камера освещена, то дальнейшее увеличение интенсивности света должно оказаться менее эффективным подкреплением, чем такое же увеличение интенсивности, когда камера первоначально не освещена; кроме того, уменьшение освещенности было бы более эффективным подкреплением, чем выключение света. Его результаты подтвердили эту точку зрения (см. также [623]).

До сих пор результаты этих экспериментов редко рассматривались в связи с естественным образом жизни животных; как отмечает Стивенсон [2293], эффективность изменения раздражителя в качестве подкрепления, вероятно, определяется его адаптивным значением для животного в смысле естественного отбора. Столь часто используемое в экспериментах по сенсорному подкреплению чередование полной темноты и яркого света совершенно непригодно для ночных животных [1307], а циркадными ритмами при проведении опытов, jvaK правило, просто пренебрегают. Когда хомячкам (Peromyscus rnaniculatus) предоставили возможность контролировать освещенность клетки (нажимая на один рычаг, они могли увеличивать ее, а на другой — уменьшать; всего было 10 различных уровней освещенности), они самостоятельно поддерживали свой циркадный ритм в отсутствие внешнего синхронизатора и отбирали как раз ту интенсивность света, которая должна была быть в соответствующей фазе активности при естественном образе жизни. Прямая связь между циркадной периодичностью и эффективностью изменения раздражителя как фактора, служащего подкреплением [2369], была обнаружена также для крыс.

Изучая другую сенсорную модальность, Барнс и Киш [141] показали, что для мышей подкреплением служили звуки сравнительно низкой частоты и интенсивности, однако эффект оказался весьма незначительным. Еще раз надо отметить, что, возможно, применение более адекватных раздражителей было бы более эффективным, поскольку слуховая чувствительность мышей сдвинута далеко в ультразвуковую область [2293]. Эффективность подкрепления побежкой в колесе может быть связана с действием кинестетической обратной связи (гл. 11), однако дело здесь не только в одной двигательной активности. Каванау [1306] обнаружил, что хомячки (Реготуэст тапкиШив) предпочитали выбирать большое круглое колесо с барьерчиками или квадратное «колесо», нежели гладкое и круглое. Поэтому он полагает, что для получения подкрепляющего эффекта от побежки в колесе необходимы согласованность действий с точностью до долей секунды, координация движений и быстрые рефлекторные действия. Большая часть исследованных домовых мышей предпочитала небольшое гладкое круглое колесо. Каванау [1307] также обнаружил, что у хомячков активность в колесе определяется условиями освещения и изменяется (как количественно, так и качественно) в соответствии со световым режимом. Следует отметить, что роль побежки в колесе как фактора подкрепления зависит от внутреннего состояния животного. Мыши, помещенные в колесо, движение которого можно было включать и выключать, останавливали его, если оно было включено, и включали, если оно не двигалось.

Все приведенные здесь примеры, во-первых, говорят о значительном разнообразии факторов, способных служить подкреплением,

и,   во-вторых, ставят перед теорией ослабления побуждения и теорией ослабления потребности, обусловленной наличием раздражителя, серьезные проблемы. Обучение может быть связано с осуществлением некоторой реакции или с изменением раздражителя, причем во втором случае может иметь место не только снижение, но и возрастание уровня побуждения. Кроме того, хотя эффективность тех или иных факторов в качестве подкрепления и связывают с их биологическим значением, ни одна из теорий, связывающих подкрепление с выполнением специфических завершающих актов (см., папример, [808]), по-видимому, не в состоянии объяснить факты сенсорного подкрепления. И в самом деле, все указанное выше разнообразие результатов вызывает сомнение в обоснованности каких-либо обобщений относительно природы и эффектов сенсорного подкрепления для всех реакций, для всех животных и для всех условий.

Особый интерес представляет исследовательское поведение. Мы уже говорили о том, что его невозможно объяснить на основе общепринятых биологических побуждений, таких, как, скажем, голод или же как одно из проявлений общей активности (см. разд. 15.7). Однако сама возможность обследовать новую ситуацию может служить подкреплением — реакция, которая приводит к осуществлению такой возможности, скорее всего начнет повторяться (см. ссылки в разд. 15.6 и 15.7). Берлайн [237] полагал, что некоторые результаты можно понять, если предположить, что эффект подкрепления связан не с новизной раздражителей, которые исследует крыса, а с обширностью пространства и сложностью обстановки, с которой она сталкивается, хотя различие здесь, по-видимому, лишь в степени (см. также [905]). К тому же в некоторых экспериментах было показано, что при контролируемой сложности среды именно новизна раздражителей играла роль подкрепления. Латентный период побежки крыс к карточке с новым рисунком был короче, чем к уже знакомой [427, 736, 2303]. Работая с хомячками, Шнайдер и Гросс [2134] обнаружили, что постоянно меняющиеся серии объектов-раздражителей сохраняют свое подкрепляющее значение, тогда как уже знакомые объекты, теряя новизну, утрачивают и свойство служить подкреплением.

При попытке объяснить эффект подкрепления фактора новизны возникает ряд затруднений. Если допустить существование «исследовательского побуждения», вызываемого новой стимуляцией, то животное, выполняющее инструментальную реакцию, за что оно получает доступ к новой ситуации, должно было бы осуществлять зту реакцию и в отсутствие побуждения. Кроме того, если инструментальное обучение подкрепляется теми же раздражителями, которые вызывают побуждение, то обучение должно зависеть от возрастания, а не от снижения побуждения. Мы отмечали уже, что подкрепляющий эффект незавершенного спаривания основан как раз на возрастании побуждения; точно такое же объяснение было предложено для одного случая исследовательского поведения [1772]. Но тогда гипотеза о снижении побуждения теряет свое значение единой концепции; главное ее достоинство, по-видимому, заключалось в трм, что на ее основе можно было предсказать, в каких Случаях возможно обучение (см., например, [2511]).

Согласно альтернативной-точке зрения, исследовательское побуждение вызывается нехваткой новой стимуляции. Этот вопрос рассмотрел Фаулер [724]. Он различает завершающую фазу поведения этого типа, связанную с оглядыванием, оценкой, принюхиванием и другими видами обследования новой ситуации, и предшествующее ей инструментальное поведение. Подчеркивая зффект «насыщения», или «скуки», появляющийся в неизменной обстановке, он выеказы- вает предположение, что исследовательское побуждение зависит от того, как долго стимуляция не изменяется, и что величина необходимого побудительного мотива или подкрепления при обучении инструментальной реакции, приводящей к исследовательскому поведению, зависит от степени изменения ситуации. Таким образом, вместо лишения пищи и пищевого подкрепления, традиционно применяемых в зкспериментах, можно лишать животное всяких изменений раздражителей и использовать в качестве подкрепления изменения окружающей обстановки, что и показали опыты с побежкой, в которых манипулировали этими независимыми факторами.

По мнению Уотсона [2511], если предположить, что исследовательское поведение должно зависеть от побуждении, возрастающего в зависимости от степени однообразия среды, то у животного, которому позволяют исследовать неограниченно обновляющуюся среду, будет наблюдаться постепенное снижение исследовательского поведения из-за ослабления побуждения. Однако этот довод недостаточно убедителен, так как нельзя забывать, что побудительная мотивация,приобретаемая во время исследовательской активности, больше той, которая необходима для компенсации ослабления побуждения.

В связи с тем что попытки сформулировать некоторые общие законы обучения (на поведенческом уровне), учитывающие* роль подкрепления, порождают так много спорных вопросов, имеет смысл изложить некоторые соображения. Как мы видели, ситуации, приводящие поведение к завершению, различаются в зависимости от типа рассматриваемой реакции. У позвоночных пищевое поведение прекращается при действии самых разных завершающих раздражителей. Половое поведение также зависит от изменений ситуации. Поведение страха прекращается после устранения внешнего раздражителя. Между тем исследовательское поведение и ориентировочный рефлекс прерываются в отсутствие какого-либо внешнего изменения, что заставляет предполагать наличие изменений во внутренней организации животного. В пищевой и половой активности последствия реакций, приводящих соответствующее поведение к окончанию, могут впоследствии увеличи+ь вероятность предшествующих инструментальных реакций. Если то же самое верно и для исследовательского поведения, то его подкрепление должно наступать в результате внутренних изменений. В таком случае соответствующие акты исследовательского поведения вызываются новыми раздражителями и прекращаются, когда раздражители перестают быть новыми, что обусловлено определенными центральными изменениями.

Возвращаясь к более общей проблеме, отметим, что общим признаком всех подкрепляющих агентов (исключая электрическое раздражение мозга — см. ниже) принято считать то, что они заставляют животное обращать на них внимание или вызывают ориентировочную реакцию. Известно, что простое предъявление крысам объектов различной формы облегчает последующее решение задач на их различение; при этом весьма существенно, что предварительное предъявление оказывается тем эффективнее, чем более заметны предъявляемые фигуры. В свою очередь у птенцов некоторых воробьиных птиц одно лишь прослушивание песни вызывает в дальнейшем модификации в пении, однако наиболее эффективными будут те типы песни, которые имеют признаки видовой песни или исходят от определенной особи; как полагают, именно в этих случаях легче всего возникает ориентировочная реакция. Действительно, одно время считали, что ориентировочная реакция сама по себе служит подкреплением. Однако эти рассуждения приводят к порочному кругу. Фактически все раздражители, которые оказывают влияние на животное, вызывают хотя бы в первое время ориентировочную реакцию.

Берлайн [235] отстаивает гипотезу, согласно которой подкрепление есть результат изменения активации. Многие исследователи допускают, что ослабление активации может оказаться важным фактором. Так, во многих случаях после подкрепления (например, после получения пищи или спаривания) наступает состояние полной неподвижности, а окончание действия многих агентов, увеличивающих активацию (например, боли, страха), становится фактором подкрепления. Чтобы объяснить тот факт, .что некоторые ситуации, приводящие к повышению активации, играют роль подкрепления (например, новые раздражители, обстановка, в которой возможно исследовательское поведение), Берлайн [234] ранее выдвинул предположение, что, хотя, вообще говоря, подкреплением служит уменьшение активации, умеренное ее возрастание не обязательно имеет отрицательное значение, и, кроме того, за ним может следовать некоторое снижение активации, которое и служит подкреплением (например, новые раздражители в результате обследования становятся знакомыми). Он полагал также, что в таких ситуациях активация может возрастать за счет реакции «ожидания неизвестного», которая исчезает по мере ознакомления со средой.

В последнее время Берлайн пришел к выводу,' что подкрепление может быть связано также с увеличением активации. Он указал, например, что пища и спаривание могут приводить как к увеличению, - так и к уменьшению активации. Поскольку сильное увеличение активации, несомненно, неприятно для животного, Берлайн вынужден предположить, что имеется некоторая критическая степень усиления активации, причем чем выше ее уровень, тем меньший подкрепляющий эффект оказывает ее увеличение. Тем не менее он подчеркивает, что подкрепление должно включать скорее «нечто положительное, возникающее или нарастающее по интенсивности, а не то, что прекращается или сходит на нет». Поэтому он выдвигает предположение, что по мере увеличения потенциала активации сначала проявляется его подкрепляющий эффект, а затем нарастают до максимума неприятные для животного свойства. Следовательно, алгебраическая сумма этих эффектов достигает положительного пика при умеренных изменениях, а затем уменьшается и становится отрицательной, причем положение’максимума, вероятно, зависит от уровня активации.

Мы вынуждены добавить здесь в скобках, что исследования по электрическому раздражению мозга (см. разд. 9.3), на которые возлагалось столько надежд каких-нибудь десять лет назад, немногое дали для понимания природы подкрепления. Хотя, как известно, этот вид стимуляции может служить эффективным подкреплением при выработке инструментальных реакций у крыс (и других животных — [60, 1627]), механизм ее действия далеко не ясен. В то время как в ряде участков мозга, с которых можно получить самораздра- жение, имеются определенные зоны, стимуляция которых вызывает реакцию приближения [2447] или такие виды активности, которые сами по себе являются подкрепляющими (еда, спаривание), общность таких закономерностей далеко не очевидна; несомненно, с некоторых участков мозга получали и умеренное самораздражение, и умеренную реакцию избегания [1879]. Во всяком случае, действие электрического раздражения мозга может отчасти затрагивать сенсорный приток [2447]. Дейч [573, 574] предположил, что электрическое раздражение мозга обладает двумя независимыми свойствами: оно может служить подкреплением и влиять на мотивационное состояние. Например, скорость побежки, подкрепляемая электрическим раздражением мозга, при увеличении промежутка между попытками будет тотчас же падать, что связано, вероятно, с быстрым ослаблением мотивации; кроме того, некоторые параметры раздражения, влияющие на уровень реакции, не действуют на обучение различению [1314] в отличие от других параметров. Скотт [2173] показал, что электрическое раздражение мозга служит эффективным подкреплением и при попытках, разделенных большим промежутком времени.

Что же можно сказать в итоге? Ясно, что простых обобщений относительно природы факторов, которые могут служить подкреплением, пока что сформулировать нельзя. Теория ослабления побуждения сослужила свою службу, но, как теперь ясно, она отнюдь не универсальна; удовлетворительной альтернативной теории до сих пор нет. Возможно, поиски единого понятия подкрепления преждевременны. Во всяком случае, у нас есть более близкая и более актуальная цель: необходимо точно установить (на уровне поведения), какие ситуации служат подкреплением для гораздо более широкого круга типов поведения, чем те, которые исследованы до сих пор.



загрузка...