Теория оперантного научения Б.Ф. Скиннера. Теория оперантного обусловливания (Торндак) Концепцию оперантного научения

В основании теории оперантного обусловливания Скиннера лежит тот простой факт, что не всегда действия живого существа являются реакцией на ту или иную комбинацию внешних воздействий - стимулов. Довольно часто (по мнению Скиннера , в большинстве случаев) поведение выглядит так, как будто бы ему не предшествуют никакие видимые стимулы. В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри (так называемый "ящик Скиннера ") и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее - получала желаемое. Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса такого воздействия не наблюдается. Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение. В этом смысле оперантное поведение активно и направлено на исследование окружающего мира, респондентное поведение реактивно и лишь следует тем или иным воздействиям, в процессе классического обусловливания, приобретшим для организма определенное сигнальное воздействие. Но сама по себе исследовательская активность ничего не дает - она лишь увеличивает шансы встретить те или иные последствия. То, каким образом видоизменяется поведение, зависит в первую очередь от характера последствий - от того, будут эти последствия приятными или неприятными. Приятные последствия Скиннера называл "подкреплением". Экспериментируя с разными типами подкрепления, Скиннер вывел одну бесспорную и всегда воспроизводимую закономерность: образцы поведения (операнты), вслед за которыми следуют приятные последствия, в будущем встречаются чаще. Крыса чаще нажимает на педаль, если непосредственно вслед за этим действием она получает кусочек пищи. Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу - зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал "законом выгоды (приобретения)", иногда его еще называют первым законом оперантного научения . Закон приобретения означал для Скиннера и его последователей следующее: если перед терапевтом или учителем встает задача сформировать новые привычки, новые образцы поведения, то единственный способ, который дает предсказуемые и надежные результаты, состоит в том, что мы специально создаем позитивные последствия для так называемого "целевого" поведения, т.е. поведения, с которым мы бы хотели чаще встречаться впредь. Подкрепляя это поведение, мы обязательно добьемся своего: это поведение будет встречаться чаще.

» Оперантная теория Скиннера

© В.А. Роменець, И.П. Маноха

Теория оперантного обусловливания Берреса Ф. Скиннера (1904-1990)

Вторым после К. Халла ведущим необихевиористом считается Беррес Фредерик Скиннер (Burrhus Frederic Skinner), но по популярности он значительно его превышает. До самой своей смерти он оставался одним из самых известных психологов мира, его идеи и сегодня влияют на характер психологических исследований, на педагогику и практику психологии. Историки науки задают вопрос: сделал ли Скиннер существенный вклад в человеческое самопознание? И в основном отвечают так: «Он был слишком далек от такого рода вопросов».

Понимание человеком самого себя, или по крайней мере того, что искали философы и психологи на протяжении многих веков, никак не было целью Скиннера. Всю свою долгую жизнь он придерживался крайней бихевиористской позиции, согласно которой «субъективные сущности», такие как ум, мышление, память, аргументация, не существуют вовсе, а есть только «вербальными конструктами», грамматическими ловушками, в которые человечество попало с развитием речи. Скиннер отыскивал детерминанты поведения: каким образом оно обуславливается внешними причинами. Он не сомневался в правильности своей позиции, поскольку считал, что «бихевиоризм нуждается в объяснении».

Теория обусловливания, которую стремился создать Скиннер, должна была подытожить его достаточно необычные исследования: все, что мы делаем и чем мы являемся, детерминировано историей нашей наград и наказаний. Детали его теории исходили из таких принципов, как частичное подкрепление эффекта, изучение обстановки, вызывающей определенное поведение или прекращающей его.

Подобно Дж. Уотсону , Скиннер был общественно активным, в частности как публицист. В одном из своих ранних выступлений по телевидению он привел дилемму, которую предложил еще М Монтень: «Что сделали бы вы, если бы вам надо было выбрать: родить детей или создать книги?» - и ответил, что для себя лично он родил бы детей, однако его вклад в будущее был бы значительным благодаря его трудам.

Скиннер любил смеяться над терминами, которыми специалисты пользовались для понимания человеческого поведения: «Поведение свойственно человеческой природе, и потому должна быть экстенсивная «психология индивидуальных различий», в которой люди сравниваются между собой и описываются в терминах черт характера, способностей, наклонностей. Но за традицией каждый, кто имеет дело с человеческими поступками, продолжает толковать человеческое поведение донаучным способом».

Скиннер также отвергал попытки понять внутреннюю сторону характера личности: «Мы не имели потребности говорить о том, что личности, состояния ума, чувств, черты характера человека реально существуют, чтобы можно было их примирить с научным анализом поведения... Мышление и все другое является поведением. Ошибка заключается в попытках отнести поведение к душе».

По мнению Скиннера, необходимо знать внешние причины поведения и его результаты, которые можно наблюдать. Только исходя из таких предположений можно дать ясную картину активности организма как поведенческой системы.

Согласно этой позиции он выступал как убежденный детерминист: «Мы такие, какие предстаем в нашей истории. Мы хотим думать, что мы выбираем, что мы действуем, но я не могу согласиться с тем, что личность является или свободной, или ответственной». Самодостаточное и автономное человеческое бытие Скиннер считает иллюзией. Для него хороший человек является таковым, потому что полностью обусловлен вести себя определенным образом, а хорошее общество должно быть основано на «бихевиоральной технике», что означает научный контроль за поведением с использованием методов положительного подкрепления.

Современники Скиннера считали его ловким популяризатором науки: он был красноречив, уверенно эгоистичен, умел захватить внимание. Для демонстрации преимуществ техники обусловливания он учил голубя играть мелодию на игрушечном пианино, а пару голубей - в настольный теннис, когда они перекатывали мяч своими клювиками. Миллионы зрителей смотрели это по телевидению как научно-документальный фильм.


Два голубя играют в пинг-понг во время эксперимента по оперантному обучению. Кембридж, Массачусетс, июнь 1950 года.

Скиннер переносил свои натуралистические видения на придуманное им общество. В утопической новелле «Walden Two» (1948) он описывает небольшое сообщество, в котором поведение детей с самого рождения было строго обусловлено наградами (положительное подкрепление), чтобы они стали на путь сотрудничества и социабельности, все поведение научно контролируется ради всеобщего блага. Несмотря на искусственность диалогов и несколько избитый сюжет, эта книга стала любимой среди студентов. Она была быстро продана тиражом более двух миллионов экземпляров.

Популярность Скиннера у публики была намного больше, чем среди коллег-профессионалов. Журнал «Американский психолог» писал: «Скиннер является ведущей фигурой в бихевиористском мифе. Он ученый-герой, Прометей, несущий огонь открытия, мастер-технологист, главный мятежник, который освобождает наши мысли от старых взглядов».

Скиннер родился в маленьком городке в Пенсильвании, его отец был юристом. Мальчиком он увлекался изобретениями, позже, уже как психолог, он создавал оригинальную и эффективную аппаратуру для экспериментов с животными. В школе и колледже Скиннер мечтал стать писателем, а после колледжа пробовал писать. Хотя он вплотную наблюдал различные формы человеческого поведения вокруг себя, он однажды четко понял, что не может ничего сказать о том, что видел и переживал, и в глубокой печали отказался от такого рода усилий.

Но вскоре Скиннер нашел другой, более практичный для себя путь понимания человеческого поведения. Знакомясь с трудами Уотсона и Павлова, он осознал, что его будущее лежит в научном раскрытии человеческого поведения, в частности в изучении реакций обусловливания. Я был очень расстроен моим неудачами в литературе, - говорил он в 1977 г. - я был убежден, что писатель ничего на самом деле не понимает. И это повлекло то, что я вернулся в психологию».

Хотя в Гарварде тогда царила интроспективная психология, Скиннер не интересовался «внутренней историей» человека и пошел своей дорогой, проводя бихевиористские исследования с крысами. В автобиографии он откровенно говорит о том, что вопреки профессорскому обучению он становился все более бихевиористом, а на защите диссертации резко отверг критику бихевиоризма.

Опираясь на свои изобретательские способности, он сконструировал «проблемную клетку» , что было значительным достижением после известной торндайковской модели. Она была довольно просторная для белых крыс, а на стене находился бар с едой и питьем. Когда крыса, прогуливаясь по клетке, случайно упиралась передними лапами в бар, нажимая на него, еда в форме шарика попадала на поднос.

Это позволило получить более объективные данные о поведении, чем это было до скиннеровских опытов. Именно крыса «определяла», какое количество времени проходит между нажатиями на бар. Поэтому за свое открытием принципа обучения Скиннер мог благодарить так называемый «ответ крысы» - класс достижений, когда поведение животного меняется в ответ на подкрепление без вмешательства экспериментатора.

Скиннер построил исследовательскую программу с клеткой таким образом, что приближал ее условия к реальным ситуациям, где поведение подкрепляется либо не подкрепляется. Он, в частности, исследует обучение ответам, если они регулярно подкрепляются или подкрепления внезапно прерываются, а также влияние на обучение временных интервалов с их регулярностью и иррегулярностью.

На этой основе Скиннер сформулировал ряд принципов, которые проливают свет не только на поведение крыс, но и на человеческое бытие. Речь идет, в частности, о его открытии важных вариаций эффекта парциального, частичного подкрепления. Скиннер находит аналогию в поведении игроков с игровым автоматом в казино: ни крыса, ни игроки не могут предсказать, когда появится следующее подкрепление, но в них есть надежда, что оно появится при каждой новой попытке.

Важным вкладом Скиннера в науки о поведении является его концепция оперантного научения. Одним этим он уже заслуживает, по мнению американских историков психологии, видное место в кругу знаменитых психологов мира.

В классическом Павловском обусловливании безусловный ответ животного (слюноотделение) на еду превращается в условный ответ по отношению к предыдущему нейтральному стимулу (звуки метронома или звонка: решающим элементом в поведенческом изменении является новый стимул.

В торндайковском «инструментальном» обусловливании решающим элементом поведенческого изменения является ответ, а не стимул. Нейтральный ответ - случайный шаг (нажатие) на педаль во время случайных усилий получить еду - является подкрепляющим научающим шагом поведения, что приводит к изменению, которому ранее животное не было обучено.

Скиннеровское оперантное обусловливание является важным развитием инструментального. Случайное движение, которое осуществляет животное, в любом случае может быть понято как оперантное для окружающих и поэтому является, по Скиннеру, именно оперантным. Подкрепительное движение приводит к оперантному научению. При подкреплении серии небольших случайных движений экспериментатор может «создавать» поведение животного, пока оно действует такими способами, которые не были частью его оригинального природного репертуара.


Беррес Ф. Скиннер

Данный подход дал возможность Скиннеру «создать» поведение голубя - заставить того клевать большой цветной пластиковый диск, прикрепленный на стенке «скиннеровской» клетки. Он об этом пишет так: «Мы сначала дали птице пищу, когда она медленно повернулась в направлении диска. Это и обусловило частотность такого поведения. Мы поддерживали подкрепление, пока незначительное движение не было направлено к пятну (диску). Это опять меняло общее распределение поведения без выработки нового единства. Мы продолжали с помощью подкрепления позиции успешный подход к пятну, далее подкрепление было только в случае, когда голова двигалась медленно вперед, и, наконец, только тогда, когда клюв действительно имел контакт с пятном.

Таким образом, мы можем построить оперантное поведение, которое никогда не появилась бы в репертуаре организма иным образом. При подкреплении серии успешных приближений мы получаем ответ за короткое время. Возникает функционально связанное единство поведения; оно конструируется продолжающимся процессом дифференциального подкрепления в сторону от недифференциального поведения».

Скиннер уподобил оперантные тренировки голубя детскому обучению разговаривать, петь, танцевать, играть, а со временем и всему репертуару человеческого поведения, созданному из мелких звеньев простых поведенческих актов. Это можно было бы назвать «an Erector-set» (взглядом от человеческого бытия), бездумным роботом, собранным оперантным обусловливанием из многих бессмысленных кусков.

Скиннера так или иначе долго не признавали ведущие психологические учреждения, но постепенно у него появлялись сторонники, что впоследствии выразилось в издании четырех журналов скиннеровских бихевиористских работ, а также в создании специальной секции скиннеровских исследований.

Скиннеровская техника оперантного обусловливания широко использовалась в экспериментальной психологии. В последние годы его труды цитировались в сотнях научных публикаций ежегодно (что-то около седьмой части от частоты упоминаний Фрейда). Кроме того, Скиннер имел большое влияние вне главных направлений психологии.


Дэрби, 13-месячная дочь профессора Б.Ф. Скиннера, с момента рождения жила в пыленепроницаемом, закрытом и застекленном детском манеже, в котором температура и влажность регулировались автоматически. Скиннер постепенно сокращал время, которое Дэрби проводила в своем ящике, так что в конце концов она станет только спать в нем.

В 1956 г.. Во время визита в школу к своей дочери Скиннеру пришло в голову, что оперантная техника, применяемая для обучения голубя игре на пианино, может стать более эффективной для обучения, чем традиционные методы. Сложные предметы можно расчленить на простые шаги в логической последовательности; студентам могут быть поставлены вопросы, и преподавателю следует сразу ответить, какие их ответы являются правильными. Здесь работают два принципа: 1) знания, о которых рассказывают правильно, должны стать подкрепленным поведением; 2) непосредственное позитивное подкрепление работает лучше, чем разрушительное негативное подкрепление. Результат известен как «программируемая инструкция».

Поскольку педагог не может одновременно применять подкрепление в классе, где много учеников, новые учебники должны быть написаны так, чтобы вопросы и ответы следовали одни за другими. Кроме того, Скиннер предложил учебные машины для оперантного самообучения. Механическая модель со временем была отвергнута, но сегодня применение обучающих инструкций, основанных на компьютере с непосредственным подкреплением, переживает второе рождение.

В течение нескольких лет движение за программированное обучение получило широкое распространение. Принципы оперантного обусловливания были приспособлены для обучения в школах и колледжах США и других стран. Но воспитатели поняли, что «атомистические» методы программируемой инструкции являются только частью того, в чем нуждается человеческое бытие: необходимы также цельные, иерархизированные мыслительные структуры. Более поздние исследования показали, что отложенное подкрепление часто дает лучший результат, чем подкрепление мгновенное. Рассуждения о характере ответа может привести к большему эффекту в обучении, чем быстрое получение ответа. Вместе с тем скиннеровское учение о непосредственном подкреплении было квалифицировано как полезное и содержится во многих учебных планах и школьных учебниках.

Беррес Скиннер также имел определенный успех в раскрытии причин умственных и эмоциональных расстройств. Система небольших подкреплений для небольших изменений в сторону здоровья дает возможность изменить поведение пациента. В конце 40-х годов Скиннер и два его студента осуществили первое экспериментальное испытание того, что стало известно как модификация поведения . Они устроили стационар в психиатрическом госпитале близ Бостона, в котором по соответствующей методике психотические пациенты получали конфеты или сигареты, чтобы оперировать машиной соответствующим образом. Терапевты давали стимулы пациентам для соответствующего поведения, такие как средства произвольного внимания, поддержка в хозяйственных задачах, привилегии избрания компании для обеда, разговор с врачом или возможность смотреть телевизор.

Подкрепление желаемого поведения у таких людей срабатывало часто. Одна депрессивная женщина не хотела есть и боялась умереть от голодания. Но она принимала гостей, смотрела телепередачи, слушала радио, читала книги и журналы, имела цветы в своей комнате. Терапевты перевели ее в комнату, лишенную этого комфорта и направили свет прямо на нее. Если она что-то ела, определенные предметы комфорта временно возвращали в комнату. Постепенно женщина вернула свой вес. Через 18 месяцев она уже вела нормальную жизнь.

Движение «бихевиоральной модификации» распространилось на многие психиатрических больницы и школы. Такую модификацию применяли для решения важных проблем, таких как курение, ожирение, робость, тики, речевые затруднения. Это была специализированная техника бихевиоральной терапии, но основана больше на Павловском обусловливании, чем на скиннеровской модификации.


Burrhus F. Skinner

Известная книга Скиннера - «Walden Two» - не осчастливила американское общество или хотя бы часть его, но она, несомненно, повлияла на социальные представления миллионов его читателей. Некоторые усилия были сделаны, чтобы реализовать утопию по модели «Walden Two» - Тwin Oaks Community в Луизиане, штат Вирджиния, и коммуна, основанная восьмерьми людьми в 1966 году. После нескольких лет выживания эта коммуна выросла до 81 члена. Они пыталис на основе соответствующих знаний вызывать идеальное поведение и создавать модели различных его форм по методам скиннеровского подкрепления.

Скиннер как-то заметил: «Мое влияние на других людей было значительно меньшим, чем на крыс и голубей или на людей как объектов эксперимента». Это, видимо, не следует понимать буквально. То, о чем он думал всерьез, было таким: «Я никогда не сомневался в важности моей работы». И добавлял в характерном для него перверсивном стиле: «Когда эта работа начала привлекать внимание, я остерегался этого эксперимента больше, чем был доволен им. Некоторые упрекают меня, что я боялся или впадал в депрессию от так называемого самолюбия и жажды слава. Я отвергаю любой гонор, который забирал бы у меня время от моей работы или слишком подкреплял ее специфические аспекты.

Историк психологии М. Хант, излагая идеи Скиннера, не идет дальше констатации отдельных фактов и описания характерологических черт самого ученого. Но и это изложение не может не наталкивать на мысль: можно ли провести параллель между намерениями Скиннера построить идеальное коммунистическое сообщество, опираясь на идею оперантного научения, и намерениями марксистов изменить мир, опираясь на «научный коммунизм» как технологию социальной трансформации?

Роменець В.А., Маноха И.П. История психологии XX века. - Киев, Лыбидь, 2003 .

Теория оперантного обусловливания (Торндак)

Оперантно-инструментальное научение

Согласно этой теории, большинство форм человеческого поведения произвольны, т.е. оперантны; они становятся более или менее вероятными в зависимости от последствий - благоприятных или неблагоприятных. В соответствии с этой идеей и было сформулировано определение.

Оперантное (инструментальное) научение - вид научения, в котором правильная реакция или изменение поведения подкрепляется и становится более вероятным.

Этот вид научения экспериментально изучали и описали американские психологи Э. Торндайк и Б. Скиннер. Эти учёные внесли в схему научения необходимость подкрепления результатов упражнений.

В основе концепции оперантного научения лежит схема «ситуация - реакция - подкрепление».

Психолог и педагог Э. Торндайк ввёл в схему научения в качестве первого звена проблемную ситуацию, выход из которой сопровождался пробами и ошибками, приводящими к случайному успеху.

Эдуард Ли Торндайк (1874-1949) -- американский психолог и педагог. Проводил исследования поведения животных в «проблемных ящиках». Автор теории научения путем проб и ошибок с описанием так называемой «кривой научения». Сформулировал ряд известных законов научения.

Э. Торндайк проводил эксперимент с голодными кошками, находящимися в проблемных клетках. Помещённое в клетку животное могло выйти из него и получить подкормку, лишь приведя в действие специальное устройство, - нажав на пружину, потянув за петлю и т.п. Животные совершали множество движений, бросались в разные стороны, царапали ящик и т.п., пока одно из движений случайно не оказывалось удачным. С каждым новым успехом у кошки все чаще наблюдаются реакции, ведущие к цели, и все реже - бесполезные.

Рис. 12.

психоаналитический теория оперантный ребенок

«Пробы, ошибки и случайный успех» - такова была формула для всех типов поведения как животных, так и человека. Торндайк высказал предположение, что этот процесс определяется 3 законами поведения:

1)законом готовности - для образования навыка в организме должно иметься состояние, толкающее к активности (например, голод);

2)законом упражнения - чем чаще какое-нибудь действие совершается, тем чаще это действие будет выбираться впоследствии;

3)законом эффекта - чаще повторяется то действие, которое дает положительныйэффект («награждается»).

Касаясь проблем школьного обучения и воспитания, Э. Торндайк определяет «искусство обучения как искусство создавать и задерживать стимулы с тем, чтобы вызвать или предотвратить те или другие реакции» . При этом стимулами могут быть слова, обращенные к ребенку, взгляд, фраза, которую он прочтет и т.д., а ответными реакциями - новые мысли, чувства, действия ученика, его состояние. Можно рассмотреть это положение на примере развития учебных интересов.

Ребенок, благодаря собственному опыту, имеет разнообразные интересы. Задача учителя - увидеть среди них «хорошие» и, исходя из них, развивать интересы, необходимые для обучения. Направляя интересы ребенка в нужное русло, учитель использует три пути. Первый путь - связать выполняемую работу с чем-то важным для ученика, доставляющим ему удовлетворение, например, с положением (статусом) среди сверстников. Второй - использовать механизм подражания: учитель сам интересующийся своим учебным предметом, заинтересует и класс, в котором преподает. Третий - сообщать ребенку такую информацию, которая рано или поздно вызовет интерес к предмету.

Другой известный учёный-бихевиорист Б. Скиннер выявил особую роль подкрепления правильной реакции, что предполагает «конструирование» выхода из ситуации и обязательность правильного ответа (в этом заключалось одно из оснований программированного обучения). Согласно законам оперантного научения поведение определяется событиями, которые последуют за ним. Если последствия благоприятны, то вероятность повторения поведения в будущем усиливается. Если последствия неблагоприятны и не подкреплены, то вероятность поведения уменьшается. Поведению, которое не приводит к должному эффекту, не научаются. Вы скоро перестанете улыбаться человеку, который в ответ не улыбается. Происходит научение плачу в семье, где есть маленькие дети. Плач становится средством воздействия на взрослых людей.

В основе этой теории также как и в павловской лежит механизм установления связей (ассоциаций). В основе оперантного научения также лежат механизмы условных рефлексов. Однако это - условные рефлексы иного типа, чем классические. Скиннер назвал такие рефлексы оперантными или инструментальными. Их особенность в том, что активность сначала порождается не сигналом извне, а потребностью изнутри. Активность эта носит хаотический случайный характер. В ходе её с условными сигналами связываются не только врожденные ответы, а любые случайные действия, которые получили награду. В классическом условном рефлексе животное как бы пассивно ждет, что с ним сделают, в оперантном рефлексе - животное само активно ищет правильное действие и когда его находит, то оно его усваивает.

Техника выработки «оперантных реакций» была применена последователями Скиннера при обучении детей, их воспитании, при лечении невротиков. Во время второй мировой войны Скиннер работал над проектом использования голубей для управления стрельбой по самолётам.

Посетив однажды урок арифметики в колледже, где занималась его дочь, Б. Скиннер ужаснулся, сколь мало используются данные психологии. В целях улучшения преподавания он изобрёл серию обучающих машин и разработал концепцию программированного обучения. Он надеялся, основываясь на теории оперантных реакций, создать программу «изготовления» людей для нового общества.

Оперантное научение в работах Э. Торндайка. Экспериментальное исследование условий приобретения действительно нового поведения, а также динамики научения находилось в центре внимания американского психолога Э. Торндайка. В работах Торндайка изучались преимущественно закономерности решения проб. Экспериментальное исследование условий приобретения действительно нового поведения, а также динамики научения находилось в центре внимания американского психолога Э. Торндайка. В работах Торндайка изучались преимущественно закономерности решения проблемных ситуаций животными. Животное (кошка, собака, обезьяна) должно было самостоятельно найти выход из специально сконструированного «проблемного ящика» или из лабиринта. Позже в качестве испытуемых в аналогичных опытах участвовали и маленькие дети.

При анализе такого сложного спонтанного поведения, каким представляется поиск способа решения лабиринтной задачи или отпирания дверцы (в отличие от ответного, респондентного), трудно выделить стимул, вызывающий определенную реакцию. По данным Торндайка, первоначально животные совершали множество хаотичных движений - проб и лишь случайно производили нужные, которые приводили к успеху. При последующих попытках выйти из этого же ящика наблюдалось уменьшение числа ошибок и сокращение количества затраченного времени. Тип научения, когда испытуемый, как правило, неосознанно пробует разные варианты поведения, оперетты (от англ. operate -- действовать), из которых «отбирается» наиболее подходящий, наиболее адаптивный, получил название оперантного обусловливания.

Метод «проб и ошибок» в решении интеллектуальных задач стал рассматриваться как общая закономерность, характеризующая поведение и животных, и человека.

Торндайк сформулировал четыре основных закона научения.

1. Закон повторения (упражнения). Чем чаще повторяется связь между стимулом и реакцией, тем быстрее она закрепляется и тем она прочнее.

2. Закон эффекта (подкрепления). При выучивании реакций закрепляются те из них, которые сопровождаются подкреплением (положительным или отрицательным).

3. Закон готовности. Состояние субъекта (испытываемые им чувства голода, жажды) небезразлично для выработки новых реакций.

4. Закон ассоциативного сдвига (смежности во времени). Нейтральный стимул, связанный по ассоциации со значимым, тоже начинает вызывать нужное поведение.

Торндайком были выделены также дополнительные условия успешности научения ребенка -- легкость различения стимула и реакции и осознание связи между ними.

Оперантное научение происходит при большей активности организма, оно контролируется (определяется) его результатами, последствиями. Общая тенденция такова, что если действия привели к позитивному результату, к успеху, то они будут закреплены и повторены.

Лабиринт в опытах Торндайка служил упрощенной моделью окружающей среды. Лабиринтная методика действительно в какой-то мере моделирует отношения организма и среды, но очень узко, односторонне, ограниченно; и переносить закономерности, открытые в рамках этой модели, на социальное поведение человека в сложно организованном обществе чрезвычайно трудно.

(B.F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.

Как уже и говорилось ранее, респондентное поведение - это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно - его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.

Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности - это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы ).

Реакция - это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения - это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени - это образцы оперант-ной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.

Оперантное научение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Примером оперантного поведения служит ситуация, встречающаяся почти в каждой семье, где есть маленькие дети, а именно - оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей - выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием , все же многие родители упорно подкрепляют последний.

Согласноэтой теории, большинство форм человеческого поведения произвольны, т.е. оперантны; они становятся более или менее вероятными в зависимости от последствий – благоприятных или неблагоприятных. В соответствии с этой идеей и было сформулировано определение.

Оперантное (инструментальное) научение – вид научения, в котором правильная реакция или изменение поведения подкрепляется и становится более вероятным.

Этот вид научения экспериментально изучали и описали американские психологи Э. Торндайк и Б. Скиннер. Эти учёные внесли в схему научения необходимость подкрепления результатов упражнений.

В основе концепции оперантного научения лежит схема «ситуация – реакция – подкрепление».

Психолог и педагог Э.Торндайк ввёл в схему научения в качестве первого звена проблемную ситуацию, выход из которой сопровождался пробами и ошибками, приводящими к случайному успеху.

Эдуард Ли Торндайк (1874–1949) - американский психолог и педагог. Проводил исследования поведения животных в «проблемных ящиках». Автор теории научения путем проб и ошибок с описанием так называемой «кривой научения». Сформулировал ряд известных законов научения.

Э.Торндайк проводил эксперимент с голодными кошками, находящимися в проблемных клетках. Помещённое в клетку животное могло выйти из него и получить подкормку, лишь приведя в действие специальное устройство, - нажав на пружину, потянув за петлю и т.п. Животные совершали множество движений, бросались в разные стороны, царапали ящик и т.п., пока одно из движений случайно не оказывалось удачным. С каждым новым успехом у кошки все чаще наблюдаются реакции, ведущие к цели, и все реже – бесполезные.

Рис. 12. Проблемные клетки, по Э. Торндайку

«Пробы, ошибки и случайный успех» – такова была формула для всех типов поведения как животных, так и человека. Торндайк высказал предположение, что этот процесс определяется 3 законами поведения:

1)законом готовности – для образования навыка в организме должно иметься состояние, толкающее к активности (например, голод);

2)законом упражнения – чем чаще какое-нибудь действие совершается, тем чаще это действие будет выбираться впоследствии;

3)законом эффекта –чаще повторяется то действие, которое дает положительный эффект («награждается»).

Касаясь проблем школьного обучения и воспитания, Э. Торндайк определяет «искусство обучения как искусство создавать и задерживать стимулы с тем, чтобы вызвать или предотвратить те или другие реакции» . При этом стимулами могут быть слова, обращенные к ребенку, взгляд, фраза, которую он прочтет и т.д., а ответными реакциями – новые мысли, чувства, действия ученика, его состояние. Можно рассмотреть это положение на примере развития учебных интересов.



Ребенок, благодаря собственному опыту, имеет разнообразные интересы. Задача учителя – увидеть среди них «хорошие» и, исходя из них, развивать интересы, необходимые для обучения. Направляя интересы ребенка в нужное русло, учитель использует три пути. Первый путь – связать выполняемую работу с чем-то важным для ученика, доставляющим ему удовлетворение, например, с положением (статусом) среди сверстников. Второй – использовать механизм подражания: учитель сам интересующийся своим учебным предметом, заинтересует и класс, в котором преподает. Третий – сообщать ребенку такую информацию, которая рано или поздно вызовет интерес к предмету.

Другой известный учёный-бихевиорист Б. Скиннер выявил особую роль подкрепления правильной реакции, что предполагает «конструирование» выхода из ситуации и обязательность правильного ответа (в этом заключалось одно из оснований программированного обучения). Согласно законам оперантного научения поведение определяется событиями, которые последуют за ним. Если последствия благоприятны, то вероятность повторения поведения в будущем усиливается. Если последствия неблагоприятны и не подкреплены, то вероятность поведения уменьшается. Поведению, которое не приводит к должному эффекту, не научаются. Вы скоро перестанете улыбаться человеку, который в ответ не улыбается. Происходит научение плачу в семье, где есть маленькие дети. Плач становится средством воздействия на взрослых людей.

В основе этой теории также как и в павловской лежит механизм установления связей (ассоциаций). В основе оперантного научения также лежат механизмы условных рефлексов. Однако это – условные рефлексы иного типа, чем классические. Скиннер назвал такие рефлексы оперантными или инструментальными. Их особенность в том, что активность сначала порождается не сигналом извне, а потребностью изнутри. Активность эта носит хаотический случайный характер. В ходе её с условными сигналами связываются не только врожденные ответы, а любые случайные действия, которые получили награду. В классическом условном рефлексе животное как бы пассивно ждет, что с ним сделают, в оперантном рефлексе – животное само активно ищет правильное действие и когда его находит, то оно его усваивает.

Техника выработки «оперантных реакций» была применена последователями Скиннера при обучении детей, их воспитании, при лечении невротиков. Во время второй мировой войны Скиннер работал над проектом использования голубей для управления стрельбой по самолётам.

Посетив однажды урок арифметики в колледже, где занималась его дочь, Б.Скиннер ужаснулся, сколь мало используются данные психологии. В целях улучшения преподавания он изобрёл серию обучающих машин и разработал концепцию программированного обучения. Он надеялся, основываясь на теории оперантных реакций, создать программу «изготовления» людей для нового общества.

Поделиться: