Теоретические основания дрессировки - Гриценко Владимир Васильевич. Страница 12
3) в зависимости от соотношения во времени действия условного и безусловного раздражителей:
— наличные условные рефлексы, образующиеся при совпадении во времени условного раздражителя и подкрепления. К наличным относят совпадающие условные рефлексы, когда подкрепление почти сразу же (не позднее 1—2 сек) присоединяется к действию условного раздражителя. Оставленные условные рефлексы при образовании которых подкрепление присоединяется к условному раздражителю спустя 5—30 сек. Запаздывающие рефлексы, когда подкрепление предъявляется после длительного изолированного действия условного раздражителя;
— следовые условные рефлексы, при образовании которых условный раздражитель и подкрепление отделены друг от друга определенными интервалами времени, то есть подкрепление сочетается с какими-то остаточными процессами возбуждения в анализаторных клетках коркового пункта условного раздражителя. В данном случае условным раздражителем становится не сам сигнал, а какой-то след от его действия. При образовании таких рефлексов, время между действием условного и безусловного раздражителей может составлять от 1 до 4 минут;
4) в зависимости от структуры условного сигнала:
— условные рефлексы на простые раздражители;
— рефлексы на одновременные комплексные раздражители, состоящие из нескольких компонентов, действующих одновременно;
— рефлексы на последовательные комплексные раздражители, отдельные компоненты которых действуют последовательно, накладываясь друг на друга;
— условные рефлексы на цепи раздражителей, когда отдельные компоненты сложного раздражителя действуют последовательно не совпадая друг с другом. Условные рефлексы на сложные раздражители вырабатываются быстро и легко, как на простые раздражители. Сначала условнорефлекторная реакция возникает не только на сложный раздражитель, но и на его отдельно взятые компоненты при их изолированном применении. По мере упрочнения условного рефлекса, его компоненты постепенно утрачивают сигнальное значение изолированного применения и сливаются в единое целое;
5) в зависимости от особенностей подкрепления:
— условные рефлексы первого порядка, образующиеся на базе безусловных рефлексов, то есть при безусловнорефлекторном подкреплении;
— условные рефлексы высшего порядка, образующиеся на базе ранее выработанного условного рефлекса. Условные рефлексы второго порядка образуются при соблюдении определенных правил: пауза между вторичным условным раздражителем и первичным должна быть не менее 10 сек (если эта пауза будет меньше, то вместо условного рефлекса второго порядка, образуется условный тормоз). Чем сильнее вторичный раздражитель, тем труднее образуется условный рефлекс второго порядка. Условные рефлексы более высокого порядка (выше третьего) у собак выработать не удается;
— подражательные условные рефлексы, при выработке которых подкреплением является не безусловное раздражение, а лишь вид действия другого животного (однако в последнее время выяснилось, что это не так);
— ассоциации, образующиеся при сочетании индифферентных раздражителей, на базе ориентировочных реакций.
Выделяют также условные рефлексы на отношение (вес, размер и т. п.) и на временные интервалы (время). Условные рефлексы «на время» могут быть выработаны на различные периоды — от нескольких секунд до часов.
Под динамическим стереотипом понимают зафиксированную систему условных и безусловных рефлексов, объединенных в единый функциональный комплекс, образующийся под влиянием стереотипно повторяющихся изменений и воздействий внешней и внутренней среды организма.
Неизменный, стереотипный порядок следования раздражителей получил название внешнего стереотипа.
Динамический стереотип вырабатывается с трудом, но образовавшись, приобретает инертность и при неизменных условиях существования становится все прочнее и прочнее. Переделка динамического стереотипа возможна, но представляет большую трудность для нервной системы.
НАУЧЕНИЕ НА ОСНОВЕ ОБРАЗОВАНИЯ ИНСТРУМЕНТАЛЬНЫХ УСЛОВНЫХ РЕФЛЕКСОВ (ОПЕРАНТНОЕ НАУЧЕНИЕ)
Отцом инструментальной формы научения считается Э. Торндайк, который еще в конце прошлого века назвал такую форму научения обучением «методом проб, ошибок и случайного успеха». Торндайк проводил опыты, в которых кошки и другие животные должны были нажимать на задвижки или тянуть за пружины, чтобы, открыв дверцу, выйти из ящика и получить снаружи пищу. Ящики были сделаны так, что пища была заметна. Голодная кошка, впервые посаженная в ящик, производит множество действий, в том числе тянется к пище через щели и скребет предметы, находящиеся внутри ящика. Наконец она случайно ударяет по запирающему механизму и выскакивает наружу. При последующих пробах действия кошки постепенно концентрируются вблизи этого механизма, и другая активность со временем прекращается. Наконец кошка становится способной правильно вести себя, как только ее поместят в ящик. По словам Д. Мак-Фарленда: «Цирковые дрессировщики знали о научении такого типа в течение столетий, но Торндайк первый исследовал его систематически и создал на основе своих наблюдений стройную теорию».
Но отечественному читателю более известен американский ученый Беррес Фредерик Скиннер, который внес основной вклад в изучение закономерностей образования инструментальных условных рефлексов. Предложенное им определение оперантного научения и оперантного условного рефлекса сейчас наиболее употребимы при характеристике инструментальной формы научения. Может быть не очень систематично, но популярно и талантливо оперантный метод научения и оперантный метод дрессировки изложен в работах американского психолога и дрессировщика Карен Прайор.
Вместо неоднократного применения сочетаний, характерного для классической выработки условных рефлексов, Скиннер разработал методику свободного оперантного поведения, при которой животному позволяют совершать различные действия, нужные из которых подкрепляют. Чаще всего для таких опытов выбирались крысы и голуби, хотя использовались и другие животные, а также человек. Знаменитый «ящик Скиннера» на самом деле представляет собой ящик с одной из сторон которого имеется педаль (рычаг), который соединен с кормушкой. Снаружи за стенкой расположен сложный механизм, функция которого состоит в том, что после каждого нажатия на педаль в кормушку падает гранула корма. Как только крысу сажают в ящик, она начинает активно исследовать его — обнюхивать и карабкаться на стенки. При этом случайно нажимает на педаль после чего в кормушку падает корм. Обычно животное этого не замечает, но найдя пищу, съедает ее. Продолжая обследовать ящик, крыса вновь случайно нажимает на педаль и постепенно обнаруживает зависимость между этим действием и результатом. Как только временная связь станет для нее понятной, крыса начинает нажимать на педаль, когда захочет есть. Характерно, что вначале крыса нажимает на рычаг очень редко, затем число нажатий начинает медленно расти. После примерно 140 минут опыта число нажатий вдруг возрастает очень быстро. Совсем не обязательно ждать от животного случайного нажатия на рычаг. Это действие можно спровоцировать (инициировать) различными способами, например, для обучения голубя клевать педаль, к ней можно приклеить зернышко. Если говорить о наработке форм поведения связанных с пищевой потребностью, то рекомендуется понизить массу тела животного до 80% (!) от первоначальной, то есть создать у животного выраженную пищевую потребность (мотивацию).
В «ящике Скиннера» животное может освоить не только формы пищевого поведения. Например, если соединить рычаг с обогревателем воздуха, крыса быстро обучается поддерживать оптимальную для себя температуру, регулярно отключая и включая обогреватель нажимом на рычаг.
Хотя открытие и изучение инструментальных условных рефлексов считается заслугой американской науки, они исследовались и в школе И.П. Павлова (например, А.Г. Ивановым-Смоленским, Г. Зеленым). Известный польский ученый Ю.М. Конорски, который также является учеником Павлова, считается одним из создателей теории об инструментальных условных рефлексах, которые он называл условными рефлексами второго типа.