Южнорусские овчарки Поволжья

Объявление

Все возможности форума доступны только зарегистрированным пользователям.

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Южнорусские овчарки Поволжья » О дрессировке - все » И.Затевахин.Подкрепление и наказание.


И.Затевахин.Подкрепление и наказание.

Сообщений 1 страница 10 из 10

1

Опубликовано в журнале "Друг" №№ 10-12 (2008) - № 1 (2009)
Мне статья очень понравилась,а попалась случайно,я и ДРУГ-то не читаю давно.
:dontknow:

Подкрепление и наказание
Вместо введения
В нашей непростой жизни нет-нет да и случаются приятные моменты. Один из них – заметное повышение уровня и качества дрессировки в нашей стране.Все больше практикующих тренеров и спортсменов переключаются на современные методы обучения. Именно методы, потому что использующих ту или иную методику в целостном, не фрагментарном виде по-прежнему крайне мало. Но ничего, главное – прогресс налицо. При этом (что вполне объяснимо) дрессировка как вид деятельности четко разделилась на два направления.
Первое – пользовательная дрессировка. Цель ее – изменить поведение собаки таким образом, чтобы сделать ее существование комфортным для владельца (или проводника, если речь идет о служебных собаках). То есть цель пользовательной дрессировки – сделать, «слепить» пса в соответствии с потребностями и представлениями о «прекрасном» его владельца. При этом абсолютно неважно, о какой именно дрессировке идет речь – послушании, защите или поиске кладов.
К сожалению, данное направление – самая благодатная почва для разнообразных шарлатанов – «зоопсихологов», «корректоров психики и поведения» и т. д., поскольку нет четких критериев оценки результата. Напортачив, «специалист» всегда может сослаться на сложность или запущенность случая, генетические отклонения объекта дрессировки и еще бог знает на что. Главным инструментом «корректоров» является их язык: чем цветистее речь и туманнее термины, тем, как правило, хуже специалист. И чем проще и доступнее язык, тем лучше дрессировщик.
Второе направление дрессировки можно условно назвать «спортивно-дипломным». И именно здесь наши тренеры и спортсмены сделали громадный шаг вперед. На мой взгляд, потому, что имеют четкие критерии оценки: победу в соревнованиях, получение заветного диплома.
Правда, должен сразу оговориться, получение диплома, скажем, по ОКД еще не означает, что собака, его заработавшая, абсолютно управляема вне дрессировочной площадки. Точно так же, как диплом по ЗКС или даже – увы! – призовые места по Рингу еще не означают, что ваша собака готова к борьбе с настоящим, а не «спортивным» злоумышленником. К сожалению, проблема «формального» выполнения собакой навыка все еще, как говорится, «в полный рост» стоит на повестке дня. По-прежнему многие собаки идеальны в рамках площадки, но плохо управляемы и ненадежны в быту. Но, собственно, не об этом речь. А о том, что общий класс дрессировки существенно вырос. С чем это связано? Ответ содержится в начале статьи – шире стали применяться современные методы обучения, которые раньше использовались лишь единицами.
И самый главный плюс состоит в том, что дрессировщики, наконец, стали адекватно использовать такой механизм, как подкрепление.

0

2

Главное, чтобы было интересно
Благодаря тому, что появилась возможность получать информацию из-за рубежа, наши тренеры, наконец, стали применять такой эффективный метод дрессировки, как метод положительного условного подкрепления. Слегка отступив от темы, напомню, что он является вариантом метода оперантного научения, который (несмотря на его пугающе-научное название) долгие годы был (и является) довольно обыденным «орудием труда», используемым в защитной службе. Метод этот еще с конца 80-х внедрял такой известный специалист, как В.С. Варлаков, а также разношерстный коллектив Лиги профессиональных дрессировщиков собак, который мне довелось собрать и возглавить.
Метод условного положительного подкрепления популярен ныне в цирковой дрессировке, аджилити и послушании. Воистину, нет пророков в своем отечестве: помнится, как безуспешно те же двадцать лет назад пытался обратить в свою веру широкие массы тот же Валерий Варлаков!
Не помогли и публикации в нашем журнале, и даже создание группы цирковой дрессировки в г. Пушкино, где Валерий Степанович пытался пропагандировать метод условного подкрепления, в том числе демонстрируя собственную обученную собаку – миттельшнауцера Саньку.
Должен заметить, что метод условного подкрепления (как говорил сам автор, «метод условных подкрепляющих воздействий») В.С. Варлаков применял значительно более тонко и корректно, нежели отдельные современные специалисты, имеющие в руках кликер, но действующие им с той же грацией, с какой можно действовать, например, каменным топором.
Вопрос: в чем суть метода? Ответ: в грамотном использовании подкрепления, с помощью которого формируется нужное человеку поведение животного. Однако, извините за каламбур, чтобы подкрепление стало подкреплением, необходимо создать соответствующие условия.
Какие? Прежде всего необходимо заинтересовать собаку. Ученые назвали бы это формированием соответствующей мотивации. Желание удовлетворить голод, желание поиграть с хозяином или любимым мячиком, желание избежать физического воздействия или недовольства со стороны хозяина – это и есть, если отбросить все сопутствующие физиологические процессы, мотивация.
Кстати, любая мотивация, как говорят ученые, «реализуется» в том или ином комплексе поведения: например пищевая мотивация – в пищедобывательном комплексе поведения, вариантом которого является комплекс поисково-охотничьего поведения. Игровая мотивация – в комплексе игрового поведения.
Каждый поведенческий комплекс включает различные позы, телодвижения – элементы поведения, «выхватывая» которые с помощью соответствующего подкрепления, можно создавать необходимые навыки. Самый простой пример – апортировка.
Склонность к апортировке, шире – к манипулированию предметами – видовая особенность высокоразвитых млекопитающих: от псовых до дельфинов и обезьян. На базе этой врожденной склонности играть с предметами и формируется, собственно, апортировка, выборка вещи, а в отдельных случаях и хватка у собаки. Но последнее, в применении к настоящим рабочим собакам, как весьма зло шутят некоторые тренеры, это метод дрессировки для сексменьшинств.
Вернемся, однако, непосредственно к разговору о мотивации. Итак, как же нам создать соответствующую задаче дрессировки мотивацию? Допустим, мы занимаемся послушанием. В этом случае один из способов стар как мир. Не кормите собаку дома, заставьте ее поголодать, а затем вынесите «рацион» на дрессировочные занятия. У голодной собаки естественным образом формируется могучая пищевая мотивация. А подкреплением, таким образом, всякий раз станет получение пищи.
Как сформировать игровую мотивацию? Искусственным образом ограничьте вашей собаке возможность играть – с людьми, другими собаками, игрушками, только ограниченное время позволяйте ей играть с вами и только определенной игрушкой (мячиком, к примеру) – и вы сформируете игровую мотивацию, а мячик станет желанной добычей, и его получение будет подкреплением. То же произойдет с любимой «кусалкой» или дрессировочным жгутом. Но здесь я, пожалуй, забегаю вперед.
Если посмотреть на это несколько иначе, то, согласно воззрениям отца теории, профессора Скиннера, любого рода мотивированное поведение следует называть реактивным. Однако если подобрать соответствующие подкрепления, то поведение можно изменять. Измененное посредством верно выбранных подкреплений поведение Скиннер назвал оперантным, причем он и его последователи довели до совершенства методику того самого условного подкрепления, о котором говорилось выше. В качестве условного подкрепления может использоваться любой сигнал – звонок, вспышка света, свист тренера или щелчок кликера. Важно, что этот сигнал связывается с получением подкрепления (в том числе пищи) механизмом «условной связи», по сути условным рефлексом. В результате звонок, вспышка света, свист тренера или щелчок кликера для животного на уровне физиологического механизма означают «Делаешь правильно, скоро получишь награду!»
В этом методе важным этапом является процесс формирования, когда необходимый навык «собирается» методом последовательного приближения, то есть не сразу, а постепенно, по шагам приближая животное и человека к искомому результату.
Здесь очень важно вовремя дать это условное подкрепление – в тот самый момент, когда поведение животного меняется в нужную сторону. Например, вы хотите научить собаку сидеть с выдержкой. Для этого сначала подкрепляется сам факт посадки собаки и закрепляется связь с командой «Сидеть!». Затем подкрепляется посадка, например перед вами, любые же иные действия пса игнорируются. Только перед вами! Затем подкрепляется не просто посадка по команде перед вами, но и продолжительное нахождение в этой позе. Далее вы начинаете отходить от собаки и подкрепляете ее, если она продолжает сидеть.
Постепенно можно усложнять упражнение, отходя от собаки, прохаживаясь вокруг нее. Можно даже подзывать ее «с выдержки»; если вы правильно подкрепляете ее поведение в позе «сидеть, замри», то чистота выполнения навыка от этого не ухудшится, как бы ни сомневались в обратном некоторые спортсмены.
Точно таким же способом можно формировать любые навыки в цирковой дрессировке и фристайле. Главное в процессе формирования – вовремя использовать условное подкрепление, причем надо, чтобы оно не было, извините за каламбур, условно-досрочным или, наоборот, условно-отсроченным, а выданным точно вовремя.

0

3

Босс всегда прав!
Очень важно и то, что при работе с сильно мотивированным животным человек становится для него «боссом», главным источником и распределителем пищи или главным и единственным партнером по любимой игре. Таким образом формируется сильная связь между животным и человеком.
Этот механизм активно эксплуатируется тренерами дельфинов. Представьте себе жизнь дельфинов в море, где за сутки они проплывают несколько десятков (а иногда и не одну сотню) километров, процентов семьдесят времени суток занимаясь поисками и поимкой добычи в разнообразной «трехмерной» среде, а остальное время развлекаясь играми с себе подобными и различными «подручными» предметами – будь то медуза, кусок водоросли или зазевавшийся баклан. Теперь сравните все это с жизнью в океанариуме. Получается, единственная возможность не только поесть, но и как-то развлечься, разнообразить довольно серые будни в ограниченном пространстве дельфинария у животных появляется лишь во время тренировок или представлений.
В этой ситуации «боссом», распределяющим дефицитный товар почти по классической формуле «хлеб и зрелища» (а в данном случае «еда и развлечения»), становится тренер, получающий возможность манипулировать животными, – подобно тому, как возможность манипуляции получает любой чиновник, имеющий возможность что-либо распределять. Поэтому дельфины в дельфинарии работают не только за еду, но и за возможность поиграть, пообщаться с тренером.
Точно так же должен манипулировать своей собакой и ее хозяин – определяя время кормежки, время прогулки, маршруты движения, характер игр. Таким образом, он контролирует и направляет в нужное русло весь поток реактивного (т. е. мотивированного) поведения собаки, с помощью подкреплений вылавливая нужные элементы и оставляя без внимания ненужные. Главное, чтобы в этом взаимодействии доминировали положительные эмоции.

0

4

Плюс и минус
Среди продвинутой дрессировочной общественности бытует мнение, что отрицательные подкрепления в оперантном методе не применяются. Следовательно, в рамках этой логики, там, где используются отрицательные подкрепления, не используется оперантное обучение. Один известный, весьма уважаемый и успешный тренер-«ипошник» как-то в разговоре со мной высказал мнение, дескать, отрицательные подкрепления вовсе и не подкрепления даже, а, скажем так, формы наказания, лишь прерывающие нежелательные действия собаки. На первый взгляд, так оно и есть. Однако!
Думается, что это не совсем так. Если мы решаем, что оперантное поведение - это такое, в процессе которого формируются определенные последовательности и элементы поведения, в конечном виде представляющие собой навыки, - так вот в этом случае любое планомерно используемое воздействие (положительное или отрицательное), ведущее к образованию и закреплению необходимого тренеру поведения, будет подкреплением.
Напомню, что оперантное поведение формируется из реактивного (или, упрощая, - естественного) поведения, которое есть не что иное, как внешнее проявление определенного поведенческого комплекса - преследования, пищедобывательного, социального и т. д. Внутренним толчком к демонстрации того или иного поведения является мотивация - некое психофизиологическое состояние, формируемое на базе естественной потребности. Формируя поведение животного, тренеры, работающие с положительным подкреплением, используют (на выбор), как правило, пищевую или игровую мотивации. А если тренер использует мотивацию избегания?
Поясню. Рывок поводка (отрицательное подкрепление) используется для выработки навыка нахождения собаки у ноги тренера в положении «рядом». В этом случае тренером эксплуатируется мотивация избегания собаки. Вопрос: формируется ли в этом случае поведение собаки? Ответ: конечно же, а чем, по-вашему, занимается тренер, как не формированием? А если поведение формируется при помощи воздействий, следовательно, оно является оперантным. Кстати, и сам Скиннер занимался чем-то похожим, формируя, если память не изменяет, у голубя некое поведение на базе избегания струи воздуха, направляемой прямо в глаз бедной птице. В немецкой школе дрессировки, «славящейся» своей тонкостью и гуманизмом, с помощью строгача и рывков поводком формируют навык удержания предмета в пасти (язык не поворачивается назвать это навыком апортировки).
При работе на базе мотивации избегания подкрепление со «знаком минус» точно так же меняет поведение, как в остальных случаях подкрепление со «знаком плюс». Парадокс заключается лишь в том, что само сформированное поведение - всегда со знаком плюс, ибо оно есть и, как говорится, материально.

0

5

Минусы с плюсами и без
Еще один момент. Коллеги и последователи Скиннера, ученые-бихевиористы, считали, что поведение подкрепляется его же (поведения) последствиями. Можно соглашаться или не соглашаться с такой постановкой вопроса. Но если этот постулат и не объясняет глубинных механизмов поведения (в отличие от условно-рефлекторной и множества других теорий), то, во всяком случае, отражает то, что можно видеть невооруженным, как говорится, глазом.
Скажем, если собака садится и получает за это лакомство, то вероятность того, что она еще раз сядет, чтобы заработать еду, существенно возрастает. Последствия поведения (получение еды и сопутствующее удовольствие) подкрепило его выполнение.
Но, с другой стороны, если собака села в результате рывка поводка, то, опять-таки, велика вероятность, что она сделает это еще раз, лишь бы избежать неприятного воздействия.
Возникает следующий вопрос: а чем же тогда отрицательное подкрепление отличается от наказания?
Начнем с терминов. Как правило, наказанием и на бытовом уровне и на профессиональном сленге называется энергичное и интенсивное физическое воздействие на питомца, сопровождаемое эмоциональными голосовыми сигналами, или попросту трепка, сопровождаемая угрозами и руганью. С другой стороны, наказать собаку можно, скажем, отправив ее «на место» - лишив общества хозяев. «Это совсем разные вещи!» - возразит продвинутый читатель-дрессировщик и будет прав. Но об этом поговорим в другой раз. А сейчас ответим на вопрос, что же роднит крепкий тумак и отлучение от общения?
Так вот, и то и другое - неприятность для собаки, дискомфорт, наказание на нашем языке. И это наказание отличается от отрицательного подкрепления (ОП) прежде всего тем, что никакого поведения не формирует. Любое подкрепление работает и становится подкреплением тогда, когда применяется последовательно. А наказание - это разовое, спонтанное воздействие, причем - и это главное! - применяемое к собаке не во время совершения ею «преступления», а позже, и иногда много позже! Именно в этом и заключается его слабая эффективность. Ряд экспериментов доказал, что чем дальше отстоит воздействие от события, к которому оно применяется, тем хуже оно с ним связывается!
Наказание, таким образом, носит спонтанный, отсроченный характер. Поэтому собака (или любое другое животное) не может точно связать свое поведение (в данном случае неправильное) с его последствиями. Они, эти последствия, наступили позже, да и за что? «За что они "прилетели"»? - думает собака. А может, и знает за что, но уже сполна насладилась содеянным: получила (в тот момент!) естественное положительное подкрепление, стащив, допустим, колбасу со стола. Накажут или нет - бог знает, а кушать и насладиться съеденным хочется сейчас. Кстати, существует ряд важнейших причин, вызывающих и закрепляющих нежелательное поведение животного, но об этом тоже как-нибудь в другой раз.

0

6

За здоровый быт!
Классической, скажем, является проблема порчи питомцем бытовых предметов. Отучить собаку от этой привычки невероятно сложно - что бы вам ни рассказывали «корректоры поведения». Но нас же интересует тот факт, что, как правило, последующие наказания животного ни к чему не приводят. Попытка решить этот вопрос «в лоб» при помощи системы положительных подкреплений вызывает множество вопросов. Например, что мы будем формировать? Поведение «я не грызу мебель»? Но тут мы вроде бы должны сформировать поведение со знаком минус, то есть то, чего не существует. Это, понятное дело, абсурд. Конечно, мне возразят, что можно сформировать «спокойное» поведение - типа я лежу, т. е. «работаю» над сохранением положения «лежа», ничего не грызу. Отвечу: можно, конечно, но метод явно не универсален и не может применяться рядовыми дрессировщиками. А ведь есть и другие методы, проверенные на практике.
На самом деле, если мы не можем сформировать новое поведение, то можем трансформировать старое. Для этого достаточно сделать правильным и легальным (то есть всячески одобряемым, и, следовательно, подкрепляемым) приемлемый вариант нежелательного поведения. К примеру, в процессе игры и использования соответствующих подкреплений можно сформировать у собаки устойчивую привычку жевать, допустим, не хозяйские ботинки, а некие игрушки-«приспособы» (жгутики, «кусалки» с секретом), в изобилии представленные в зоомагазинах. При этом дабы не вводить пса в соблазн, все остальные предметы убирают с глаз долой. Конечно, наиболее эффективен этот метод тогда, когда его начинают применять с первых шагов щенка в доме хозяина. Впрочем, это уже азбука дрессировки.

Много подходов хороших и разных

Однако необходимо особо подчеркнуть следующий момент. Не существует универсальных приемов дрессировки! То, что легко и гладко прошло с одной собакой, может не сработать с другой. В качестве примера могу вспомнить случай, произошедший с моим хорошим товарищем, весьма опытным дрессировщиком. Его вполне рабочий и вменяемый малинуа по имени Барик обладал довольно безобидной, но кажущейся моему приятелю навязчивой привычкой взлаивать при совершении любого действия. Одним из вариантов избавления пса от этой «зависимости» был метод, при котором положительно подкреплялись бы любые его действия, совершаемые без лая. Например, «Сидеть!» без подтявкивания подкрепляем, «Сидеть!» с лаем - нет. Однако конкретно в этом случае данный метод оказался неприемлемым для применения в практике нормальной жизни. Ибо! Взлаивание являлось для пса обычным явлением, а если копать вглубь - следствием его внутреннего состояния! То есть формой «сброса» излишней нервной энергии, вызываемой «пожаром», бушевавшим в его голове при начале любой деятельности. Подобным состоянием вызываются, скажем, выкрики у спортсменов, никого, кстати, не смущающие. Ученые, вероятно, объяснили бы такое состояние малинуа по имени Барик избыточным уровнем активации. Этот уровень можно было слегка понизить посредством изнурительной многочасовой тренировки, но лишнего времени мой товарищ не имел. Тогда он и решил пойти менее изящным, но более простым, как ему казалось, путем. На собаку был надет специальный «противолайный» ошейник. Механизм его действия заключался в том, что когда собака лаяла, ее било слабым разрядом тока. Когда собака молчала, разрядов не было. То есть правильное поведение формировалось на базе мотивации избегания. С помощью отрицательного подкрепления - электрических разрядов. Однако собака отреагировала на ошейник парадоксальным образом. Почувствовав первый разряд, малинуа принялся с лаем «нарезать» широкие круги, причем после каждого удара лай становился все громче и яростнее. Так пес и бегал, пока нежное инженерное устройство (видимо, не рассчитанное на энергетику малинуа) не перегорело.
Кстати, впоследствии, когда пес стал старше, привычка подтявкивать прошла у него сама собой, вместе с безудержной энергией.

Существует ли отрицательное условное подкрепление?

Возникает вопрос: если существует положительное условное подкрепление (ПУП), значит есть и отрицательное условное подкрепление (ОУП)?
У ряда дрессировщиков на это есть положительный ответ. Скажем, такой уважаемый специалист, как В.С. Варлаков, однозначно причисляет к ОУП такие сигналы, прекращающие нежелательные действия собаки, как команды «Нет!» и «Фу!», «Зя!» (последний - фирменная команда Валерия Степановича, сокращенное «Нельзя!») (В.С. Варлаков, «Сложности взаимопонимания», «Мир собак», 2008, №4).
Ну что сказать? Дальнейшие рассуждения на эту тему могут неподготовленному читателю показаться тем самым спором Арамиса со святым отцом, в процессе которого, как известно, «...Д`Артаньян понял, что тупеет». Но, как говорится, из песни слов не выкинешь.
Так вот, если считать, что любая команда, любой условный сигнал (УС) (т. е. сигнал, на который выработали условную связь), несущий неприятные последствия, является отрицательным условным подкреплением (ОУП) - тогда, конечно, эта точка зрения имеет право на существование!
Ну а если нет? Всегда ли отрицательный УС действует и применяется в роли подкрепления? Ведь за условным подкреплением всегда (пусть и с задержкой во времени) следует «просто» подкрепление. Во всяком случае, так трактуют этот процесс классики (см. Хайнд, Поведение животных. - М., 1974). Получается, что для того, чтобы с полным основанием считать команду «Зя!» отрицательным условным подкреплением (ОУП), собаку обязательно надо, фигурально выражаясь, пнуть (рвануть поводком, бросить в нее цепочку) - рано или поздно, но надо, надо условное подкрепление поддержать «просто» подкреплением! Каждый раз! Ну а в жизни, каждый ли раз мы поступаем подобным образом? И надо ли вообще это делать?
Нет, что-то здесь не так. Что такое «Фу!», «Тубо!», «Зя!», наконец? Это команда, сигнал, прекращающий нежелательное действие. После определенных манипуляций с цепочкой и поводком, после выработки условной связи - условный сигнал. Но условным сигналом (со знаком плюс, а не минус) является, к примеру, отработанная до автоматизма команда «Сидеть!»
Тогда, исходя из логики уважаемого мастера, и команда «Сидеть!» является условным положительным подкреплением! Но на это, как говорил один киногерой, «я пойтить не могу».
На мой взгляд, запрещающие команды - это не более чем сигналы. Они означают: «Прекрати это немедленно!» Помогают ли запрещающие сигналы формировать навык? Безусловно! Но только в сочетании с другими воздействиями. Как много раз говорил и писал сам В.С. Варлаков, эти сигналы могут (если правильно ими пользоваться) помочь упростить объяснение собаке границ дозволенного: и в рамках отдельного навыка, и в ее обыденной жизни вообще. Таким образом, запрещающие сигналы для собаки - это своеобразные вешки, пограничные столбы, за которые лучше не ходить. И, в отличие от собственно отрицательного подкрепления (рывков, тумаков, бросковой цепочки), они не формируют поведение (вспомним команду «Рядом!»), а прекращают или ограничивают его. Это разные вещи! А отрицательные подкрепления могут и прекратить нежелательное действие, и, повторюсь, сформировать желательное.
Конечно, для рядового тренера нет принципиальной разницы, как называются те приемы и сигналы, которые он подает собаке. Главное, грамотно их применять. А вот здесь, как мне кажется, методика сочетания положительных условных подкреплений (ПУП), отрицательных подкреплений (воздействий) (ОП) и разнообразных сигналов, предлагаемая В.С. Варлаковым, весьма эффективна - особенно в руках грамотного и хорошо разбирающегося в хитросплетениях метода специалиста. Таких, к сожалению, немного. Гораздо больше специалистов, которые не понимают сути метода, но прошли семинары у британских дрессировщиц и копируют их неточности, превращая их в собственные ошибки. Таких легко узнать по громким радостным воплям, издаваемым в ответ на любое мало-мальски правильное действие собаки. С собственными собаками они порой достигают поразительных результатов, но, как говорится, не благодаря, а вопреки. С передачей «сокровенного знания» у них получается хуже. Но это уже совсем другая история.

0

7

Отступление от классики
Как мы уже вскользь отмечали выше, не всегда и не обязательно при «оперантной» дрессировке, (если понимать её как процесс подкрепления тренером нужных ему элементов поведения животного) используется классическое условное подкрепление. Например, во время дрессировки собак по защитной службе – в качестве подкрепления используется так называемая «добыча» – дрессировочный жгутик или рукав.
Этот метод, являющийся вариантом оперантного метода, при его правильном использовании, весьма эффективен для подготовки собак к выступлениям в различных состязаниях (ИПО, мондьоринг, ЗКС и т.д.).
Суть оперантного метода применительно к защитной службе заключается в том, что тренером используется некий поведенческий механизм, позволяющий превратить какой-либо предмет в подкрепление, облегчающего, разряжающего возбуждение собаки.

Смещение, подкрепление и обучение
Как это происходит на практике? Допустим, мы играем с собакой. Играем её любимой игрушкой (жгутиком, мячиком). Играем, но не позволяем ей схватить предмет. Её возбуждение нарастает. Мы «подсовываем», ей,  что называется под нос тот самый любимый жгутик, или мячик. Собака хватает предмет. Тренер оставляет её в покое. Собака добилась того, чего хотела. «Захват» предмета становится подкреплением.  Так происходит в том случае, когда собаке понятен конечный объект её вожделения, т.е. когда её поведение целенаправленно.
Однако, для превращения предмета в подкрепление можно использовать и (смещенное) нецеленаправленное поведение.
Для начала напомню читателю, что смещенное (нецеленаправленное) поведение собаки играет, зачастую, роль своеобразного клапана, разряжающего излишнее «давление». То есть такое поведение «разряжает», «сбрасывает» возбуждение. Сильно рассердившись на начальника, мы пинаем подвернувшийся под ногу стул, а не начальника. А иногда орем на близких - хотя наше раздражение вызвал совсем другой объект. Мы разряжаемся таким образом. Истоки этого явления, заключаются, по-видимому, в «разряжающей» функции механизма переключения внимания. Т.е внимание особи переключатся на «случайный», но находящийся в поле его зрения объект, грубо говоря, не позволяя возбуждению «расплавить мозг». Именно поэтому, с моей точки зрения, смещенное поведение так легко становится стереотипным, очень быстро «запоминается» и, в случае, если оно является нежелательным, его так сложно впоследствии «выбить» из животного.
Пример – курение человека, в котором помимо чисто наркотического привыкания существенную роль играет стереотипизация смещенного поведения – человек хватается за сигарету каждый раз, когда нервничает. Здесь ритуал курения играет успокаивающую роль – точно так же, как сосание соски успокаивает ребенка. Кстати и «корни» стереотипизированных движений губ и щек курильщика, вполне вероятно произрастают из стереотипных движений рта ребенка, сосущего соску.

0

8

Смещение, подкрепление и защитная служба

Итак, смещенное поведение быстро и легко запоминается. В дрессировке можно использовать этот механизм. Если при нереализованном возбуждении собаке «подсунуть» какой-нибудь предмет, на который он сможет «сместиться», этот предмет может стать подкреплением.

Сказанное касается любого типа поведения – в т.ч. и управляемой агрессии. Животное, которого возбуждает (дразнит) помощник тренера, можно вынудить «сместиться», выбросить агрессию на, допустим, рукав или жгут. Тогда получение жгута или рукава станет подкреплением.

В свое время, в конце 80-х г., с подачи некоего тренера был поставлен своеобразный эксперимент.

В наших дрессировочных группах в массовом порядке (обучение прошло более ста пятидесяти собак), в качестве объекта смещения – «предмета-подкрепления» особым образом (см. ниже) использовалась тряпка или (чаще) кусок детского байкового одеяла (оно плотное и не сразу рвется). На самом деле, главной задачей было упрощение постановки хватки у т.н. «слабых» собак, вовсе не желающих кусать что бы то ни было. Однако в обстоятельствах группового обучения рутинный дрессировочный процесс и превратился в массовый и довольно любопытный эксперимент. Который, впрочем, по причинам, о которых речь пойдет ниже, я в своих группах прекратил через пару месяцев.

Суть метода заключалась в том, что привязанную к дереву собаку сильно «дразнили», с одной стороны нападая на стоящего рядом хозяина, с другой демонстрируя при этом страшную трусость и боязнь четвероного друга, даже если при этом он робко жался к ногам владельца. Смысл этого действа заключался в эксплуатации одного из видов агрессивного поведения, точнее «социальной агрессии», когда собака «отвечает» «агрессору», напавшему на её группу – хозяина и собственно собаку.  Для слабой собаки близость хозяина – существенное подспорье, об этом теперь знает почти каждый. Нападение, а главное поведение «труса» сильно возбуждало собаку и преумножало её смелость. Возбуждение однако, до поры до времени, не находило выхода.

Справедливости ради необходимо заметить, что тряпичный прием «вырос» из более традиционного метода развития управляемой агрессии. Его суть заключается в том, что «трусливый» фигурант пытается украсть у сильно мотивированной (т.е. голодной) собаки косточку, которая лежит на границе её «зоны действия». «Зона действия», понятное дело,  очерчивается поводком, привязанным к дереву.

Так вот, косточка располагалась на той-самой  тряпочке (куске байкового одеяла), в которую потом косточку заворачивали. Всякий раз «трусы»-помощники переставали дразнить пса, когда он хватал сначала косточку, потом косточку, завернутую в одеяло, а затем и само одеяло. Со многим собаками, и так называемыми «пищевиками» в особенности, этот метод творил чудеса.  Собаки яростно кусали кость, которую, по идее должны были любовно и с удовольствием грызть – вместо, было протянутой, но вовремя убираемой руки «труса».  И если первичная реакция на косточку была вполне себе целенаправленной, то разрядка в виде её укуса и тем более, укуса куска материи (когда косточку заворачивали в одеяло) представляла собой уже явное стереотипное смещенное поведение.

С собаками «непещевиками», которые   охотно делились косточкой с любым желающим, одеяло оживлялось, «трусы» наносили ею легкие удары по, подчеркиваю, щиколоткам владельца и соответственно естественному для настоящих трусов поведению всякий раз исчезали, когда собака совершала попытку схватить предмет.

В результате сильные собаки (попавшие в результате эксперимента в общую обойму) на второй-третий подход, слабые – к концу первого занятия, очень слабые – к концу второго, демонстрировали четкий стереотип поведения. Трусливый, подлый, дразнящийся, похожий на противного бандерлога помощник подходит – сразу кусаем одеяло. И надо же, после этого он сразу убегает. Можно успокоиться и не нервничать. Опять подходит – не тратим время на броски в его сторону – кусаем одеяло.

Таким образом, смещенное кусание одеяла приводило к разрядке возбуждения. Т.е., повторюсь,  мы формировали у собаки на базе смещенного (дразнил то человек, ему, по идее и надо «надавать», а кусаем материю) некое стереотипное поведение, с четко выраженным результатом-подкреплением – укусом одеяла. 

Дальнейшие действия тренера понятны. Кусая кусок материи всякий раз при его появлении, и в этом укусе демонстрируя свою мощь и силу (прежде всего самой себе), собака переставала слишком уж бояться человека. Тогда одеяло поднималась помощником с пола, «оживлялась»,  после предоставлялась собаке для укуса.  Затем его обвязывали вокруг защиты (с последующим кусанием) и т.д.

Метод этот, справедливости ради, давал, чего почти никогда не бывает, стопроцентный результат! Кусок материи, а за ней и рукав, завернутый в неё (материю), а затем и сам рукав рано или поздно кусали все, даже самые «чахлые» и трусливые собаки.

Вопрос: почему эксперимент был довольно быстро свернут? Ответ: он, безусловно, представляет большой интерес для исследователя поведения собак, но, как бы это помягче выразится, чересчур сложен и громоздок в реальной практике дрессировки. В большинстве случаев, когда (если) мы имеем дело с нормальными собаками, с нормальным характером, выработать реальную управляемую агрессию с последующей постановкой хватки, можно иными, значительно более простыми и быстрыми способами. Да и мало кто сейчас возиться с теми «служебными» собаками, с которыми, в погоне за лучшей долей приходилось возиться нам.  Кроме того, как это всегда бывает со смещенным поведением, выработанный в процессе его реализации стереотип и соответственно поиск «предмета – подкрепления»  в последствии проявлялся и тогда «когда надо», и «когда не надо». Например, сорвавшуюся с привязи и уже кусавшую помощника собаку легко можно было переключить с человека на кусок любимого, уже изрядно растрепавшегося одеяла. Это из серии «когда надо». Но в реальной-то жизни этого как раз и «не надо». В те годы, по правде, мало кого интересовали дипломы – хозяину была надежная собака защитница, а не «тряпичница», предпочитающая борьбу с куском материи, а не человеком. Кстати говоря, точно такие же проблемы (и это очевидно каждому) возникают и с дрессировочным рукавом, если он становится «предметом-подкреплением». Впрочем, владельцев спортивных собак это, как правило, устраивает. Плохо это или хорошо – обсудим в следующем номере.

0

9

Защитники и нападающие

В предыдущих постах мы обсудили роль смещенного (переадресованного) поведения в обучении собак. Мы рассматривали смещение как некий механизм, переключающий внимание излишне возбужденного пса на «случайный», но находящийся в поле его зрения объект. Я рассказал, как в процессе развития управляемой агрессии (и соответствующего возбуждения) у собаки при помощи смещенного (переадресованного) поведения вырабатывается механизм подкрепления. И как якобы случайный предмет (кусок материи, жгут, рукав) становится этим подкреплением. Я также напомнил о том, что смещенное поведение с последующей разрядкой очень быстро запоминается и становится стереотипным.

Возвращаясь к обучению собак разновидностям защитной службы: сейчас стереотипную поведенческую реакцию на предъявление рукава чаще формируют в процессе игры, постепенно, начиная работать с собакой со щенячьего возраста. В этом случае навыки формируются на базе трансформированного путем отбора у бывшего хищника комплекса поисково-охотничьего поведения, точнее, комплекса преследования добычи в процессе игры.

В игре с собакой жгутик или накладка «оживляются», превращаясь в добычу, подкрепление. В ряде случаев у собак стереотип на рукав вырабатывается быстрее именно в процессе игры, нежели на базе управляемой агрессии. Происходит это потому, что у животного, особенно молодого, существует потребность в игре. И эту потребность необходимо как-то удовлетворять. С другой стороны, некоторые собаки не обладают необходимыми качествами характера (прежде всего, на генетическом уровне), чтобы являлось возможным строить их (собак) обучение на базе управляемой агрессии. Как говорится, овчинка выделки не стоит. И для этих псов использование игрового метода может быть очень эффективным. Но всегда ли игра – это хорошо?

Играть, но не заигрываться

Потребность в реализации игрового поведения приводит к тому, что щенок, когда у него нет социальных партнеров (в ситуации «один дома»), ищет предмет, с которым можно поиграть (если копать глубоко – оттачивать элементы врожденного поведения). Что попадет в его поле зрения, то и будет использовано в качестве игрушки (ваша тапка, к примеру). Некоторые щенки, при высоком уровне нереализованного возбуждения (и когда оное накопилось), демонстрируют стереотипы, очевидно вызванные смещением. Таковы, например, собаки-«грызуны» ряда охотничьих и «полуохотничьих» пород. Один раз игровое поведение не нашло «правильного», с нашей точки зрения, выхода, собака переключилась на ножку стула – и все, как говорится, «до свидания»! Каждый раз засидевшись в одиночестве и заскучав, пес будет грызть то, что находится в пределах его досягаемости.

Именно поэтому щенку, оставляемому в одиночестве, необходимо предложить на выбор множество разнообразных игрушек. И, разумеется, предварительно «объяснить» собаке, как ими пользоваться (т. е. выработать некую привычку: что можно катать и хватать, а что – жевать и грызть).

О пользе комбинаций
Но это, как говорится, к слову. Итак, игровой метод успешно используется рядом дрессировщиков во время постановки у собак хватки на рукав и в процессе последующей работы, когда укус рукава становится подкреплением. Однако рукав в качестве подкрепления в чистом виде, на мой взгляд, больше подходит для обучения спортивных собак, для которых важна чистота выполнения навыка в заданных условиях. При усложнении ситуации, скажем, при обучении собак для реальной работы или постановки хватки «в тело», используются иные, иногда комбинированные методы. Жесткий стереотип, привычка хватать рукав – в обучении собаки навыкам реальной борьбы с человеком, скорее, вред, нежели благо. Понятно, что когда собака концентрирует внимание на предмете, который защищает руку человека, а не на самом человеке, ее очень легко ввести в заблуждение, но об этом чуть позже.

Поэтому зачастую тренеры-«защитники» используют в работе комплексы социального, а также оборонительного поведения собаки. Речь опять идет о тех случаях, когда пса вынуждают защищать себя или своего хозяина. Это и есть метод управляемой агрессии. К слову замечу: этот метод наиболее эффективен, когда используется для решения задач чисто пользовательной дрессировки, т. е. для максимально быстрого и эффективного обучения собаки реальным навыкам защитной службы (ЗС). Используя этот метод для обучения собак нормативной дрессировке по ЗС, тренер ожидаемо столкнется с известными трудностями при выработке, допустим, «чистого» съема. Подобные трудности, разумеется, преодолимы, на это потребуется чуть больше времени и знаний нюансов собачьего поведения, нежели при использовании «игрового» подхода.

Разумеется, метод «социальной управляемой агрессии» эффективен только для «хороших» собак, с «хорошей» служебной наследственностью.

Как управлять агрессией

Итак, управляемая агрессия. В процессе ее реализации подкреплением правильного поведения пса являются действия фигуранта. Причем изначально это вовсе не момент хватки, а всего лишь бегство помощника, если собака ведет себя так, как надо.

Почему так происходит? Почему в одном случае подкреплением (условным) становится укус лежащей на земле тряпки, в другом – побег «трусливого», с точки зрения собаки, «бандерлога»? Дело в том, что социальная агрессия – прежде всего средство регулирования социальной организации животных, т. е. регулирования их отношений. В природе животные стремятся для начала просто испугать противника, обратить его в бегство, а сражаются лишь в крайнем случае. Именно поэтому бегство фигуранта – на начальных этапах – эффективное подкрепление. Однако конечной целью дрессировки собак по ЗС является формирование навыка борьбы с человеком. Поэтому, вновь и вновь убегая от собаки, «кривляясь» и дразня, «качая» ее, фигурант делает животное все более уверенным в себе – пока не поймет, что собака поверила в себя настолько, что готова сразиться с человеком. С сильной собакой все эти «мучения» могут длиться не далее одного подхода, со слабой – вечность. Если, конечно, не найти для «слабака» нечто, облегчающее его действия, нечто, возвышающее его в собственных глазах. Тут мы опять возвращаемся к «одеяльно-тряпичному» эксперименту (см. «Друг» № 12/2008).

Надо заметить, что при все возрастающем возбуждении, вызываемом действиями помощника (и чем его «кривляния» лучше действуют на собаку, тем он, помощник, лучше), поведение пса делается все более и более «смещенным», менее целенаправленным. Собака начинает окусываться, щелкать зубами. Если в этот момент на ее пути окажется предмет, после укуса которого «кривляка»-помощник оставит ее в покое, то поведение (агрессия) пса получит желанную разрядку. Здесь тренеру очень важно следить за тем, чтобы собака не успела «зациклится», не выработала устойчивого стереотипа кусания предмета. Иначе именно он станет подкреплением, которое пес будет искать во всех похожих случаях жизни. Что нужно, чтобы этого не произошло? Всего-навсего поддерживать оптимальный уровень возбуждения собаки, не доводить ее до истерики и не слишком увлекаться повторением пройденного.

0

10

Верить в себя

Но что происходит со слабой собакой, когда она в погоне за фигурантом-дразнилой кусает тряпку? Укусив ее, она одерживает над помощником чистую победу – ведь он исчезает! Ее самомнение справедливо начинает расти. Появляется уверенность в себе. Уверенность в том, что всякий раз укусив, схватив нечто, выйдешь из борьбы победителем. Далее тряпка проделывает тот же путь, что и в описанном в предыдущем (12-м) номере «одеяльном» эксперименте – последовательно превращается в жгутик, привязывается к рукаву и т. д.

Но, не боюсь лишний раз повториться, в отличие от «чистого» эксперимента с «одеялом на земле», мы ни в коем случае не стремимся стереотипизировать кусание тряпки до такой степени, когда укус именно этого предмета становится подкреплением.

Ну а если собака изначально смела, уверена в себе (такие тоже бывают) и сразу или почти сразу готова к сражению с фигурантом? Что будет подкреплением для пса во время его сражения не с тряпкой, а с человеком? Когда поведение не смещено, а целенаправленно? Очевидно, победа. Победа, подкрепляемая правильными действиями фигуранта. Он должен быть побежден, повержен, растоптан. В этом случае поведение собаки не стереотипизируется до автоматизма, оно более гибкое и избирательное.

Может показаться, что метод работы на базе комплекса преследования (где в качестве  подкрепления используется «добыча») мы противопоставляем методу обучения на базе социальных комплексов (где фигурант сам по себе – подкрепление, являясь и «врагом», и «добычей»). На самом деле, нет. При необходимости они отлично сочетаются.

Злоба тут ни при чем

Кстати, все «неигровые» методы обучения собак защитной службе когда-то довольно неточно называли методом развития злобы. Почему неточно? Потому что злоба развивалась у злобных, точнее, недоверчивых к посторонним, собак, из ряда так называемых служебных или караульных. А у так называемых «азартных», «геймных» собак (не путать с «геймными» собаками для собачьих боев!), чье поведение сильно трансформировано искусственным отбором, «социальный» метод никакой абстрактной злобы не развивал. Эти собаки сражались и сражаются с фигурантами без излишней злости, которая формируется либо на базе оборонительного поведения, т. е. (если докопаться до самой сути) страха, либо в результате агрессии, связанной с защитой пищи. Глубинные мотивы «боевого» поведения «геймеров» – другие. Но, впрочем, об этом в другой раз.

Теперь что касается противопоставления различных методов обучения: умелые тренеры успешно сочетают метод жгута и пряника (точнее, метод жгута, он же пряник) с «социальным» методом, в том случае, если собака сразу «не идет».

Выше я уже писал, что метод использования «добычи» в качестве подкрепления существенно облегчает решение «проблемы съема» собаки с рукава (или костюма) фигуранта. Достаточно лишь правильно и терпеливо подкреплять окончание хватки укусом добычи. Впрочем, еще лучше, если «съем» формируется на ранних этапах обучения, еще у щенка – иногда при помощи все той же добычи. Однако повторюсь: там, где есть «добыча», всегда существует опасность того, что фигурант может обмануть собаку, скажем, предложив ей укусить рукав, предварительно снятый с тела, а не, собственно, само «тело». Но умелые тренеры и эту проблему уже давно успешно решили (за заграницу не ручаюсь, а мы так лет 20 с гаком назад), вовремя дергая за нужные ниточки, ведущие к тому или иному комплексу поведения.

+1


Вы здесь » Южнорусские овчарки Поволжья » О дрессировке - все » И.Затевахин.Подкрепление и наказание.


Рейтинг форумов | Создать форум бесплатно © 2007–2020 «QuadroSystems» LLC