Мы очень часто пользуемся этим термином, объединяя под его именем все неприятные и болевые воздействия на собаку, тем самым запутывая еще больше и так запутанное дело воспитания и дрессировки. Поэтому, кстати, нам трудно согласиться с утверждением, что наказание нельзя использовать, воспитывая и дрессируя, что оно малоэффективно, что существуют другие более гуманные и действенные способы, например, отрицательное подкрепление. Так что давайте сначала разберемся, что же такое наказание, чтобы не только согласиться с предложенным выше, но и, узнавая его в лицо, не пользоваться им так часто.
Наказание - это такие наши неприятные для собаки или болевые воздействия, которые мы совершаем уже после ненужного нам или неправильного с нашей точки зрения поведения собаки. То есть между проступком нашего пса и нашими воздействиями проходит какое-то время. Это главное отличие наказания. А если неприятное воздействие с нашей стороны совершается сразу по окончании нежелательного поведения или во время его, то это уже называется отрицательным подкреплением.
Вторым отличием наказания является его неизбежность. Как бы себя ни вела провинившаяся собака после проступка, мы считаем, что ее следует наказать. И наказываем.
Например, мы приходим вечером домой и обнаруживаем в квартире содом и гоморру и радостно встречающего нас щенка. С точки зрения среднестатистического хозяина собаки, мы должны ем наказать, что мы и делаем. Это на самом деле наказание, ибо отдалено от проступка немалым количеством времени и оказалось неизбежным. Как впрочем и бесполезным, в чем вы убедитесь со временем сами. Но это одновременно и отрицательное подкрепление ритуалу встречи вашего щенка. И вы заметите, как щенок перестает радоваться вашему приходу и все чаще принимает позу подчинения (стыдится наделанного им беспорядка, но продолжает делать его!).
Или ваша собака что-то подобрала на улице и, тщательно пережевывая это что-то, подходит к вам, выполняя команду "Ко мне!". Вы, естественно, ее выдираете аки сидорову козу, и это является наказанием для подбора пищи (и бесполезно, вы сами знаете), но и отрицательным подкреплением подхода к дрессировщику. Ваши действия приводят к тому, что собака перестает в такие моменты подходить к вам, а спокойно доедает подобранное в стороне.
И еще одна ситуация. Вам не нравится, что собака забирается на диван и вы бы хотели исправить данное поведение. Вы входите в комнату и застаете на диване спящую собаку со счастливым выражением морды. Желая дать понять собаке, что она не права и что вам не нравится такое поведение, вы ее шлепаете. Со временем собака начинает понимать вот что: когда она лежит на диване, ваше появление и угрожающие слова служат сигналом к быстрому спрыгиванию с дивана, чтобы избежать шлепка. То есть вы учите собаку быстро спрыгивать с дивана при помощи отрицательного подкрепления. Но шлепки ваши являются наказанием к тому самому залезанию на диван, с которым вы собрались бороться. Со временем вы сами убедитесь, что воспитательное значение этого наказания ничтожно. Об этом же говорит и вся история человечества в части борьбы с преступлениями при помощи наказания.
Почему наказание чаще всего бездейственно? Потому, что как следствие, очень отдалено от причины (проступка). Представьте себе - вы наказываете собаку через час после того, как она съела ваши тапочки. В течение этого часа собака совершила еще с десяток безобидных поступков. Как же ей понять, какое именно действие привело к неблагоприятным последствиям? Природа заставляет ее связывать последствия с последним по времени действием, что собака и делает.
Американский ученый Б. Скиннер, один из основоположников оперантного научения, показал, что результат, для того, чтобы стать подкреплением какому-либо действию, должен следовать за ним не позднее десяти секунд. Подчеркиваем, что это правило работает в естественной среде, когда животное может совершать в секунду массу самых разнообразных нужных и ненужных действий. И.П. Павлову в его знаменитой башне молчания удавалось вырабатывать условные рефлексы при отставлении подкрепления до 30 минут и более от условного раздражителя. Такие рефлексы были названы отставленными условными рефлексами; оказалось, что они вырабатываются с трудом или не вырабатываются вовсе. И с точки зрения отечественной физиологии высшей нервной деятельности наказание можно определить как далеко отставленное отрицательное подкрепление.
Наказание не учит, не дает информацию животному о том, какое же поведение правильное. Собака, которую вы наказываете за съеденные тапочки, ничего не может понять, потому что в течение последнего часа она больше не ела никакой обуви. И вам бы порадоваться этому. И еще, наказание чаще всего учит тому, как не попадаться, а не тому, как правильное себя вести. Очень трудно для человека, а для животного практически невозможно изменить будущее поведение, чтобы в дальнейшем избежать его последствий.
Присмотритесь к себе - чаще всего, наказывая собаку, вы просто даете выход своим эмоциям и своим обидам на нее.
Опасно же наказание тем, что, как замечает К. Прайор, оно служит мощным подкреплением наказывающему. Если при помощи наказания нам удалось исправить (а это случается) поведение, то бессознательно мы все чаще и чаще начинаем прибегать к нему. А избыток отрицательных воздействий на молодое животное приводит к тому, что у нем пропадает всякое желание воспитываться и дрессироваться, оно вырастает зашуганным и робким.
Наказание может помочь, когда оно не очень далеко отставлено и очень сильное, или неожиданное и непривычное, когда поведение, с которым вы боретесь, не очень закрепилось у собаки. То есть если бы за первое преступление отрубали руку, вряд ли бы возникло желание совершить второе.
Отрицательное подкрепление, по мнению Карен Прайор, это любое неприятное событие или ощущение, действие которого можно прекратить или избежать, изменив поведение. Отличие отрицательного подкрепления от наказания в том, что отрицательное подкрепление, как и положительное, происходит во время поведения, а не после него, и на него можно повлиять изменением поведения.
Для того, чтобы понять отличия отрицательного подкрепления от наказания, давайте разберем следующий пример. Ваша собака лазает на диван. Вам это не нравится, и вы отучаете ее следующим образом - как только застаете на диване собаку, тут же кричите в ее адрес ругательные слова и задаете трепку. Как правило, наше агрессивное поведение прекращается сразу же, как только собака спрыгивает с дивана.
Если следовать вашей логике, то, благодаря вашим воздействиям, собака должна понять, что лазать на диван ей нельзя. Сначала собака понимает, что в случае ее локализации на диване грубый, резкий окрик хозяина означает: скорее слезай, чтобы избежать трепки.
Многие собаки достаточно быстро понимают, что появление хозяина, когда она лежит на диване, приводит к резкому окрику, а если с дивана не слезть, то схлопочешь. В результате ретируются с дивана сразу, как только на порою комнаты появляется хозяин. Третьи идут еще дальше, они связывают наличие хозяина в квартире с ее агрессивным поведением во время диванного положения и в присутствии хозяина ведут себя, как паиньки. Когда же хозяина нет, все категории собак ведут себя одинаково - диванолюбиво. Почему? Да потому, что ваше неприятное воздействие на собаку выступает подкреплением (отрицательным или положительным - это еще вопрос) спрыгивания с дивана и является наказанием по отношению к залезанию на диван. То есть таким педагогическим воздействием вы обучаете собаку быстро спрыгивать с дивана по команде (в данном случае это сложная команда или комплексный раздражитель: ваш вид и осуждающий крик).
Таким образом, хотелось вы показать, что отрицательное подкрепление - как, впрочем, и положительное - какому-то действию или поведению происходит во время этого действия или в конце ем, и на его появление, интенсивность и знак можно повлиять, изменив или прекратив именно это поведение. Тогда как наказание, о котором мы говорили ранее, происходит через некоторое время после совершения проступка.
А как же отучить собаку залезать на диван? Нужно придумать нечто такое, что делало бы неприятным именно это действие. Например, можно поставить на диване заряженные мышеловки. А одно добермана, который со всего размаха шлепался на диван, отучили так: разложили на диване остриями вверх шиферные кнопки и прикрыли их покрывалом. Для отучения оказалось достаточным одного доберманьего прыжка. Более того, бедняга начинал активно сопротивляться при попытке затащить ем на диван.
Отрицательное подкрепление очень эффективный способ формировании поведения. Но это не делает его лучшим. Последите за собой: в общении с людьми и собаками мы в основном пользуемся именно им, Нам почему-то кажется, что правильное хорошее поведение - это норма. Так и должно быть, и чего тут радоваться и хвалить? Поэтому и не замечаем, а что самое плохое - и не подкрепляем положительно нужное нам поведение. Мы его как будто не замечаем, а обращаем внимание только на огрехи.
Но слишком частое применение отрицательного подкрепления приводит, особенно у щенков, к появлению робости, неуверенности и себе, тревожности и отбивает охоту от самого процесса дрессировки. Потому, что собака в первую очередь начинает понимать - появление нового навыка увеличивает возможность дополнительного получения отрицательного подкрепления. А его она, естественно, стремится избежать. Кстати, классическая дрессировка оттого и является классической, что строится в основном на отрицательном подкреплении.
Применяя отрицательное подкрепление, вы должны научиться прекращать его сразу же, как только поведение собаки улучшилось (изменилось) хоть немножечко, и обязательно давать возможность животному компенсировать наличие отрицательных эмоций получением положительного подкрепления.
Владимир Гриценко