Четыре фундаментальные концепции в научении
Доллард и Миллер обращались к различным теориям научения, включая теории Павлова, Торндайка, Халла и Скиннера. У этих теоретиков они позаимствовали основные принципы обусловливания, к которым относятся: стимул, реакция, награда, генерализация, различение и угасание.Миллер и Доллард суммировали первичные понятия теории научения, предположив, что «для научения нужно чего-то хотеть, что-то замечать, что-то делать и что-то получать». Эти условия соответствуют таким концепциям теории научения, как драйв (хотеть что-то), сигнал (замечать что-то), реакция (делать что-то) и награда (получать что-то).
Драйв .Теория Фрейда рассматривала либидо как движущую силу, стоящую за всеми действиями, но Доллард и Миллер предпочитали обозначать мотивирующую силу понятием драйва, взятым из теории научения Халла. В обычной речи драйвом называется побуждающая потребность— голод, жажда, сон, деньги или признание и т. д.. Более формально Миллер и Доллард определили драйв как «мощный стимул, понуждающий к действию» (этот бихевиористский язык обходит стороной логические проблемы типа следующей: действительно ли мы в чем-то нуждаемся или просто считаем, что это так). Стимулы драйва могут быть разного рода: не только стимулы, исходящие из внешней среды, но также внутренние телесные стимулы, а то и мысленные процессы. Многие драйвы являются усвоенными или приобретенными (тревога, честолюбие, общительность, потребность в одобрении, деньгах)
Сигнал.Сигналы — это различительные стимулы. Это то, что человек замечает во время поведения. Сигналами могут служить отдельные виды, звуки, запахи и тому подобное. Важными сигналами являются также такие скрытые внутрипсихическне стимулы, как мысли. Как только драйв активизирует человека, сигналы «определяют , когда, где и как он будет реагировать».
Научение состоит в упрочении связи «сигнал — реакция», благодаря чему повышается склонность реагировать особым образом в присутствии определенных сигналов или стимулов.
Реакции— аспекты поведения человека. Любое поведение, которое можно изменить с помощью научения, может рассматриваться как реакция. К последним относятся не только явные, легко наблюдаемые действия вроде крика или обморока, но и скрытые, тайные действия — например, мышление.
В любой ситуации некоторые реакции отмечаются чаще других. Например, двухлетний ребенок, который слышит, что ему пора спать, заплачет скорее, чем спокойно отправится в постель. Перечень всех возможных в данной конкретной ситуации реакций, составленный в порядке убывания вероятности, называется иерархией реакций.В приведенном примере иерархия реакций могла бы включать следующие реакции:
Р1 (наиболее вероятная) — плач
Р2— схватить плюшевого мишку
Р3 — спрятаться
Р4 — потребовать Папу
Р5 — спокойно отправиться в постель
Самая вероятная реакция в иерархии называется доминантной реакцией
В данном примере доминантной реакцией является плач. Доминантная реакция наступит, если ей не воспрепятствуют обстоятельства. Например, мать может пригрозить ребенку или задобрить его, чтобы избежать слез по тому или иному поводу. В этом случае наступит реакция, поставленная в иерархии второй. Если она заблокирована, наступит третья реакция и т. д.
По ходу научения положение реакций в иерархии меняется. К моменту, когда ребенку исполнится 8-10 лет и он приучится к дисциплине, наиболее вероятной будет реакция R5. Новая иерархия, исправленная научением, называется результирующей иерархией. Неудивительно, что награды возвышают реакции в иерархии, тогда как наказание и угасание перемещают их вниз.
Награда. Миллер и Доллард предпочли альтернативу положению теории научения Хала о том, что снижение драйва оказывает подкрепляющее воздействие. Они утверждали, что «в отсутствие драйва награда невозможна». Как и другие теоретики научения, Доллард и Миллер признавали, что награды могут быть либо врожденного, либо приобретенного характера. Первичные награды — такие как пища — предопределены от рождения. Вторичные награды — такие как похвала — приобретаются. Как только мы приучаемся ценить похвалы, деньги, власть и тому подобное, эти вторичные награды могут влиять на наше поведение и научение.
Процесс научения.
Если драйвы удовлетворяются доминантной реакцией, то никакое научение не состоится. Однако если доминантная реакция не приводит к снижению драйва, то в этом случае существует дилемма научения: ситуация, в которой наличествующие реакции не вознаграждаются. Это порождает изменение. Желательной новой ре-акции можно научиться в случае, когда имеется драйв, наступает желательная реакция. И эта реакция вознаграждается (то есть приводит к ослаблению драйва). поэтому важно обустроить ситуацию так, чтобы наступила желательная реакция. Возможно, что для этого придется упростить ситуацию (ослабить сигналы, порождающие конкурентные реакции), склонить индивида к желательной реакции, обеспечить модели для имитации или применить любые из множества стратегий (наказание, угасание,)
Частота проб усваиваемого поведения увеличивается благодаря награде и уменьшается благодаря угасанию и наказанию. Исключенные варианты поведения могут без вознаграждения вернуться вновь – феномен называется спонтанным рецидивом. Если их не поощрять. Эти реакции быстро исчезнут вновь. Прошлые реакции, которые исчезли благодаря наказанию, возвращаются не так спонтанно, как те, что исчезли благодаря угасанию.
Кроме того концепция градиента вознаграждения гласит, что чем скорее реакция сопровождается наградой, тем больше она усиливается. Аналогичным образом: чем скорее сопровождается наказанием недостойное поведение, тем более эффективным оказывается наказание в снижении тяги к подобному поведению.