Обучение с подкреплением

Обучение с подкреплением ставит такие же задачи, по форме, как и дрессировка. И там, и там по команде собака должна сесть. Разница в методике научения нужному.

Дрессировка задает четкие рамки сразу: есть команда, есть способ ее выполнения и есть результат. Например собаке скомандовали сидеть, она должна сесть.

Обучение с подкреплением не дает четких рамок, а ставит задачу. Дано: хозяин, кликер, лакомство и собака. Вопрос: что сделать собаке, чтобы услышать щелчок кликера? Готовое решение есть, но собака к нему приходит как бы сама, хоть и с подсказками хозяина. В результате такой навык крепче запоминается, а собака становится более активной: ей интересно рядом с хозяином. Даже очень пассивная и спокойная собака начинает радостно придумывать способы, как заполучить лакомство.

Что это значит для человека?

Если вы собираетесь кого-то чему-то учить, позаботьтесь о том, чтобы не только давать готовые решения, но и дать возможность поискать ответы самим обучаемым.

Например, навык активного слушания можно преподнести так: вначале пробуем и слушаем. Отмечаем те моменты, которые, нам показалось, будут хорошо работать в слушании. Затем - делимся этими моментами с подсказками ведущего, сами создаем тот список, который на будущее будет нам помогать активно слушать.


Что интересного на портале?