link.springer.com
Partial rewarding during clicker training does not improve naïve dogs’ learning speed and induces a pessimistic-like affective stateClicker training is considered a welfare-friendly way of teaching novel behaviors to animals because it is mostly based on the positive reinforcement. However, trainers largely vary in their way of applying this training technique. According to the most, a reward (e.g., food) should follow every click, while others claim that dogs learn faster when the reward is sometimes omitted. One argument against the use of partial rewarding is that it induces frustration in the animal, raising concerns over its welfare consequences. Here, we investigated the effect of partial rewarding not only on training efficacy (learning speed), but also on dogs’ affective state. We clicker-trained two groups of dogs: one group received food after every click while the other group received food only 60% of the time. Considering previous evidence of the influencing role of personality on reactions to frustrated expectations, we included measurements of dogs’ emotional reactivity. We compared the number of trials needed to reach a learning criterion and their pessimistic bias in a cognitive bias test. No difference between the two groups emerged in terms of learning speed; however, dogs that were partially rewarded during clicker training showed a more pessimistic bias than dogs that were continuously rewarded. Generally, emotional reactivity was positively associated with a more pessimistic bias. Partial rewarding does not improve training efficacy, but it is associated with a negatively valenced affective state, bringing support to the hypothesis that partial rewarding might negatively affect dogs’ welfare.
Oi, Diego! Normalmente, usamos o clicker apenas até que o cão tenha entendido um novo comportamento, depois vamos para outros esquemas de reforçamento que vão tornar o aprendizado consistente. O clicker é uma promessa para o cão, se ocorre o click e a promessa não é cumprida, gera frustração de expectativa e uma liberação hormonal que não é proditiva para o treino. Se isso acontece sempre, pode enfraquecer a associação com o clicker.
Como regra, sempre procuro recompensar após o click. Porém, pelo (pouco) que entendo, uma das características do clicker diz respeito exatamente à possibilidade de marcar à distância (o que inclusive está na origem do dispositivo), e portanto o petisco só poderia vir alguns segundos depois e perderia o sentido. Por exemplo, quando saimos para correr, com o cão solto, sempre clico quando ele atende meu chamado (vocal ou apito acme) depois de ficar para trás para cheirar algo ou interagir, ou mesmo quando ele dá esses sprints em minha direção espontaneamente antes de eu ter chamado. Outro momento que eu nem sempre recompenso com petisco, mas apenas com elogio, é no treino de atravesar a rua com guia, usando o click só para marcar que ele atendeu ao comando - "stop/click, segue/click", será que é contraprodutivo?
Huh... Eu nunca tinha ouvido falar de não recompensar depois de cada click. Sempre que uso um marcador (ando usando mais a voz do que o clicker ultimamente) eu recompenso.
Quando o comportamento já está bem estabelecido eu vou gradualmente removendo o marcador, mas nunca pensei em continuar o marcador e remover a recompensa... Parece intuitivamente errado. E pelo jeito o estudo confirma isso. :-P
Muito bom!! 👏 sempre indico o clicker para meus alunos (e ensino a usar, claro)
Este estudo é bem interessante porque possivelmente o mesmo pode ser verdade parar todos os treinamentos baseados no reforço positivo. Em outras palavras, é possível que não reforçar o seu cão 100% das vezes em que marca um acerto gere uma resposta emocional negativa neles. Algo pra se refletir.