sábado, 22 de junho de 2013

Metodologias de treino - condicionamento operante, versão livro amarelo

Tem exame amanhã e ainda não leu os últimos textos do blog?
Não desespere, o Abacaxi lança mais um Livro Amarelo, desta vez contendo apontamentos sintéticos acerca do tema "Metodologias de treino - condicionamento operante".



  • É errada e mitificada a ideia de que a abordagem mais prudente na educação do seu cão passa por misturar procedimentos de métodos diferentes, e ajustá-los ao seu cão. Não existem mais do que dois métodos, e esses métodos são mutuamente exclusivos, nos seus fundamentos. Dentro do mesmo método é possível avançar com várias formas de se abordar um mesmo problema.
  • Os fundamentos dos métodos de treino de cães baseiam-se nas leis do condicionamento operante.
  • A primeira noção fundamental no quadro do condicionamento operante é que o comportamento é condicionado a partir das consequências que dele decorrem. Se, tendencialmente, o comportamento x tem consequências boas, esse comportamento tem altas probabilidades de vir a repetir-se no futuro. Se, tendencialmente, as consequências forem más, esse comportamento tem altas probabilidades de não se vir a repetir no futuro. 
  • As consequências não são apenas providenciadas pelos donos dos cães. Um comportamento pode ser cultivado quando um dono recompensa esse comportamento, ou quando o ambiente recompensa esse comportamento. Muitas vezes, os donos castigam os seus cães e estes, contudo, mantêm o comportamento; o que acontece nesses casos é que os donos se esquecem que o comportamento que estão a castigar pode estar a ser reforçado por outras coisas.
  • Um comportamento tem mais tendência a acontecer depois de determinados antecedentes que estejam associados a boas consequências. Por exemplo, sempre o cão se senta depois do dono dizer 'senta', o cão recebe um biscoito; mas sempre que o cão se senta depois de o dono bocejar, nada acontece como consequência. O cão vai aumentar as vezes em que se vai sentar depois de o dono se senta, e vai diminuir até à extinção as vezes em que se senta depois de o dono bocejar.
  • Cada método de treino define-se pelo tipo de consequências que providencia para os comportamentos do cão.
  • Existem quatro tipos de consequência: reforço positivo, reforço negativo, castigo positivo, castigo negativo. 
    • Reforço (seja positivo ou negativo) é tudo aquilo que torna o respectivo comportamento mais provável de acontecer no futuro. 
    • Castigo (seja positivo ou negativo) é tudo aquilo que torna o respectivo comportamento menos provável de acontecer no futuro.
    • Positivo (seja reforço ou castigo) é tudo aquilo que envolve ou incide sobre uma acção do animal.
    • Negativo (seja reforço ou castigo) é tudo aquilo que implica uma prevenção ou um evitar de uma acção do animal.
    • Reforço positivo é o tipo de consequência que torna o respectivo comportamento mais provável de acontecer e incide directamente sobre uma acção do cão.
    • Reforço negativo é o tipo de consequência que torna o comportamento em causa mais provável de acontecer, mas lida com um comportamento negado. Aquilo que se pretende reforçar é a ausência de um determinado comportamento.
    • Castigo positivo é uma forma de reduzir as probabilidades de um determinado comportamento vir a ser repetido, e incide sobre o comportamento propriamente dito. 
    • Castigo negativo é uma forma de reduzir as probabilidades de um determinado comportamento ser repetido, mas, em rigor, incide sobre um não-comportamento, ou melhor, um comportamento ainda não ocorrido totalmente. Este castigo impede que um determinado comportamento seja reforçado positivamente.
  • Nenhum destes tipos de consequência actua completamente isolado. Actuam, na verdade, aos pares. Reforço positivo actua em conjunto com castigo negativo. Reforço negativo actua em conjunto com castigo positivo. Por exemplo, não há reforço positivo de um determinado comportamento desejável sem que haja castigo negativo dos comportamentos indesejados que possivelmente pudessem acontecer. Assim como não há reforço negativo de um comportamento se este não tiver sido, previamente, castigado positivamente. 
  • É possível usar-se castigo positivo e depois reforço positivo? Sim, é. Mas, em rigor, já não se está a trabalhar o mesmo comportamento. Por exemplo: um cão salta para as pessoas quando chegam em casa; um dono pode decidir tratar do problema começando por exercer castigo positivo; ou seja, de cada vez que o cão salta para alguém, o dono providencia uma consequência má para esse comportamento de modo a fazer com que o cão não tenha mais vontade de realizá-lo. Sempre que o cão salta para alguém, algo de mau surge como consequência; este tipo de consequência vai determinar uma tendencial extinção do comportamento. Quando o cão deixa de saltar para as pessoas, o seu comportamento é automaticamente reforçado (negativamente) pelo facto de já não receber qualquer tipo de punição desagradável. Se o dono resolver recompensar o cão por não saltar com festas, biscoitos ou palavras, isso já é reforço positivo (e não o reforço negativo que surge automaticamente associado ao castigo positivo); e, em rigor, já se está a reforçar um novo comportamento; já se trata de um segundo comportamento - o cão já não salta - e não do primeiro comportamento, que era saltar. 
  • A grande questão é a seguinte: se o objectivo é, no final, recompensar o bom comportamento, então por que razão perdemos tempo em castigar o mau comportamento até que ele termine, se podemos começar desde logo a recompensar o bom comportamento? De que modo?, perguntarão. Fácil, promovendo o bom comportamento e reforçando-o. Usando o mesmo exemplo: se um cão salta para as pessoas quando estas chegam a casa, ensine o seu cão a sentar-se; quando ele o fizer, reforce o comportamento de modo a que ele se repita no futuro (ajuda que nas primeiras vezes faça do seu "reforço" uma consequência bem memorável, e não uma consequência perto de neutra). E quando o cão saltar, na mesma? Simples: castigo negativo. Por cada salto, não há recompensas e não há atenção do dono. O cão vai ser rápido a perceber qual é o comportamento com melhores consequências: "sentar (ou seja, não saltar!) e receber recompensar e a atenção dos meus donos ou saltar e ser ignorado... hm...". A escolha não me parece difícil.
  • Diga-se o que se disser acerca das formas de castigo positivo, este tem, forçosamente, de ser aversivo. De outra forma, não resultaria. Se um cão deixa de ter um comportamento é porque as consequências para este comportamento passaram a ser más ao ponto de ele abandoná-lo. Se o castigo fosse brando, leve, ténue, as consequências não seriam fortes o suficiente para que o cão deixasse de realizar esse comportamento. Até porque, se esse comportamento já existe, é porque ele tem tido boas consequências. Logo, para que o castigo positivo se sobreponha às consequências que esse comportamento tem tido, ele tem de ser mais intenso; ele tem de ser, sempre, aversivo. 
  • A pergunta que faço é a seguinte: se existe uma forma de ensinar o seu cão através da promoção dos comportamentos correctos (reforço positivo) e prevenção dos comportamentos incorrectos (castigo negativo), por que raio é que alguém prefere punir aversivamente os comportamentos incorrectos (castigo positivo) e esperar que surjam os comportamentos correctos para parar de castigar (reforço negativo)?
--------------------------

Amanhã há aula prática.



Sem comentários:

Enviar um comentário