domingo, 23 de junho de 2013

Metodologias de treino - aula prática

«Teoria?... Ok, aula prática!»


Tal como o professor do anúncio da Linic, também o Abacaxi se preocupa com os espíritos práticos para quem uma exposição de princípios é "mera teoria", e nada diz acerca do mundo real (como se, por algum tipo ingenuidade, as teorias não se formassem com base em experiências e leituras acerca desse mundo real, e, sobretudo, como se a prática não estivesse fundamentada nos princípios que são debatidos no plano teórico...).

Assim sendo, aqui vai uma aplicação dos princípios apresentados no "post" anterior.

O caso prático é... o cão puxa na trela durante os passeios.

Muito bem. O que há a fazer? Podemos começar por pensar que o primeiro e fundamental passo é castigar aquilo que consideramos mau comportamento. Existem algumas formas de o fazer. A mais difundida e usada é o esticão na trela. O treinador dá um esticão na trela sempre que o cão vai a puxar na trela. Como o cão ainda está a aprender e não percebe por que é que está a levar com esticões no pescoço, continua a puxar. E o treinador continua a dar esticões. Eventualmente, o cão experimenta parar de andar, seja para ver quais as consequências deste seu novo comportamento (parar de puxar) seja porque os esticões já o distraíram do motivo pelo qual estava a puxar. O cão pára de puxar, e os esticões na trela param imediatamente.
O que aconteceu aqui? O treinador, através de esticões na trela, usa castigo positivo. Ou seja, usa um tipo de consequência (P+) que torna menos provável o comportamento de puxar na trela. É castigo porque reduz a probabilidade; é positivo porque incide directamente sobre o comportamento a castigar.
De seguida, o cão pára de puxar na trela e os esticões param imediatamente. Ora, o novo comportamento (não puxar na trela) é premiado por deixar de haver esticões. Esta é a aplicação do reforço negativo. Ou seja, aplica-se um tipo de consequência que torna mais provável o comportamento de não puxar no futuro. É reforço porque aumenta a probabilidade de incidência do comportamento; é negativo porque o comportamento reforçado é, na verdade, uma ausência de comportamento: é a ausência de puxar na trela.

Esquematizando:

Situação anterior ao treino:



Situação no treino (o antecedente mantém-se o mesmo, obviamente):












Nos casos em que o processo é bem executado, o resultado final é o seguinte:

O cão percebeu que puxar a andar à trela lhe traz más consequências, e percebeu que se parar de puxar essas más consequências cessam. O cão aprende o comportamento não puxar na trela porque foi reforçado pelo facto de não ser castigado.


Mas pode haver uma outra forma de abordar o problema. Podemos começar por nos interrogar sobre qual o comportamento que queremos que o cão tenha, em vez de puxar na trela. Neste caso em concreto, a resposta é óbvia: andar sem puxar na trela. O simples facto de colocarmos a questão de uma outra perspectiva vai fazer com que a abordagem seja completamente diferente. Aqui, iremo-nos concentrar nos momentos em que o cão está a andar sem puxar, e vamos reforçar esses momentos de modo a que eles se repitam cada vez mais. Isto é reforço positivo. No entanto, na fase inicial, o cão vai continuar a passar mais tempo a puxar na trela do que a andar sem puxar. Por duas razões: (i) o comportamento "andar sem puxar" ainda não teve um historial de reforço muito forte e (ii) não há um diferencial entre os dois comportamentos "andar sem puxar" e "puxar na trela", pois ambos são reforçados positivamente: o primeiro, directamente pelo dono; o segundo, pelo ambiente. Por isso, é preciso fazer com que o segundo comportamento deixe de ser reforçado positivamente: assim, sempre que o cão puxar na trela, o dono parará a marcha e o comportamento de puxar não é reforçado, pois o cão não chega a lado nenhum. Isto é castigo negativo.

Esquematizando (a situação anterior ao treino é a mesma exemplificada mais acima, obviamente):













Nos casos em que o processo é bem executado, o resultado final é o seguinte:

O cão percebeu que quando puxar a andar à trela o resultado é que a marcha pára, pelo que essa acção de puxar na trela não é a forma mais rápida de chegar onde pretende; paralelamente, sempre que anda sem puxar na trela, ele recebe recompensas. E de dois tipos: não só recebe biscoitos do seu dono, como acaba por chegar aos sítios visados.

O caro leitor, tal como diversas pessoas, poderá, compreensivelmente, colocar a seguinte objecção a este segundo método: "mas eu não quero ter de andar com biscoitos no bolso a vida inteira".
A toda a hora surgem objecções deste tipo. Muito sinceramente, acho que na maior parte das vezes, essas objecções surgem só para chatear. Mas, estando certo de que o caro leitor pertence à minoria de pessoas que coloca essa objecção por puro espírito inquisitivo, responder-lhe-ei do seguinte modo: o objectivo do reforço de um comportamento é torná-lo mais frequente no futuro. Se o comportamento de andar sem puxar ganha frequência, chegámos àquele ponto em que o cão já percebeu que se andar sem puxar ele vai continuar a marcha, mas se puxar, a marcha pára. Ora, nenhum cão quer ficar parado; todos eles querem "ir ver o que é aquilo ali à frente, quem é aquele labrador castanho que nunca vi por aqui, de quem é este cheiro tão intenso, quero ir ver, quero ir ver!". O comportamento, em si mesmo, é auto-reforçante, pelo que não temos de estar a usar nenhuma outra forma de reforço positivo a partir do momento em que andar sem puxar se tornar frequente.
E isto aplica-se a ambos os métodos. A partir do momento em que conseguimos que o comportamento desejado se torne frequente, o reforço desse comportamento já advirá de si próprio. Restará apenas usar o respectivo castigo para as ocasiões (desejavelmente cada vez menos frequentes) em que o cão puxa na trela (num caso, dar um esticão; no outro, parar). 

O que o caro leitor deverá perguntar-se, na verdade, é qual a forma que prefere para promover o comportamento desejado. Prefere ter um cão que anda sem puxar porque receia o castigo, ou prefere um cão que anda sem puxar porque gosta das consequências desse comportamento? Dito de outra forma: prefere que o seu cão aprenda que puxar na trela é errado e perigoso, e, por extensão, andar sem puxar é seguro, ou prefere que o seu cão aprenda que andar sem puxar na trela é agradável e vantajoso?

2 comentários:

  1. no nosso caso, temos duas cadelitas. e quando somos dois a passear as pequenas a coisa consegue-se aplicar. Quando é só um, temos o problema de estar uma a puxar e a outra sossegada (e vão alternando o puxa/descansa até à nossa exaustão). Se pararmos, funciona o que é acima descrito para a que está a puxar. Mas a que, naquele momento, ia calma, vai ficar confusa, certo? que fazer então nestes casos?

    ResponderEliminar
    Respostas
    1. Pois. Passear dois cães ao mesmo tempo não é apenas o dobro do trabalho. E há coisas que se complicam porque nos temos de multiplicar em atenções, um influencia o outro, etc. etc.
      Não se preocupe que a cadela que estiver a andar bem não vai sentir nenhuma confusão. A paragem de marcha serve como castigo negativo para a cadela que estava a puxar. Para a outra, não vai ter significado algum. É possível até que esta segunda cadela olhe para si, e quando voltarem todas a andar, o facto de ter olhado para si é reforçado. Mesmo para cães que não estão a puxar, uma paragem da marcha aqui e ali nunca faz mal.
      Mas, mais importante: não se limite apenas à acção de parar a marcha. Tem de haver também a outra parte do treino: tem de recompensar quando as suas cadelas estiverem a andar correctamente.
      E isto é muito difícil de fazer quando estiver a passear as duas cadelas. Por isso, eu aconselhá-la-ia a andar mais vezes apenas com uma cadela, e aproveitar essas alturas para fazer um treino completo (e não apenas a componente negativa).

      Eliminar