domingo, 30 de junho de 2013

Imagine...

Imagine que tem um cão com alguns problemas de comportamento. Ele denota ser ansioso e receoso, sobretudo com estranhos. Sempre que algum estranho passa à frente de sua casa, o seu cão salta para o muro e vedação, e ladra o mais próximo que consegue da pessoa que por ali está a passar. Sempre que algum estranho, dentro de sua casa, se aproxima do seu cão, ele afasta-se, protege-se atrás de si, e, se o estranho insistir, ele rosna. E imagine que toda e qualquer pessoa que entre em sua casa é um estranho para o seu cão, pois este medo do seu cão por estranhos nunca deixou que ninguém o abordasse. E agora imagine que tem um cão com 70 kg.

Como dono consciencioso, contrata um profissional para ajudá-lo a resolver este problema.

Agora, o caro leitor imagine que esse profissional, depois de uma avaliação do seu cão, lhe diz que estava à espera de muito pior e que, em rigor, o seu cão não tem nenhum problema. Pelo menos, nada de grave. Pelo meio, aconselha-o a passear mais o seu cão e a gastar as suas energias. Depois, este treinador (imaginário, claro!) pede para que o caro leitor lhe mostre aquilo que faz quando o seu cão tem aquelas exibições de agressividade junto do muro de casa. Depois de ver a forma como lida e sempre lidou com o assunto, o treinador diz-lhe que está a proceder perfeitamente bem.
Tudo somado e espremido, é isto o que o treinador contratado faz. Isto, no campo da imaginação, claro.
Ora, o que é que o caro leitor faria neste caso?

A. Aceitava o diagnóstico do treinador e achava que, afinal, não tinha problema nenhum;

ou

B. Achava que um cão que rosna aos estranhos e se afasta deles precisa de mais qualquer coisa do que um ou dois passeios diários;

ou, ainda

C. Achava que o treinador estava muito pouco preocupado com o comportamento real do cão, e estava apenas preocupado com a forma como o dono lida com esse cão. E como, neste caso, o dono lida da forma como esse treinador acredita que se deve lidar, tudo está bem, apesar do cão continuar a ter medo de pessoas, a saltar contra as vedações sempre que alguém passa perto de casa, e a demonstrar ansiedade em todos os seus comportamentos.


Então, diga lá o leitor qual seria a opção certa para si?

sexta-feira, 28 de junho de 2013

Porquê?

Agora que já conhece os dois tipos de condicionamento, parece-lhe minimamente razoável e prudente tratar um cão com comportamentos agressivos através de esticões na trela (ou afins)? Parece-lhe minimamente justificável que um profissional não saiba que, ao estar a usar meios aversivos para castigar um comportamento (condicionamento operante) está, ao mesmo tempo, a criar associações entre toda essa aversividade e todos os estímulos perante os quais essa aversividade surge com frequência? Como é que acha que um cão vai processar a seguinte informação: "sempre que não estou diante de outros cães, não recebo esticões na trela; mas recebo esticões na trela sempre que estou diante de outros cães"; como acha que o seu cão vai começar ou continuar a julgar os outros cães se estes se tornam, cada vez mais, indicadores de coisas más?

"Ah, mas o meu cão deixou de reagir agressivamente aos outros cães depois do tratamento aversiso."

Claro: mas pergunte ao seu cão se ele superou o medo que tem dos outros cães. Isto é, coloque-o perto de outros cães e veja se ele se comporta como os outros cães. Claro que não: vai dar-lhe dezenas de sinais a dizer que não está confortável naquela situação. Mas ao dono só lhe interessa que o comportamento agressivo tenha parado. E ao treinador também. Os sinais de desconforto e apaziguamento, esses ninguém os vê. O dono, porque não os conhece nem tem obrigação disso. O treinador, porque não os reconhece, pois o seu major é na disciplina "esticões na trela". 
Depois admiram-se quando o cão, passado uns tempos, volta a desempenhar comportamentos agressivos. O treinador escuda-se facilmente: "pois, a culpa é do dono, que transmite ao cão essa agressividade; tanto é que, depois de um tempo comigo, ele abandonou o comportamento agressivo...". 
A pergunta a fazer é: "e o que é que o senhor treinador fez para que as causas do comportamento agressivo também fossem apagadas?" Se as causas não desaparecem, os efeitos mais tarde ou mais cedo voltarão. 

quinta-feira, 27 de junho de 2013

Condicionamento clássico, versão livro amarelo


O primeiro passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é o seguinte: compreender que a comida não serve apenas para recompensar o bom comportamento. A comida serve, também, e sobretudo, como forma de accionar uma desejável associação entre um estímulo (no caso, aquilo que despoleta a agressividade) e algo de importância primária e sobejamente positiva (a comida). A comida serve para criar uma associação que faça com que algo que é visto como negativo pelo cão (algo perigoso, inseguro, desconhecido) passe a ser visto como positivo (seguro, indicador ou previsor de coisas boas).

O segundo passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é o seguinte: compreender o que é o condicionamento clássico, não confundir as suas leis com as leis do condicionamento operante, entender que tanto o clássico quanto o operante estão sempre a actuar e, por fim, saber as formas de usar as leis do condicionamento clássico a nosso favor e a favor da boa aprendizagem do nosso cão.

O terceiro passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é o seguinte: compreender que, de uma forma ou de outra, para se "reabilitar" um cão com problemas de agressividade ter-se-á de fazer um intenso trabalho de condicionamento clássico, de forma a associar o estímulo que gera a agressividade (outros cães, pessoas, etc.) com coisas positivas e seguras. Como, dê por onde der, vai ter de ser feito esse trabalho de condicionamento clássico, por que não fazê-lo desde logo? É mais tortuoso, lento, arriscado e frustrante começar por castigar o cão até o comportamento de agressividade ser colocado em hiato ou latência; e é mais directo, rápido, seguro e motivante começar imediatamente pelo trabalho de condicionamento clássico. Para isso, é boa ideia começar com uma distância de segurança, em vez de expor o cão a uma proximidade que ainda não é capaz de tolerar.

quarta-feira, 26 de junho de 2013

As metamorfoses da comida, ou o "outro" condicionamento - parte III

(continuação)

Um terceiro e último exemplo: um cão é agressivo perante outros cães, sobretudo cães estranhos. 
Um pedaço de comida é, normalmente, visto como forma de premiar um comportamento. Razão pela qual, muito compreensivelmente, as pessoas acham que não se pode tratar de um caso de agressividade usando comida. Se um cão está a rosnar para outro, ou se investiu contra uma criança, vamos estar a recompensar o quê, na verdade? Numa situação de agressividade, só podemos agir castigando a agressividade e, no máximo, recompensar quando a agressividade parar. Certo? Errado. Como já vimos, podemos usar a comida como forma de criar um ajustado condicionamento clássico. Mas, mesmo dentro do quadro simples do condicionamento operante, existe algo mais a fazer para além de castigar primeiro e recompensar depois. A primeira mudança na atitude passa por deixar de considerar a agressividade como comportamento activo primeiro. Existe um momento anterior à exibição do comportamento agressivo, e existe algo que despoleta essa exibição. Como tal, a agressividade é reactiva segunda. O segredo, na componente técnica, está em achar o momento primeiro, aquele que antecede a exibição de agressividade. Nesse momento, o cão ainda não exibiu o comportamento agressivo, ou seja, ainda não reagiu. Então, toca a reforçar. "Mas vou recompensar o quê, se ele ainda não fez nada?" Isso mesmo, não fez nada e é isso que vai querer reforçar, não é? Qual é o comportamento que quer ver repetido no futuro: o terminar da agressividade ou o não-começar da agressividade? Boa escolha. Então, se é isso que pretende ver repetido no futuro, reforce esse momento. 
Na verdade, já não é estritamente no campo do condicionamento operante que estamos a  trabalhar quando reforçamos o momento anterior à exibição de agressividade (que não chegou a existir, bem entendido). Estamos, simultaneamente, a trabalhar também dentro do quadro do condicionamento clássico. Ao usarmos um pedaço de comida (ou outro reforço) para reforçar, positivamente, o comportamento específico de não reagir agressivamente, estamos, ao mesmo tempo, a associar a presença do outro cão (ou seja, do estímulo que normalmente gera a reactividade do cão, seja ele qual for) ao pedaço de comida. Eis o poder de um simples cubinho de queijo: ao mesmo tempo que exerce uma função de reforço positivo de uma acção desejada, exerce também a sua função de condicionador clássico associando o seu valor (positivo) ao conjunto de estímulos próximos; passando estes estímulos a começarem a ser revestidos de uma conotação, também ela, positiva. A pouco e pouco, de "revestimento em revestimento", o estímulo que outrora gerava reactividade agressiva passa a ser visto como seguro. 
Não podemos nunca negligenciar que um esticão na trela (ou um choque eléctrico) tem um poder muito similar, ou seja, trabalha também nos dois campos ao mesmo tempo, embora de modo inverso: ao mesmo tempo que funciona como castigo positivo, o esticão exerce a sua função de condicionador clássico associando o seu valor (aversivo) ao conjunto de estímulos próximos. Isto justifica a perplexidade com que muitos donos e treinadores presenciam a agressividade de um cão perante um dado estímulo, mesmo depois de repetidamente terem sido castigados por tal apresentação de agressividade. "Mas será que não percebe que está a proceder mal?". Por cada esticão, o cão está a ser castigado (condicionamento operante) mas, ao mesmo tempo, está a ser condicionado classicamente, associando o efeito do esticão (efeito aversivo) ao estímulo. Resultado: o cão pode aprender (digo 'pode' porque, no meio de tanto stress que envolve (i) proximidade de um estímulo negativo, (ii) permanência numa situação considerada perigosa, e (iii) constantes castigos, no meio disso tudo é bem possível que não haja aprendizagem muito clara nesse sentido) que o seu comportamento é "errado" (na verdade, por 'errado' devemos entender: antecipador ou indicador de más consequências), mas certamente vai criar uma associação entre toda a situação com o estímulo que estava presente. Recapitulando: um cão pode até aprender que a sua acção (reactividade agressiva) é "errada"; mas, ao mesmo tempo, o castigo efectuado é associado (transferido) para a situação, ou seja, para a presença de outros cães. Os cães passam a ser previsores ou indicadores de coisas más. Nem que não fosse por um efeito de exclusão: em situações nas quais o estímulo em causa não está presente, não há castigos; quando o estímulo em causa aparece, há castigo. 1+1=...
Seguindo a técnica do castigo positivo+reforço negativo (ou seja, o esticão na trela e afins), no melhor (deveria dizer, no menos mau) dos casos, o cão aprende que o seu comportamento traz más consequências, e, como tal, pára-o. "Missão cumprida, o cão parou de ladrar, deixou de haver reactividade". Correcto? Errado. O cão aprendeu, de acordo com as leis do condicionamento operante, que é melhor não reagir do que reagir, já que a reactividade lhe traz más consequências (o castigo positivo e aversivo), e a ausência de reactividade lhe traz consequências melhores (o reforço negativo). Mas, ao mesmo tempo, segundo as leis do condicionamento clássico, esse cão não deixou de ver nos outros cães (ou no estímulo que gera a agressividade) um perigo, um motivo de insegurança; na verdade, ainda gosta menos deles, já que todos os esticões que levou ficaram associados à presença dos outros cães. Em vez de combatermos as razões do comportamento, combatemos os sintomas. A reactividade continua lá, em latência e em potência, até ao dia em que se torna acto. 
Existem duas formas de lidar com esta fase de latência, isto é, a fase em que o cão suprimiu a reactividade, mas continua reactivo em potência: ou (i) o treinador e donos acham que o problema está resolvido, iludidos pela aparente calmaria do seu cão, ou (ii) ambos têm consciência de que este é apenas um estado passageiro e existe ainda um trabalho a fazer. O primeiro dos casos é, sem dúvida, o mais imprudente, o mais desinformado e, sobretudo, o mais perigoso. Eu acho-o até arrogante e ignorante: arrogante, porque assenta na ideia de que um estado tão extremo como a agressividade seja solucionado apenas porque o dono o castigou; ou seja, interpreta-se a agressividade de um cão como um caso de desobediência, para o qual basta mostrar quem manda e mostrar que determinado comportamento não é aceite pelo dono. Ignorante, porque desconhece a forma como, para além do mundo dos castigos e recompensas (condicionamento operante) existe todo um conjunto de leis de comportamento que obedecem a associações criadas entre certas situações contíguas; numa palavra, ignora o que seja o condicionamento clássico. Duas vezes ignorante, até, porque não é capaz de ver, nos sinais oferecidos pelo cão, que ele continua intranquilo e tenso, apesar de já não reagir com agressividade. O segundo caso é mais cauteloso, mais técnico, e mais consciente das consequências e do modo como um cão não se limita a aprender com castigos e consequências. O primeiro caso tem sido muito explorado para efeitos de espectacularidade mediática, pois funciona muito bem, em termos de audiência, apresentar um cão que deixou de agir agressivamente como consequência da imposição de liderança do dono. E como a televisão não capta o estado interno de latência da agressividade, fica a impressão de case solved. O segundo caso é o da maioria dos treinadores profissionais, tanto aqueles que cairiam na gaveta do treino tradicional quanto aqueles a quem se convencionou denominar "balanceados" ou, como eu prefiro chamar, treinadores do meio termo. Claro que, entre uns e outros (entre aqueles que param o trabalho quando o cão deixa de aparentar agressividade, e aqueles que sabem que existe uma segunda metade do trabalho), eu prefiro os do "segundo caso", não por uma questão de maior ou menor violência (aliás, muitos dos treinadores que encaixariam neste segundo caso usam formas bem mais violentas do que aquelas que se usam em televisão), mas porque têm uma noção mais realista da forma como o comportamento de um cão evolui. 
Em relação à segunda forma de lidar com o referido período de latência, uma palavra. Eu admito que haja casos em que, durante este período de latência, seja possível ir combatendo essa reactividade "adormecida" até ao ponto em que ela possa vir a desaparecer. De facto, um cão que, embora continue desconfiado de outros cães, aprendeu a não reagir, ele poderá ir convivendo com outros cães até poder, eventualmente, perder as razões internas da sua reactividade, isto é, perder o medo aos outros cães. Certo. E qual vai ser a forma que vai ser usada para trabalhar neste período de latência? Certamente, um trabalho de condicionamento clássico, ou seja, de associações positivas feitas aos outros cães com os quais irá relacionar-se durante este período de latência. Tais associações poderão ser feitas de forma activa, com o dono/treinador a alimentarem o cão na presença próxima de outros cães, ou promovendo outras actividades de que o cão goste mas que não impliquem nenhum grau de excitação incontrolada; ou poderão ser feitas de forma passiva, simplesmente esperando que a convivência entre os cães faça o trabalho por si. Eu, da minha parte, prefiro que haja trabalho activo, até porque a segunda (a associação passiva) acaba por surgir de qualquer forma. 
Mas agora pergunto: se se vai fazer um trabalho de condicionamento positivo relativo à presença de outros cães (ou, claro, do estímulo que provoque a reacção, seja ele qual for), por que razão fazê-lo neste período de latência proporcionado por um trabalho prévio de castigo positivo e aversivo? Por que razão não o fazer desde logo, antes e em vez de qualquer tipo de aversão? Se fizermos o trabalho de condicionamento clássico depois de um trabalho de castigo aversivo que induza o cão a restringir ou suprimir a reactividade, esse trabalho de condicionamento clássico vai ser redobrado; é que, enquanto o treinador castiga o comportamento reactivo agressivo, como vimos, está também a condicionar o cão de modo a que este associe o castigo à presença dos outros cães. Ora, o trabalho de condicionamento clássico que se segue vai ter de lidar não só com um cão que é reactivo com outros cães, como também com um cão que associou uma série de esticões de trela (ou choques, ou dedadas em forma de mandíbula, ou toques de calcanhar...) à presença de outros cães. Era tão mais fácil, rápido e seguro se o trabalho de condicionamento clássico começasse antes de tudo, não era? O curioso é que as técnicas do método centrado no reforço positivo é que são conhecidas por serem lentas e por complicarem o que é simples...

terceiro passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é, portanto, o seguinte: compreender que, de uma forma ou de outra, para se "reabilitar" um cão com problemas de agressividade ter-se-á de fazer um intenso trabalho de condicionamento clássico, de forma a associar o estímulo que gera a agressividade (outros cães, pessoas, etc.) com coisas positivas e seguras. Como, dê por onde der, vai ter de ser feito esse trabalho de condicionamento clássico, por que não fazê-lo desde logo? É mais tortuoso, lento, arriscado e frustrante começar por castigar o cão até o comportamento de agressividade ser colocado em hiato ou latência; e é mais directo, rápido, seguro e motivante começar imediatamente pelo trabalho de condicionamento clássicoPara isso, é boa ideia começar com uma distância de segurança, em vez de expor o cão a uma proximidade que ainda não é capaz de tolerar. 



terça-feira, 25 de junho de 2013

As metamorfoses da comida, ou o "outro" condicionamento - parte II

(continuação)

Mas o que é, em concreto, o condicionamento clássico? Condicionamento clássico é a forma como tudo aquilo que está associado a um determinado objecto ou situação começa a ser associado a um outro objecto ou situação que acontece perto e simultaneamente. O condicionamento clássico acontece a toda a hora, com ou sem intervenção dos donos. Na socialização de cães, o que se faz é um trabalho de condicionamento clássico. Consideremos o caso da socialização com crianças: uma criança aparece enquanto passeamos o nosso cão; nós pedimos-lhe para dar uns pedaços de comida (ajuda se for "especial", tipo pedacinhos de fígado cozido) que entretanto leváramos no bolso. Depois de repetido várias vezes este processo, o cão passa a associar a presença de crianças a "altura em que recebo, do nada, vários pedaços de comida especial". O cão passa a adorar crianças. Claro que o contrário pode acontecer: o cão passa por uma criança; esta, enquanto criança, solta uns gritinhos, saltita diante do cão, faz festas que equivalem a desagradáveis pancadas na cabeça, puxa o rabo e as orelhas. O cão passa a associar crianças a todas essas diabruras, e, depois de repetidas experiências semelhantes, o cão passa a não gostar nem confiar em crianças. Num e noutro caso, o que acontece é puro condicionamento clássico; não há menos condicionamento clássico se as associações forem negativas. Portanto, se o condicionamento clássico está sempre a acontecer, o melhor mesmo é tirar partido da sua acção e dos seus efeitos, voltá-los a nosso favor.
Um segundo exemplo: o caro leitor imagine que vive numa zona seca do interior; no verão, a água escasseia e as culturas morrem. Entretanto, começa a chover. Mesmo que o leitor tenha vivido durante algum tempo num ambiente urbano, cinzento e chuvoso, nesse momento não poderia sentir maior apreço pela chuva e maior prazer pelo seu aparecimento. É claro que nas primeiras vezes vai gostar da chuva pelo seu efeito; mas passado algum tempo, o gosto pela chuva e o gosto pelo seu efeito já se confundem, e o leitor dará consigo a admitir, sem problemas, o quanto gosta de chuva! Puro condicionamento clássico. O processo que rege o condicionamento clássico é o mesmo processo que rege a metáfora: as qualidades de uma determinada coisa são transferidas para uma outra coisa, sem que a primeira e segunda coisa se misturem ou se transformem. Neste segundo exemplo da chuva numa zona árida, as qualidades que estão presentes nos efeitos que a precipitação traz a uma região que passava por um período de seca são transferidas para a própria chuva; o indivíduo, que começara por gostar dos efeitos gerados pela chuva, começa, a pouco e pouco, a gostar de chuva em si mesma. No caso da socialização com crianças, as "qualidades" associadas aos pedaços de comida especial (prazer degustativo, satisfação de necessidade primário e efeito de raridade) são associadas à presença da criança; é claro que o cão não passa a ver a criança como um gigante pedaço de fígado; ele passa a ver na criança um previsor ou indicador de coisas boas, tão boas quanto o são dez pedaços de fígado cozido. Se, entretanto, todas as experiências com crianças resultarem numa brincadeira calma e prazerosa, tanto melhor; mas a forma mais fácil, directa e segura de garantir um conveniente condicionamento clássico a crianças é feita com comida. Quanto mais especial, melhor. 
A grande diferença entre o condicionamento operante e o condicionamento clássico é que o primeiro diz respeito directamente à acção do cão e às suas consequências, enquanto o segundo diz respeito ao ambiente que o rodeia e às associações que possam surgir. Primeiro erro a evitar: não devemos achar que é possível colocar um dos tipos de condicionamento em suspenso, e trabalhar apenas segundo as leis do outro. Ambos estão sempre a actuar. O que pode acontecer é apenas nos concentrarmos, em termos práticos, num deles, claro; mas o outro está sempre a trabalhar em simultâneo. Por exemplo, quando ensinamos o nosso cão a sentar, trabalhamos dentro do quadro do condicionamento operante, reforçando  positivamente todas as boas tentativas (ou castigando positivamente as más tentativas e reforçando negativamente as boas); mas não podemos evitar que haja, ao mesmo tempo, algum tipo de associação a decorrer, por exemplo, se o ensino do 'senta' estiver a ser agradável para o cão, e nesse momento estivermos a usar óculos de sol, e se repetirmos várias vezes o mesmo exercício (sempre agradável para o cão) usando sempre óculos de sol, a sensação de prazer ou agradabilidade inerente ao exercício é transferida para os óculos. Ou seja, mesmo sem querermos ou disso termos consciência, estava a acontecer um condicionamento clássico ao mesmo tempo que trabalhávamos dentro do quadro do condicionamento operante.
Um grande problema que despoleta o surgimento de mitos como aquele enunciado na primeira parte surge quando nos esquecemos (ou simplesmente não temos noção) de que os dois tipos de condicionamento estão sempre, sempre a agir. Por exemplo, se quero associar a presença de outros cães a coisas positivas usando comida (condicionamento clássico), não me posso esquecer de que, se der comida quando o meu cão estiver a ladrar, poderei estar a fazer essa associação, mas também estarei a recompensar o acto de ladrar aos outros cães (condicionamento operante). Justamente por isso é que convém começar a trabalhar a associação pretendida com uma distância de segurança, de forma a que o nosso cão não comece, de todo, a ladrar, evitando que reforcemos um comportamento indesejável. Da mesma forma, se o meu cão teve um comportamento desadequado perto de uma criança, eu poderei castigá-lo (condicionamento operante) de forma a tentar que essa acção não se repita; mas não me posso esquecer que tal castigo vai ficar associado à presença da criança (condicionamento clássico), tanto mais associado quantas mais vezes se repetir o processo. Retomando: um dos maiores motivos que faz com que interpretemos muito mal certos procedimentos de treino tem a ver com a forma como negligenciamos que os dois tipos de condicionamento estão sempre a actuar. Sempre. Normalmente, o tipo de condicionamento desconsiderado ou esquecido é o condicionamento clássico. As pessoas (sobretudo os treinadores) parecem  extremamente focadas em controlar as leis do condicionamento operante, recompensando "o bom" e castigando "o mau"; e tal obsessão impede que os horizontes da educação de cães se abram; tal obsessão impede que as pessoas aprendam o que é o condicionamento clássico e aprendam a utilizá-lo na educação dos seus cães. E este tipo de engano tanto se pode aplicar a donos e treinadores que usem reforço positivo + castigo negativo quando àqueles que se concentrem no reforço negativo + castigo positivo. O problema, aqui, não é de método. O problema tem a ver com o desconhecimento que há em relação ao condicionamento clássico e à forma como os cães obedecem às suas leis.

segundo passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é, portanto, o seguinte: compreender o que é o condicionamento clássico, não confundir as suas leis com as leis do condicionamento operante, entender que tanto o clássico quanto o operante estão sempre a actuar e, por fim, saber as formas de usar as leis do condicionamento clássico a nosso favor e a favor da boa aprendizagem do nosso cão.

(continua)

segunda-feira, 24 de junho de 2013

As metamorfoses da comida, ou o "outro" condicionamento - parte I

«Pois, isso de se dar bolachinhas aos cães é muito bonito, e até pode funcionar para se ensinar o cão a sentar e a dar a patinha, mas o método do reforço positivo não se aplica a casos de agressividade; não podemos dar bolachinhas a um cão agressivo e esperar que ele fique curado...»

Tendo em conta que a visibilidade dos métodos baseados em reforço positivo é relativamente recente (embora os métodos não o sejam), o mito presente na epígrafe inicial é, também ele, relativamente recente. No entanto, é também um daqueles que mais fortemente se vem solidificando na comunidade de donos de cães. Ele é tão significativo que chega até a uma parte muito significativa de profissionais da área que, enquanto tal, teriam obrigação de estudar a fundo o tema e não se deixar levar por aparências. É certamente constrangedor quando um profissional de uma área de actividade qualquer é apanhado por uma das ideias mitificadas que existe nessa mesma área. Seria extremamente constrangedor para um médico acreditar que as gripes se apanham em correntes de ar frio, ou para um nutricionista acreditar que a laranja comida de noite é mortífera... Um treinador que simplesmente desconhece a forma como funcionam os métodos à disposição na sua profissão (tanto mais que, no caso, são apenas dois) é um mau profissional. Acreditar que o método que opera com base no reforço positivo não é aplicável em casos de cães agressivos é, simplesmente, acreditar num mito.
Grande parte das razões pelas quais este mito se encontra tão difundido tem a ver com o facto de a generalidade das pessoas e mesmo uma significativa parte dos treinadores de cães apenas levarem em conta um tipo de condicionamento: o condicionamento operante. Não obstante, existe um outro tipo de condicionamento, cuja formalização científica é, curiosamente, mais antiga e mais difundida na comunidade científica: o condicionamento clássico. Por outras palavras, apenas é levada em conta a dicotomia entre castigos e recompensas; para muitos, incluindo, muitos treinadores, tudo quanto há a fazer é recompensar o bom comportamento e castigar o mau comportamento. Poderá haver algumas técnicas para obter este ou aquele comportamento, mas, no fundo, tudo se resume a recompensar o bom e castigar o mau. Ora, se apenas existisse o cenário binário formado pela recompensa do bom comportamento e pelo castigo do mau comportamento, o uso de comida (ou de outra recompensa, embora, nos casos que serão expostos, o melhor exemplo de recompensa é mesmo a comida) apenas se aplicaria nos casos a recompensar; quando se tratasse de castigar, a comida não faria sentido e, consequentemente, o reforço positivo não se aplicaria. É este o pensamento que sustenta a ideia formulada na epígrafe inicial. No entanto, existem mais coisas que se podem fazer com comida para lá de ser usada como recompensa. Desde logo, podemos usar a comida para levar o cão a seguir a comida até realizar um determinado comportamento que se pretende ensinar; a isto chama-se luring (comummente se traduz como "isco" ou "engodo"; eu acho mais feliz a tradução "íman"). (Sobre a noção e a prática de luring, juntarei algumas considerações num "post" futuro.) Mas para além de forma de recompensa, e função de atracção (luring), a comida tem ainda uma outra importante função: a capacidade de realizar condicionamento clássico de forma conveniente e controlada. Um primeiro exemplo: imaginemos um cão com medo de aspiradores; durante uma semana, todas as refeições desse cão serão feitas próximas ao aspirador, começando com alguma distância no primeiro dia e, de refeição em refeição, o prato de comida vai-se aproximando do aspirador; aí por volta do segundo dia, o aspirador é ligado por breves segundos, e a cada refeição, vai permanecendo ligado por cada vez mais tempo. No final da semana, o cão ganhou confiança com a presença do aspirador. O que se passou foi puro condicionamento clássico. Como o aspirador se tornou presença permanente na hora de refeição, aquilo que o cão associa à hora da refeição passou a incluir também a presença do aspirador. É claro que o inverso também se pode passar: a hora da refeição poderia ser associada ao "terror" provocado pela presença do aspirador, e o cão pode ganhar aversão à comida ou à hora de refeição. Esta segunda hipótese é altamente improvável. Para isto se passar, teria de acontecer que o medo ao aspirador fosse mais primário do que a atracção pela comida. Por isso mesmo é que se começa com alguma distância, de modo a que o medo ao aspirador não esteja no seu auge. E por isso mesmo é que se usa comida no treino, pois é o reforço mais primário que existe. Pode haver quem conteste e diga que o seu cão é mais motivado por bolas, discos de frisbee ou por um jogo de tug. É preciso ter noção de que, neste caso, não estamos a falar de motivação para um comportamento, mas de condicionamento clássico. E no condicionamento clássico, diga-se o que se disser, a comida é o reforço mais primário que existe (partindo do princípio que quando se está a desenvolver algum trabalho usando condicionamento clássico, o cão não está a ser alimentado fora desse trabalho; seria o mesmo que usar-se uma bola como motivador num cão que passou o dia a correr e se encontra exausto).

O primeiro passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é, portanto, o seguinte: compreender que a comida não serve apenas para recompensar o bom comportamento. A comida serve, também, e sobretudo, como forma de accionar uma desejável associação entre um estímulo (no caso, aquilo que despoleta a agressividade) e algo de importância primária e sobejamente positiva (a comida). A comida serve para criar uma associação que faça com que algo que é visto como negativo pelo cão (algo perigoso, inseguro, desconhecido) passe a ser visto como positivo (seguro, indicador ou previsor de coisas boas).

(continua)


domingo, 23 de junho de 2013

Metodologias de treino - aula prática

«Teoria?... Ok, aula prática!»


Tal como o professor do anúncio da Linic, também o Abacaxi se preocupa com os espíritos práticos para quem uma exposição de princípios é "mera teoria", e nada diz acerca do mundo real (como se, por algum tipo ingenuidade, as teorias não se formassem com base em experiências e leituras acerca desse mundo real, e, sobretudo, como se a prática não estivesse fundamentada nos princípios que são debatidos no plano teórico...).

Assim sendo, aqui vai uma aplicação dos princípios apresentados no "post" anterior.

O caso prático é... o cão puxa na trela durante os passeios.

Muito bem. O que há a fazer? Podemos começar por pensar que o primeiro e fundamental passo é castigar aquilo que consideramos mau comportamento. Existem algumas formas de o fazer. A mais difundida e usada é o esticão na trela. O treinador dá um esticão na trela sempre que o cão vai a puxar na trela. Como o cão ainda está a aprender e não percebe por que é que está a levar com esticões no pescoço, continua a puxar. E o treinador continua a dar esticões. Eventualmente, o cão experimenta parar de andar, seja para ver quais as consequências deste seu novo comportamento (parar de puxar) seja porque os esticões já o distraíram do motivo pelo qual estava a puxar. O cão pára de puxar, e os esticões na trela param imediatamente.
O que aconteceu aqui? O treinador, através de esticões na trela, usa castigo positivo. Ou seja, usa um tipo de consequência (P+) que torna menos provável o comportamento de puxar na trela. É castigo porque reduz a probabilidade; é positivo porque incide directamente sobre o comportamento a castigar.
De seguida, o cão pára de puxar na trela e os esticões param imediatamente. Ora, o novo comportamento (não puxar na trela) é premiado por deixar de haver esticões. Esta é a aplicação do reforço negativo. Ou seja, aplica-se um tipo de consequência que torna mais provável o comportamento de não puxar no futuro. É reforço porque aumenta a probabilidade de incidência do comportamento; é negativo porque o comportamento reforçado é, na verdade, uma ausência de comportamento: é a ausência de puxar na trela.

Esquematizando:

Situação anterior ao treino:



Situação no treino (o antecedente mantém-se o mesmo, obviamente):












Nos casos em que o processo é bem executado, o resultado final é o seguinte:

O cão percebeu que puxar a andar à trela lhe traz más consequências, e percebeu que se parar de puxar essas más consequências cessam. O cão aprende o comportamento não puxar na trela porque foi reforçado pelo facto de não ser castigado.


Mas pode haver uma outra forma de abordar o problema. Podemos começar por nos interrogar sobre qual o comportamento que queremos que o cão tenha, em vez de puxar na trela. Neste caso em concreto, a resposta é óbvia: andar sem puxar na trela. O simples facto de colocarmos a questão de uma outra perspectiva vai fazer com que a abordagem seja completamente diferente. Aqui, iremo-nos concentrar nos momentos em que o cão está a andar sem puxar, e vamos reforçar esses momentos de modo a que eles se repitam cada vez mais. Isto é reforço positivo. No entanto, na fase inicial, o cão vai continuar a passar mais tempo a puxar na trela do que a andar sem puxar. Por duas razões: (i) o comportamento "andar sem puxar" ainda não teve um historial de reforço muito forte e (ii) não há um diferencial entre os dois comportamentos "andar sem puxar" e "puxar na trela", pois ambos são reforçados positivamente: o primeiro, directamente pelo dono; o segundo, pelo ambiente. Por isso, é preciso fazer com que o segundo comportamento deixe de ser reforçado positivamente: assim, sempre que o cão puxar na trela, o dono parará a marcha e o comportamento de puxar não é reforçado, pois o cão não chega a lado nenhum. Isto é castigo negativo.

Esquematizando (a situação anterior ao treino é a mesma exemplificada mais acima, obviamente):













Nos casos em que o processo é bem executado, o resultado final é o seguinte:

O cão percebeu que quando puxar a andar à trela o resultado é que a marcha pára, pelo que essa acção de puxar na trela não é a forma mais rápida de chegar onde pretende; paralelamente, sempre que anda sem puxar na trela, ele recebe recompensas. E de dois tipos: não só recebe biscoitos do seu dono, como acaba por chegar aos sítios visados.

O caro leitor, tal como diversas pessoas, poderá, compreensivelmente, colocar a seguinte objecção a este segundo método: "mas eu não quero ter de andar com biscoitos no bolso a vida inteira".
A toda a hora surgem objecções deste tipo. Muito sinceramente, acho que na maior parte das vezes, essas objecções surgem só para chatear. Mas, estando certo de que o caro leitor pertence à minoria de pessoas que coloca essa objecção por puro espírito inquisitivo, responder-lhe-ei do seguinte modo: o objectivo do reforço de um comportamento é torná-lo mais frequente no futuro. Se o comportamento de andar sem puxar ganha frequência, chegámos àquele ponto em que o cão já percebeu que se andar sem puxar ele vai continuar a marcha, mas se puxar, a marcha pára. Ora, nenhum cão quer ficar parado; todos eles querem "ir ver o que é aquilo ali à frente, quem é aquele labrador castanho que nunca vi por aqui, de quem é este cheiro tão intenso, quero ir ver, quero ir ver!". O comportamento, em si mesmo, é auto-reforçante, pelo que não temos de estar a usar nenhuma outra forma de reforço positivo a partir do momento em que andar sem puxar se tornar frequente.
E isto aplica-se a ambos os métodos. A partir do momento em que conseguimos que o comportamento desejado se torne frequente, o reforço desse comportamento já advirá de si próprio. Restará apenas usar o respectivo castigo para as ocasiões (desejavelmente cada vez menos frequentes) em que o cão puxa na trela (num caso, dar um esticão; no outro, parar). 

O que o caro leitor deverá perguntar-se, na verdade, é qual a forma que prefere para promover o comportamento desejado. Prefere ter um cão que anda sem puxar porque receia o castigo, ou prefere um cão que anda sem puxar porque gosta das consequências desse comportamento? Dito de outra forma: prefere que o seu cão aprenda que puxar na trela é errado e perigoso, e, por extensão, andar sem puxar é seguro, ou prefere que o seu cão aprenda que andar sem puxar na trela é agradável e vantajoso?

sábado, 22 de junho de 2013

Metodologias de treino - condicionamento operante, versão livro amarelo

Tem exame amanhã e ainda não leu os últimos textos do blog?
Não desespere, o Abacaxi lança mais um Livro Amarelo, desta vez contendo apontamentos sintéticos acerca do tema "Metodologias de treino - condicionamento operante".



  • É errada e mitificada a ideia de que a abordagem mais prudente na educação do seu cão passa por misturar procedimentos de métodos diferentes, e ajustá-los ao seu cão. Não existem mais do que dois métodos, e esses métodos são mutuamente exclusivos, nos seus fundamentos. Dentro do mesmo método é possível avançar com várias formas de se abordar um mesmo problema.
  • Os fundamentos dos métodos de treino de cães baseiam-se nas leis do condicionamento operante.
  • A primeira noção fundamental no quadro do condicionamento operante é que o comportamento é condicionado a partir das consequências que dele decorrem. Se, tendencialmente, o comportamento x tem consequências boas, esse comportamento tem altas probabilidades de vir a repetir-se no futuro. Se, tendencialmente, as consequências forem más, esse comportamento tem altas probabilidades de não se vir a repetir no futuro. 
  • As consequências não são apenas providenciadas pelos donos dos cães. Um comportamento pode ser cultivado quando um dono recompensa esse comportamento, ou quando o ambiente recompensa esse comportamento. Muitas vezes, os donos castigam os seus cães e estes, contudo, mantêm o comportamento; o que acontece nesses casos é que os donos se esquecem que o comportamento que estão a castigar pode estar a ser reforçado por outras coisas.
  • Um comportamento tem mais tendência a acontecer depois de determinados antecedentes que estejam associados a boas consequências. Por exemplo, sempre o cão se senta depois do dono dizer 'senta', o cão recebe um biscoito; mas sempre que o cão se senta depois de o dono bocejar, nada acontece como consequência. O cão vai aumentar as vezes em que se vai sentar depois de o dono se senta, e vai diminuir até à extinção as vezes em que se senta depois de o dono bocejar.
  • Cada método de treino define-se pelo tipo de consequências que providencia para os comportamentos do cão.
  • Existem quatro tipos de consequência: reforço positivo, reforço negativo, castigo positivo, castigo negativo. 
    • Reforço (seja positivo ou negativo) é tudo aquilo que torna o respectivo comportamento mais provável de acontecer no futuro. 
    • Castigo (seja positivo ou negativo) é tudo aquilo que torna o respectivo comportamento menos provável de acontecer no futuro.
    • Positivo (seja reforço ou castigo) é tudo aquilo que envolve ou incide sobre uma acção do animal.
    • Negativo (seja reforço ou castigo) é tudo aquilo que implica uma prevenção ou um evitar de uma acção do animal.
    • Reforço positivo é o tipo de consequência que torna o respectivo comportamento mais provável de acontecer e incide directamente sobre uma acção do cão.
    • Reforço negativo é o tipo de consequência que torna o comportamento em causa mais provável de acontecer, mas lida com um comportamento negado. Aquilo que se pretende reforçar é a ausência de um determinado comportamento.
    • Castigo positivo é uma forma de reduzir as probabilidades de um determinado comportamento vir a ser repetido, e incide sobre o comportamento propriamente dito. 
    • Castigo negativo é uma forma de reduzir as probabilidades de um determinado comportamento ser repetido, mas, em rigor, incide sobre um não-comportamento, ou melhor, um comportamento ainda não ocorrido totalmente. Este castigo impede que um determinado comportamento seja reforçado positivamente.
  • Nenhum destes tipos de consequência actua completamente isolado. Actuam, na verdade, aos pares. Reforço positivo actua em conjunto com castigo negativo. Reforço negativo actua em conjunto com castigo positivo. Por exemplo, não há reforço positivo de um determinado comportamento desejável sem que haja castigo negativo dos comportamentos indesejados que possivelmente pudessem acontecer. Assim como não há reforço negativo de um comportamento se este não tiver sido, previamente, castigado positivamente. 
  • É possível usar-se castigo positivo e depois reforço positivo? Sim, é. Mas, em rigor, já não se está a trabalhar o mesmo comportamento. Por exemplo: um cão salta para as pessoas quando chegam em casa; um dono pode decidir tratar do problema começando por exercer castigo positivo; ou seja, de cada vez que o cão salta para alguém, o dono providencia uma consequência má para esse comportamento de modo a fazer com que o cão não tenha mais vontade de realizá-lo. Sempre que o cão salta para alguém, algo de mau surge como consequência; este tipo de consequência vai determinar uma tendencial extinção do comportamento. Quando o cão deixa de saltar para as pessoas, o seu comportamento é automaticamente reforçado (negativamente) pelo facto de já não receber qualquer tipo de punição desagradável. Se o dono resolver recompensar o cão por não saltar com festas, biscoitos ou palavras, isso já é reforço positivo (e não o reforço negativo que surge automaticamente associado ao castigo positivo); e, em rigor, já se está a reforçar um novo comportamento; já se trata de um segundo comportamento - o cão já não salta - e não do primeiro comportamento, que era saltar. 
  • A grande questão é a seguinte: se o objectivo é, no final, recompensar o bom comportamento, então por que razão perdemos tempo em castigar o mau comportamento até que ele termine, se podemos começar desde logo a recompensar o bom comportamento? De que modo?, perguntarão. Fácil, promovendo o bom comportamento e reforçando-o. Usando o mesmo exemplo: se um cão salta para as pessoas quando estas chegam a casa, ensine o seu cão a sentar-se; quando ele o fizer, reforce o comportamento de modo a que ele se repita no futuro (ajuda que nas primeiras vezes faça do seu "reforço" uma consequência bem memorável, e não uma consequência perto de neutra). E quando o cão saltar, na mesma? Simples: castigo negativo. Por cada salto, não há recompensas e não há atenção do dono. O cão vai ser rápido a perceber qual é o comportamento com melhores consequências: "sentar (ou seja, não saltar!) e receber recompensar e a atenção dos meus donos ou saltar e ser ignorado... hm...". A escolha não me parece difícil.
  • Diga-se o que se disser acerca das formas de castigo positivo, este tem, forçosamente, de ser aversivo. De outra forma, não resultaria. Se um cão deixa de ter um comportamento é porque as consequências para este comportamento passaram a ser más ao ponto de ele abandoná-lo. Se o castigo fosse brando, leve, ténue, as consequências não seriam fortes o suficiente para que o cão deixasse de realizar esse comportamento. Até porque, se esse comportamento já existe, é porque ele tem tido boas consequências. Logo, para que o castigo positivo se sobreponha às consequências que esse comportamento tem tido, ele tem de ser mais intenso; ele tem de ser, sempre, aversivo. 
  • A pergunta que faço é a seguinte: se existe uma forma de ensinar o seu cão através da promoção dos comportamentos correctos (reforço positivo) e prevenção dos comportamentos incorrectos (castigo negativo), por que raio é que alguém prefere punir aversivamente os comportamentos incorrectos (castigo positivo) e esperar que surjam os comportamentos correctos para parar de castigar (reforço negativo)?
--------------------------

Amanhã há aula prática.



sexta-feira, 21 de junho de 2013

Metodologias de treino - segunda parte: os erres e os pês do condicionamento operante

(continuação)

Lembremo-nos da ideia mitificada que está em causa: achar-se que a atitude mais conveniente e menos dogmática é aquela que usa um pouquinho de cada método para atender às necessidades individuais do seu cão e à situação concreta.

Para desmistificá-la, teremos de continuar a esclarecer em que consiste o condicionamento operante. Vimos, ontem, o seu ABC, ou seja, vimos que o comportamento (B) do cão varia consoante as consequências (C); e a melhor forma de controlar o comportamento e as respectivas consequências é estipular um adequado antecedente (A). Os tipos de antecedente, como sugerimos, são vários (um comando, um gesto, uma buzina, umas chaves colocadas na fechadura, o motor do carro, um clique, tudo isto pode despoletar comportamentos); os comportamentos, esses são tantos quanto a sua imaginação quiser dar forma. Já os tipos de consequências são apenas quatro. Materialmente, há muitas consequências possíveis, claro; mas, em termos de efeito para o comportamento (torná-lo mais provável ou menos provável de acontecer no futuro), aí só há quatro possíveis. Quando falamos de consequências para o comportamento falamos de reforço positivo, reforço negativo, castigo positivo e castigo negativo. Como se vê, desde logo, reforço positivo não é, em rigor, um método, mas um tipo de consequências para o comportamento. Um de quatro tipos. Entremos em definições:

  • Reforço (seja positivo ou negativo) é tudo aquilo que torna o respectivo comportamento mais provável de acontecer no futuro. 
  • Castigo (seja positivo ou negativo) é tudo aquilo que torna o respectivo comportamento menos provável de acontecer no futuro.
  • Positivo (seja reforço ou castigo) é tudo aquilo que envolve ou incide sobre uma acção do animal.
  • Negativo (seja reforço ou castigo) é tudo aquilo que implica uma prevenção ou um evitar de uma acção do animal.

Um dos maiores problemas na compreensão real destas noções tem a ver com a carga semântica que a maioria destes termos possui. O único termo que eu considero perfeitamente feliz, porque isento de conotações deturpadora, é o termo 'reforço'. Ao evitar-se o uso de palavras como "recompensa", e usarmos a palavra 'reforço' estamos a ir ao fundo da questão: tudo de quanto se trata é de reforçar uma determinada acção, um determinado comportamento, e, como tal, torná-lo mais provável de voltar a acontecer. 
O mesmo não se passa com os outros três termos, carregadíssimos de conotações que desviam o sentido da nossa compreensão. Quando falamos em castigo, neste contexto de ciência da aprendizagem, devemos evitar toda aquela acepção punitiva que o termo 'castigo' transporta. Existe uma forte noção de justiça por detrás da noção de castigo. E isso tem tremendas implicações na forma como educamos os nossos cães. Quando um cão tem um determinado comportamento que consideramos inadequado, tendemos a castigá-lo por razões de justiça: "não é justo que um cão tenha feito uma asneira e eu continue aqui como se nada fosse". É esta a mentalidade que perpetua certas aberrações do ponto de vista da aprendizagem canina como, por exemplo, o famoso 

"ah, deixa-o estar aí; não brinques com ele porque ele está de castigo"
"então, o que é que ele fez?"
"fez xixi ali na cozinha, hoje de manhã".

Apenas um sentimento, mais ou menos inconfessado, de equidade jurídica permite este tipo de procedimentos por parte dos donos. É extremamente urgente deixar cair o moralismo com que estabelecemos parâmetros de justiça para o comportamento animal, e que definitivamente procedamos de acordo com as leis de aprendizagem. Segundo esta perspectiva, o castigo não é mais do que uma forma de fazer com que o comportamento em causa (a castigar) se repita menos e menos vezes no futuro. Devemos encarar a noção de 'castigo' mais de acordo com a forma como um pai castiga o filho quando este faltou a uma aula para ir jogar bilhar para o café. Este pai sabe que um tal comportamento nada tem de grave nem sequer de anormal; ele próprio tê-lo-á feito quando tinha a mesma idade; mas esse pai também sabe que não fala "a mesma língua" que um jovem adolescente, e sabe que a melhor forma de evitar repetições ou mesmo eventuais escaladas de mau comportamento do seu filho é castigar aquele primeiro comportamento. Não por uma questão de justiça, mas por uma questão de aprendizagem: em vez de achar que um jovem adolescente é capaz de discernir o que é o certo e o errado, tornar o comportamento menos provável de ocorrer no futuro e, ao mesmo tempo, ir definindo e construindo, passo por passo, o sentido de responsabilidade pelos próprios actos. No caso concreto dos cães, esse "sentido de responsabilidade" será obtido por uma correcta aprendizagem do jogo das consequências: certos comportamentos têm certas consequências, logo...
Também os termos 'positivo' e 'negativo' padecem do mesmo mal. Muito facilmente estabelecemos uma equivalência entre positivo e bom, e entre negativo e mau. Mais uma vez, o problema está na forma moralista como vemos as coisas. É comum, por exemplo, depararmo-nos com pessoas que julgam que um castigo positivo é uma forma de castigar exemplarmente, enquanto um castigo negativo seria uma forma demasiado rude de castigar. É também comum a ideia de que uma correcção é uma forma de reforço negativo (como se fosse uma oposição ao reforço positivo). Estas ideias são tão comuns quanto erradas. É melhor pensarmos em termos matemáticos e gramaticais, onde o moralismo não chega a contaminar as ideias. Positivo, em termos matemáticos, tem a ver com adição, com acrescento, com construção. Positivo é afirmação, é algo que se impõe por si. Negativo, por seu lado, tem a ver com a subtracção, com o retirar algo a uma grandeza já formada. Negativo não é mais do que o plano em que se nega algo que, de outra forma, seria afirmativo.

Vejamos, então, as quatro consequências possíveis.

  • A mais fácil de compreender é a consequência que se denomina como reforço positivo (positive reinforcement, ou R+). Reforço positivo é o tipo de consequência que torna o respectivo comportamento mais provável de acontecer e incide directamente sobre uma acção do cão. Reforço, porque aumenta a probabilidade do comportamento; positivo, porque diz respeito ao comportamento efectivamente realizado, diz respeito à acção, propriamente dita.
  • Reforço negativo (negative reinforcement, ou R-) é o tipo de consequência que torna o comportamento em causa mais provável de acontecer, mas lida com um comportamento negado. Ou seja, o comportamento que é reforçado negativamente é, na verdade, uma ausência de comportamento. Aquilo que se pretende reforçar é a ausência de um determinado comportamento. Daí que se denomine negativo.
  • Castigo positivo (positive punishment, ou P+) é uma forma de reduzir as probabilidades de um determinado comportamento vir a ser repetido, e incide sobre o comportamento propriamente dito. Isto é, aquilo que é positivamente castigado é um comportamento que se verifica efectivamente. O objectivo do castigo positivo é, pois claro, evitar que um comportamento efectivamente verificado se repita no futuro.
  • Por fim, castigo negativo (negative punishment, ou P-) é uma forma de reduzir as probabilidades de um determinado comportamento ser repetido, mas, em rigor, incide sobre um não-comportamento, ou melhor, um comportamento ainda não ocorrido totalmente. O objectivo do castigo negativo é fazer com que um determinado comportamento considerado desajustado venha a ser reforçado por si mesmo, sendo, por isso, evitado, negado, impedido antes que aconteça tal reforço.

Tal como na física, termos da mesma valência repelem-se e termos de valência oposta atraem-se. O reforço positivo funciona juntamente com o castigo negativo; o reforço negativo funciona em par com o castigo positivo. Porquê? Simples. Vamos ver as várias combinações possíveis, 

Reforço positivo com reforço negativo: simplesmente, não podem ser combinados, pois implicam dois comportamentos diferentes a serem reforçados. É só um comportamento (ou uma sequência de comportamentos, o que, para o efeito, é a mesma coisa, pois é apenas UMA coisa a ser reforçada) que pode ser reforçado; é impossível reforçar um comportamento positivamente e negativamente. Até porque, como vimos, o reforço negativo implica que o comportamento reforçado não esteja a ocorrer, enquanto o reforço positivo incide directamente sobre um comportamento que tenha acabado de acontecer. 

Castigo negativo e castigo positivo: pelas mesmas razões, são incompatíveis.

Reforço positivo e castigo positivo: como é óbvio, não podemos estar a reforçar e a castigar o mesmíssimo comportamento; e seria isso que uma situação de R+ com P+ suporia. 

Reforço negativo e castigo negativo: como é óbvio, não podemos estar a reforçar e a castigar a mesma ausência de comportamento. 

Reforço positivo com castigo negativo: aqui sim, faz sentido. Reforça-se o comportamento desejado, mas sempre com auxílio do castigo de eventuais comportamentos indesejados. Tomemos como exemplo o ensino de andar à trela: fazê-lo com recurso ao reforço positivo implica recompensar/reforçar os momentos em que o cão está a ter o comportamento adequado (andar sem puxar), mas implica também um extremo cuidado em não deixar que o cão seja reforçado por comportamentos desadequados (puxar na trela). De cada vez que um cão puxa a andar à trela e, efectivamente, prossegue na marcha, a acção de puxar na trela é reforçada por si mesma (reforço positivo), pois existe uma boa consequência para essa acção (o cão ficou mais perto do ponto que está a visar). Para evitar que o cão seja reforçado por um comportamento que não queremos de todo reforçar, então temos de abrir mão do castigo negativo sempre que o cão começar a puxar na trela. A forma mais usual será, neste caso, parar de andar. Simplesmente, parar. Não há nada de justo nem moral; é simplesmente uma forma operante de ajustar o comportamento. Paramos para evitar que a acção indesejada se torne menos provável de se repetir no futuro. Mas, no sentido inverso, só faz sentido fazermos isto se usarmos reforço positivo nas situações em que o cão não está a puxar na trela, de forma a que seja este o comportamento mais reforçado, logo, mais provável de ocorrer no futuro.
Esta combinação de consequências é aquela usada pelo método que vem sendo denominado como "método do reforço positivo", "método positivo", "positivismo", ... Eu prefiro chamá-lo "método com recurso ao reforço positivo", embora compreenda a conveniência de se usar um nome mais curto. (Só não acho nada ajustado chamar-se-lhe, simplesmente, "positivo", "positivista" ou "positivismo", na medida em que o método contrário também usa algo no quadrante positivo, o castigo)

Reforço negativo com castigo positivo: este também faz sentido. Um funciona como complemento do outro. A diferença deste caso em relação ao par anterior é que vai acontecer um quadro operativo completamente inverso. Tomemos o mesmo exemplo de andar à trela. Se optarmos por ensinar este comportamento através da combinação R- e P+, iremos proceder deste modo: sempre que o cão estiver a puxar na trela, castigamos. Até aqui, nada de novo; só que o castigo, ao ser positivo e não negativo, já não se limita a impedir que o "mau" comportamento continue e seja reforçado; castigar positivamente um cão que puxa na trela implica fazer-lhe alguma coisa de forma a que este comportamento lhe traga más consequências. O procedimento mais habitual: dar um (ou mais) esticão na trela. A ideia é castigar o cão de forma a que este não pretenda continuar a ter o comportamento; depois, quando o cão pára de puxar, surge o reforço negativo. Aqui, o reforço negativo surge pela simples paragem do castigo, ou seja, surge quando o dono deixa de dar esticões na trela. Sinteticamente: o comportamento inadequado acontece: o dono castiga positivamente, promovendo uma consequência má para tal comportamento; tendo em conta este quadro de consequências, o cão pára o comportamento, e o dono deixa de castigar. A consequência de parar de puxar na trela é boa, pois significa o final do castigo.
Esta combinação de consequências é aquela usada pelo método a que podemos, genericamente, denominar como "Método tradicional".

Em termos formais, quer num caso (R+ com P-) quer noutro (R- com P+) faz-se um trabalho muito semelhante de controlo das consequências para cada comportamento. Isto é, em vez de deixar que seja o ambiente ou as circunstâncias a providenciarem as consequências para o comportamento (no caso de puxar na trela, se nada fizermos, o comportamento vai ser auto-reforçado, ou melhor, reforçado pelas consequências fornecidas pelo próprio ambiente...) está-se a usar as relações entre comportamento e consequência a nosso favor. Mas há um detalhe que torna um caso bem distinto do outro. A pergunta a fazer é "o que é que foi realmente ensinado"? No primeiro caso, a resposta será: "o cão aprendeu a andar sem puxar". No segundo caso, a resposta será: "o cão aprendeu a não puxar". Ou seja, no primeiro caso, o cão aprendeu por promoção do comportamento desejado (e impedimento do comportamento indesejado); no segundo caso, o cão aprendeu por repulsão (primeiro) e ausência (depois) do comportamento indesejado. Ora, o par R+P- trabalha sobre o comportamento que se pretende ver repetido; o par R-P+ trabalha sobre o comportamento que se pretende ver extinguido. 
Uma pergunta muito pertinente poderá levantar-se, neste momento: mas e então eu não posso castigar o meu cão com um esticão na trela quando ele estiver a puxar, e depois recompensá-lo com uma bolacha quando ele estiver a andar sem puxar? Traduzindo esta pergunta para os termos formais: será que não podemos, mesmo, usar primeiro o castigo positivo e, depois, o reforço positivo? Esta é a grande rasteira que assombra o pensamento de demasiada gente, incluindo muitos profissionais. É que é extremamente atractivo (uma vez mais, por questões também moralistas) colocarmo-nos no (pretenso) meio termo e descomprometermo-nos com qualquer facção (pretensamente) ideológica ou extremista. Repare no que foi dito acima acerca da combinação eventual entre reforço positivo e castigo positivo: quando temos estes dois tipos de consequências, temos já dois comportamentos a ocorrer, pois não podemos reforçar positivamente e castigar positivamente o mesmo comportamento. Ora, quando o caro leitor castiga (positivamente) o seu cão com um esticão na trela (ou afim) por este puxar, e, quando o cão deixa de puxar, o caro leitor o recompensa, na verdade está a fazer um processo faseado em que está a lidar com dois comportamentos. Isto pode parecer um preciosismo, mas, conforme se verá, não é. É que, na verdade, o simples facto de deixar de dar esticões já é um reforço; é o puro reforço negativo. O seu cão puxa na trela -> o dono castiga-o (com um esticão, por exemplo) - > o cão cessa o comportamento inadequado -> o dono deixa de castigar. O "deixar de castigar" é uma forma de reforço; é, como disse, o reforço negativo. Se o caro leitor decidir, depois disso, recompensar o seu cão por estar a andar sem puxar, então vai estar a usar reforço positivo, é certo, mas não como par do castigo positivo. O par do castigo positivo é, sempre, o reforço negativo. Neste caso, castigou positivamente o puxar na trela; reforçou negativamente o deixar de puxar; e completou reforçando positivamente o andar sem puxar. É uma via legítima, claro. Mas estão em causa dois processos e não um só. Na verdade, não existe um uso "misturado" ou "conciliado" ou "balanceado" de métodos. Existe o uso de um método seguido do uso do outro método. 
E qual é o mal? Toda esta lengalenga de erres e pês tem dois objectivos:

a) Tal como se disse na primeira parte, este tema é chato e estéril - não é por saber distinguir um R+ de um R- que o meu cão vai saber andar à trela sem puxar. Mas é extremamente conveniente que saibamos a estrutura e os fundamentos da aprendizagem animal para que saibamos o que estamos a fazer quando tentamos moldar o comportamento do nosso cão. Assim, é muito importante que saibamos que existem dois e só dois tipos de conjugação de consequências: reforço positivo com castigo negativo e reforço negativo com castigo positivo. É possível, tal como no último exemplo, castigarmos positivamente um cão e depois reforçar positivamente? É, mas teremos de ter a consciência de que estamos a castigar positivamente (e reforçar negativamente) um comportamento, e estaremos de seguida a reforçar positivamente um OUTRO comportamento. 

b) Voltemos questão: posso castigar o meu cão (com um esticão) quando ele está a puxar à trela, e depois recompensá-lo (com comida, por exemplo) quando ele está a andar sem puxar? Pode, sem dúvida. Mas a pergunta que eu coloco é a seguinte: se o objectivo é que o seu cão ande à trela sem puxar, por que é que não começa logo por aí? Por que é que não começa logo com o reforço positivo do comportamento desejado? "ah, porque o meu cão puxa bastante, e ele passa mais tempo a puxar do que a andar sem puxar; logo, não posso abrir mão de castigar o comportamento incorrecto; não posso simplesmente esperar pelo bom comportamento para recompensá-lo". Pois não! Tem toda a razão o leitor se pensar assim. Mas por isso é que existe uma coisa chamada castigo negativo. Sempre que o seu cão estiver a puxar, simplesmente pare. Isso já é castigo: é castigo negativo, na medida em que evita que o seu cão seja reforçado indevidamente. E tudo aquilo que pretende não passa disso: impedir que o seu cão seja reforçado pelo comportamento errado; promover que o comportamento certo seja repetido no futuro. Se der consigo a perguntar-se: "mas qual é mal de dar uma correcção (castigo positivo)?", eu aconselho que pense assim: porquê usar castigo positivo se obtém aquilo que deseja apenas usando o castigo negativo? 
Aquilo que devemos perguntar num caso destes, realmente, é o seguinte: o que é que eu pretendo reforçar (isto é, fazer com que o meu cão faça mais vezes no futuro)? andar na trela sem puxar, ou parar de puxar quando anda à trela? Pode parecer exactamente a mesma coisa, e, no limite, o efeito prático até pode ser o mesmo. Mas a maneira como formulamos aquela questão define perfeitamente a forma interpretamos o comportamento e a educação dos nossos cães: se eu escolher a resposta "quero que o meu cão pare de puxar quando anda à trela", estou implicitamente a pressupor que existe uma forma correcta natural do meu cão, e que é andar à trela sem puxar, e que existe, por contrapartida, um desajuste comportamental, que consiste em puxar na trela. Se, ao invés, eu escolher a resposta "quero que o meu cão ande na trela sem puxar", então estou a aceitar que o meu cão não sabe andar à trela, por defeito e por natureza, e que é preciso que seja ensinado. 

Uma palavra acerca do valor e das intensidades das consequências. 
O reforço positivo apenas funciona se for realmente reforçante, isto é, se tiver um valor alto para o cão de modo a ser uma consequência que torne o comportamento mais apetecível, mais susceptível de ser repetido. Quando o nosso cão faz o seu primeiro xixi na rua, existe uma diferença enorme entre fazer uma festinha e dar cinco pedaços de fígado cozido; lembre-se que o objectivo é tornar o comportamento mais provável no futuro, e não um qualquer concurso de integridade de carácter. 
O castigo negativo só funciona se, efectivamente, impedir que o cão conclua uma determinada acção cuja consequência fosse tornar essa acção mais provável no futuro. Ao mesmo tempo, o castigo negativo só funciona se o reforço positivo que lhe está associado for efectivamente forte; caso contrário, o comportamento que foi castigado negativamente poderá conhecer novos ensaios, pois não foi dada uma razão suficientemente forte para que essas novas tentativas não surgissem.
O castigo negativo só funciona se for realmente aversivo. Nenhum cão deixa de puxar na trela ou de ladrar se sentir uma pequena vibração ou um ligeiro toque no pescoço. O castigo positivo só o é se se afirmar como uma má consequência para o comportamento em causa; não há castigos positivos sem aversão; tal coisa seria apenas uma consequência neutra e, como tal, não levaria o cão a abandonar o respectivo comportamento.
O reforço negativo só funciona se o castigo positivo associado for realmente aversivo, fazendo do reforço negativo um alívio claro e inequívoco. Se o castigo positivo não tivesse sido realmente aversivo, o reforço negativo perderia toda a sua força reforçante, pois o cão não sentiria qualquer alívio ou sensação recompensadora pelo fim do castigo. 

Voltemos a colocar a perguntar enunciada acima: posso castigar (positivamente) o meu cão e depois reforçar (positivamente) quando ele se portar bem? Pode, mas se o objectivo é chegar à parte em que se usa o reforço positivo (recompensa pelo bom comportamento) por que razão começar o processo por algo que é necessária e inevitavelmente aversivo? "Porque não chega recompensar; o cão também tem de ser castigado quando tem um comportamento inadequado". Claro, mas para isso é perfeitamente suficiente o castigo negativo, que, aliás, é o par indissociável do reforço positivo.

A conclusão onde quero chegar é a seguinte: a mistura entre métodos não existe, propriamente. Ou se usa um, ou se usa outro. Poderemos, eventualmente, complementar um método com o outro. É materialmente possível. Só que não só não é necessário, como é até altamente desaconselhável e, sobretudo, sem sentido. Um método tem já as ferramentas todas para funcionar, por si só. Se se torna necessário recorrer ao outro método, como complemento, então é sinal de que o primeiro método não foi suficiente e, em todo o caso, era completamente desnecessário ter-se recorrido a esse primeiro método se se acabou por ter de se recorrer ao outro. No caso, e a insistência é propositada: se se vai acabar por recompensar as boas acções, então era completamente desnecessário o recurso ao castigo de tipo aversivo. O castigo negativo chegava bem.


quinta-feira, 20 de junho de 2013

Metodologias de treino - primeira parte: o ABC do condicionamento operante

«Eu cá acho um exagero que andem por aí agora umas pessoas a dizer que não se deve castigar os cães. Nem tanto ao mar, nem tanto à terra. Até porque os cães não são todos iguais. O que importa é ir usando os métodos consoante os cães e consoante as situações. Usar um só método é ser fundamentalista e é uma forma bastante limitada de educar os nossos cães»


Existem várias formas de se treinar um cão. Existem várias diferenças, várias matizes na aplicação de métodos. E são estas diferenças que tornam únicas e renovadoras algumas abordagens de alguns treinadores. Cinco treinadores a quem fosse apresentado um mesmo caso teriam cinco abordagens diferentes, pessoais. Mas, dê por onde der, não existem mais do que dois métodos de treinar cães. A primeira ideia fundamental a ter em mente é que 'método de treino' não significa unidade, rigidez e inversatilidade na forma de se educar um cão. Um método é um conjunto de fundamentos segundo os quais cada treinador irá operar. Como tal, o modo de operar de dois treinadores que sigam o mesmo método não é, necessariamente, o mesmo. Coincidirá nos fundamentos, mas, no modo de aplicação, pode não coincidir.

Quais são esses fundamentos? Quando falo em fundamentos de um método de treino, estou a referir-me às leis do condicionamento operante.
Este tema, em si mesmo, é como a gramática: é chato e estéril; mas se não passarmos por ele, arriscamo-nos a erros futuros, erros do tipo enunciado na epígrafe deste texto. Sem dominar a gramática, um escritor não poderia escrever literariamente; no entanto, o objectivo é que o escritor domine de tal forma as regras gramaticais que não tenha de pensar mais nelas quando escrever. Assim se passa com as leis do condicionamento operante: podemos ignorá-las; podemos perder-nos infinitamente em considerações sobre elas; ou poderemos dar-nos ao luxo de não levá-las em conta de tanto as dominar. É uma questão de escolha. Para aqueles que escolheram o primeiro caso, tudo bem, é uma escolha muito legítima; mas por favor não pretendam imiscuir-se em debates em relação aos quais preferem não saber os fundamentos. Para os restantes (ou seja, tanto para aqueles que estão sempre a falar em p+, p-, r+ e r-, quanto para aqueles que incorporaram essas noções de forma natural na sua acção) convém mesmo saber-se em que consistem as leis do condicionamento operante (que são, também, as leis da aprendizagem de base skinneriana).
O condicionamento operante diz respeito ao comportamento do cão e à forma como os comportamentos se vão moldando (modificando, aparecendo, extinguindo-se). A forma como o comportamento é moldado diz respeito a algo que se convencionou chamar ABC: antencedent, behaviour, consequence; em português, antecedente, comportamento, consequência. O princípio básico desta forma tripartida é bastante óbvio, embora nem sempre as pessoas o levem em conta: todo o comportamento tem consequências. Ora, a forma como um cão vai moldar os seus comportamentos futuros passa muito pelas consequências que os seus comportamentos presentes tiverem. A primeira conclusão, já não tão óbvia, que se deve tirar neste momento é que o comportamento está em permanente construção, pois está sempre a moldar-se consoante as consequências que vai tendo. A partir desta primeira conclusão, percebemos o quão desajustada é a forma como achamos que o nosso cão "já sabe isto" ou "já sabe aquilo": um cão aprende a responder à chamada porque, sempre que o faz, algo de bom acontece; mas, a partir de determinada altura, os donos deixam de recompensar o acto, pensando que o comportamento está estabilizado; passado algum tempo o cão deixa de responder tão frequentemente às chamadas. O que acontece? As recentes consequências re-moldaram o comportamento.
A segunda ideia fundamental a ter em conta é que as consequências não dependem sempre dos donos: um cão de rua que nunca teve um dono humano está tão sujeito às leis do condicionamento operante quanto todos os outros: se ele entrar numa loja é enxotado; as consequências de entrar nos edifícios com porta aberta não são favoráveis, razão pela qual o comportamento se vai extinguindo. De igual forma, um cão que puxa na trela e chega ao destino visado (cheirar uma árvore, por exemplo) foi reforçado pela acção de puxar; o seu comportamento (puxar) teve como consequência ter chegado à árvore. A probabilidade desse cão voltar a puxar na trela aumentou nesse preciso momento. Quer o dono queira, quer não; quer o dono tenha noção, quer não. Creio que este é um dos pontos que merece mesmo ser sublinhado. É que muitas das vezes os donos interpretam muito mal as razões pelas quais, por exemplo, o seu cão não responde à chamada. "Está a ver? Eu tenho as salsichas preferidas dele aqui no bolso, chamo-o, e ele prefere estar ali a cheirar aquele arbusto". As conclusões são, normalmente, uma destas duas, ou mesmo as duas em simultâneo: (i) "pois... isto das recompensas não resulta no meu cão"; (ii) "ele está a ser teimoso e/ou desobediente". Ora, o erro aqui tem a ver com o dono considerar que o universo das recompensas (consequências) se esgota nele mesmo; ou seja, o dono comum esquece-se que os comportamentos dos seus cães também são recompensados pelo ambiente em redor. O mundo do seu cão não começa e acaba em si; achar que todo e qualquer comportamento "desajustado" do seu cão é um acto de desobediência a si é um pensamento demasiado "dono-centrista". Se o seu cão se dirige para um arbusto e o cheira, o acto/comportamento (dirigir-se para o arbusto) foi recompensado pela consequência (cheirá-lo), pelo que as probabilidades de tal comportamento se repetir no futuro aumentam nesse preciso momento.
Até aqui falámos de comportamento (a letra B, de behaviour) e de consequências (a letra C); e falámos da forma como as consequências afectam e moldam o comportamento. Mas e então a letra A; o que é o antecedente? Tal como as outras variáveis, também o antecedente pode ou não ter a ver com o dono/treinador. A forma mais conhecida de antecedente é, obviamente, o "comando": o dono diz senta (antecedente), o cão toca com o rabo no chão (comportamento), o dono recompensa (consequência). Mas o antecedente não é sempre um comando. Tomemos o seguinte exemplo: quando os donos do Louie se encontram a jantar, o Louie aproxima-se da mesa, e os donos costumam dar-lhe alguns pedaços da sua comida. Formalizando esta situação em termos de "ABC": antecedente: os donos sentam-se para jantar; comportamento: o Louie aproxima-se da mesa; consequência: o Louie recebe comida do jantar dos donos. A consequência, sendo altamente recompensadora, faz com que o comportamento se repita constantemente. Mas apenas quando o antecedente "correcto" se encontra presente. Ou seja, se o Louie se aproximar da mesa quando os donos não estiverem lá, a consequência não é a mesma, logo, o comportamento de aproximar-se à mesa apenas se irá verificar quando o antecedente indicar que as consequências para o comportamento vão ser as desejadas. Ou seja, o antecedente é um indicador de que o comportamento vai ter uma determinada consequência. Um cão aprende a apenas sentar-se ao comando se, de cada vez que se senta sem o comando, não obtiver as mesmas consequências. Os comandos, pelos quais a maior parte de donos e treinadores desenvolvem uma grande obsessão, são apenas formas de usar a função do antecedente a nosso favor; são apenas formas de controlar os antecedentes de modo a obter comportamentos desejados. É extremamente importante ter presente que existem vários tipos de antecedentes, que nem todos são despoletados pelos donos e que, mesmo quando o antecedente provém de uma acção do dono, nem todas as vezes ela vem na forma de 'comando'. Na verdade, o 'comando' é uma ocasião muito rara se comparada com a quantidade de mensagens-antecedente que enviamos aos nossos cães e que despoletam comportamentos. 
Terceira ideia fundamental a reter: para uma correcta ou conveniente educação dos nossos cães, temos de (i) definir qual o comportamento que desejamos fomentar, (ii) criar consequências apropriadas para que o comportamento desejado se repita, e o comportamento indesejado se rarefaça, e (iii) estipular um antecedente específico ao qual o cão associe o comportamento desejado e a consequência adequada. Eis o ABC do condicionamento operante.
O passo mais importante a partir deste momento prende-se com a decisão acerca do tipo de consequências que vamos proporcionar aos nossos cães. É esta decisão que define qual o método de treino que se vai usar. Sobre isto, falar-se-á na segunda parte. 

terça-feira, 18 de junho de 2013

Desde pequenino, versão Livro Amarelo

Para quem não tem "tempo" de ler a versão narrativa, aqui vão os apontamentos sintetizados:


  • É muito comum ouvirmos a ideia de que, para se habituar o nosso cão a responder bem à chamada quando sem trela, o que há a fazer é habituá-lo desde bem cedo a andar sem trela;
  • Este conselho sugere que não haja, paralelamente, nenhuma forma de treino da chamada - basta este hábito desde pequenino;
  • Ao mesmo tempo que surgem estes conselhos, os cães dos emissores do conselho correm livremente, sem trela, e parecem responder muito bem às chamadas dos respectivos donos;
  • Decidimos soltar o nosso cão no parque e, surpreendentemente, ele até responde razoavelmente bem às nossas chamadas;
  • Nesse mesmo parque, outros donos com outros cães também parecem não ter grandes problemas, sem nunca terem feito nenhum trabalho minimamente formal ou cuidado no sentido de ensinar o cão a responder à chamada;
  • Neste momento, o dono do cachorrinho tem acesso a uma amostra que lhe dá confiança acerca daquele primeiro conselho. 
  • Aquilo a que este dono não tem acesso é à amostra de casos em que as coisas não correram tão bem. Nem pode ter acesso, uma vez que, quando corre mal, os cães ou fogem, ou são atropelados ou, simplesmente, demonstram não serem de confiança e os respectivos donos não os levam mais para o parque. Ou seja, esta amostra de casos "infelizes" permanece, necessariamente, invisível
  • Muitos dos cães que até aí demonstravam comprovar a "teoria do desde pequenino" começam a entrar na adolescência e a ganhar novos interesses; começam a deixar de inspirar tanta confiança, e, por razões mais ou menos felizes, passam para o lado da amostra invisível. 
  • Conclusão: o argumento em que se suporta a ideia de que um cão aprende a andar bem sem trela se for habituado desde pequenino, e sem nenhum treino formal nesse sentido, esse argumento é falacioso por natureza, pois o conjunto de contra-exemplo que destituiria o argumento permanece, necessariamente, invisível e inacessível. 
  • Moral da história: não se deixe cativar pelos argumentos que apelam ao preguiçoso que há em nós. Treine o seu cão e gira o ambiente. 



segunda-feira, 17 de junho de 2013

Desde pequenino

"Oh, que pequenino. Ainda é novinho, não é?"
"Sim, fez ontem três meses e está a começar a vir à rua. E o seu, que idade tem?"
"Ah, aquele tonto ali já tem 4 anos"
"E costuma vir sempre para aqui para o parque? É seguro trazê-los para cá?"
"Sim, sempre que posso, vimos cá. Isto por cá é tranquilo. Durante o dia às vezes o guarda vem chatear para pormos a trela, mas ao finalzinho da tarde junta-se aí um grupo engraçado e é vê-los a correr desalmadamente."
"E não há problemas? Há para aí uns patos, e a rua é já ali."
"Oh, não. O importante é que o nosso cão venha sempre quando o chamamos."
"Ah sim?"
"Sim, é preciso é habituá-los desde pequeninos a andarem sem trela. Se não o fizermos logo, quando ele for mais velho não vai saber andar sem trela e pode fugir quando o soltar."
"Ah, pois."

Os meses que separam o dia de hoje do dia em que ouvi esta conversa retiram alguma da exactidão das frases que foram efectivamente proferidas então. Em compensação, as vezes que já ouvi conversas similares dão-me a segurança de estar a transmitir a estrutura e a ideia de base de uma conversa deste tipo.

O que se segue a esta conversa? Nas semanas posteriores, o expectante dono do indefeso cachorro torna-se frequentador habitual do parque e solta o seu amiguinho sempre que pode. Afinal, o cão daquele simpático senhor com que falara há dias respondia muito bem às chamadas do dono. Além disso, já tinha ouvido mais pessoas a afirmar o mesmo; no mais, só faz sentido que assim seja, já que toda a gente sabe que é desde pequenino que se ensina o menino. E, por mais que não fosse, as primeiras experiências correm muito bem: para surpresa do renitente dono, o seu cão, solícito, vem ter com ele sempre que ele o chama para ir embora ou quando se está a afastar um pouco. Dias passam e o confiante dono já anseia pela hora de voltar para o parque e encontrar os novos amigos do seu expectante cachorro que tratarão de brincar com ele e cansar o pequeno terrorista que, desde que frequenta o parque, rói cada vez menos coisas em casa e já quase não reclama por atenção. Quanto ao dono, entusiasmado, repara que tem cada vez menos fendas nas mãos, agora que as agulhinhas que as provocavam conheceram novos depositários. 
Passaram-se umas semanas e o altivo dono já não passa sem a happy hour do parque, para onde corre depois do trabalho, e onde convive com os seus novos companheiros, com os quais costuma falar, com cada vez mais propriedade, acerca dos benefícios que traz ao seu confiante cão este novo hábito. Aliás, os temas de conversa começam a ser cada vez mais variados, à medida que os donos, desembaraçados, já se tratam pelos nomes próprios e já não por "dona do Bob" e "dono da Lady". Em ordem inversa, os cães começam a conhecer-se bem demais e procuram outras fragrâncias e novas aventuras. O hábil dono não parece apoquentar-se; desenvolveu já um assobio personalizado que traz de volta o seu renitente cachorro. "Não é preciso ser muito forte, basta um pequeno silvo".
Não fosse o facto de o sol estar, agora, mais radiante à hora do encontro habitual, e nem teria dado para perceber que já se tinham passado uns meses neste novo hábito. Um novo frequentador aparece com o seu novo cão. O solícito dono não tarda em passar-lhe o ensinamento do parque: "tire-lhe a trela; é preciso que seja desde pequenino". Não há como enganar: todos os presentes, de uma forma ou de outra, parecem confirmar a receita, ou não estivessem ali tranquilamente com os seus respectivos cães, a quem nunca tiveram de fazer muito mais do que tirar a trela desde pequeninos. Aquilo que nunca ninguém se lembrou foi de perguntar pelos ausentes, aqueles que foram deixando de aparecer. 
O cachorrinho de há uns meses entretanto havia-se transformado num entusiasmado adolescente. Pudera: a cada dia que passava ia descobrindo novos e novos cheiros, e ia percebendo as delícias que o aguardavam longe do seu dono e dos outros cães, cujos cheiros sentia todos os dias, e cujos comportamentos, em boa verdade, já começavam a aborrecer o altivo adolescente. O hesitante dono, moderando o vigor do silvo e intercalando-o com algumas palavras de ordem (que uma incógnita convicção lhe garante que o significado será compreendido pelo seu cão, à distância), vem a encontrar o seu desembaraçado cão junto de um arbusto cujo interesse o descuidado dono não descortina. Agora, já próximos, a chamada é retomada; o cão, hesitante, aproxima-se de um frustrado dono, que, ao mesmo tempo que repreende o seu amigo, se lembra de que ele deve ter entrado "naquela fase em que o cão testa o seu dono". "Aí é? Aceito o teste, meu menino".
E o "teste" continuou nos dias seguintes. Por cada falta à chamada, uma repreensão cada vez mais determinada do intolerante dono. Mas, por cada chamada não atendida, o hábil adolescente vê reforçado o seu comportamento de explorar um novo arbusto.
Os outros começam a notar que o abatido dono já não aparece todos os dias; e sempre que por lá aparece, já não conversa muito, pois o teimoso quadrúpede insiste em afastar-se cada vez mais. Amanhã, e depois, decidiu não aparecer; "na próxima semana volto lá". Demoraram, afinal, duas semanas. O cauteloso dono pondera os perigos de voltar a soltar o seu cão. Mas, ao mesmo tempo, lembra-se que tem de ser mais teimoso, o dono. Volta lá, e encontra um grupo já um pouco diferente; "uns vão e outros vêm, que engraçado." Depois de umas semanas sem grande convívio social, e depois de meses a conviver sempre com os mesmos amiguinhos, voltou a aprontar uma nova: o intolerante canídeo não foi muito à bola com um novo conviva. Embrulharam-se. Enquanto uns relevavam o caso, o envergonhado dono pune exemplarmente o seu companheiro: "o que é que lhe teria passado na cabeça para agir assim depois deste tempo todo?", perguntaram-se os dois. Obviamente, cada novo cão estranho torna-se sinónimo de perigos imprevistos; por cada um que se cruzasse no caminho, o cauteloso cão avisava-o para não se aproximar, contudo, ao mesmo tempo, o implacável dono segue castigando esses avisos. "Estar perto de outros cães e perto do meu dono não traz nada de bom", começou a pensar um agora envergonhado pré-adulto, pouco solícito a novos encontros. Pior do que tudo, a comunicação entre o dono infeliz e o confuso cão não floresce. 
Entretanto, havia lido acerca da necessidade de treinar o seu cão para que ele viesse ter até si, ao mesmo tempo que ouvia algo sobre ter de demonstrar quem era o líder para obter o mesmo resultado. O confuso dono, embora equacionando a possível imprudência que havia cometido desde o início, não deixou abater o seu espírito prático: "a verdade é que, de todos os cães que vejo no parque, nenhum foi lá muito treinado, e todos eles vão quando os donos os chamam; o resto são teorias...". Entretanto, o implacável terrorista havia voltado a estar um pouco insuportável em casa; "pois, não o tenho levado ao parque, para correr". Voltaram ao parque; mas desta vez sem tirar a trela. Insuficiente. Era preciso correr. E correram. Mas, por muito rápido que fossem, o grupo - sempre diferente, mas sempre o grupo - continuava ali por perto, e o frustrado corredor só pensava em estar junto do grupo. Notava-se; sempre que a volta passava por lá perto, notava-se. Na cabeça do dono, o seu cão queria juntar-se aos demais; para o seu cão, infeliz, aquele espaço e aquele grupo significavam liberdade. Dois dias depois, de tanto se notar, o dono volta a soltar o seu cão, embaraçado pela forma como o mantinha  atrelado, e cansado de tanto correr para cansar o seu cão. O seu cão, radiante, não consegue controlar bem a sua alegria. Brinca e corre. Depois, já só corre. E continua a correr. Descuidado, sai do parque. O indefeso dono não consegue gritar alto o suficiente, nem para evitar que o seu cão entre na estrada nem para alertar o condutor. 

Para saber o desfecho do cão, recupere-se o adjectivo usado para descrever o dono quando começou a deixar de frequentar o parque diariamente. Pois é, teve de ser. E desta vez, o dono deixou de aparecer no parque, não por uns dias, mas para sempre. Para os outros, este passou a ser um dos ausentes, isto é, um dos exemplos que não são levados em conta. Lembra-se da falácia da amostra invisível da semana passada? Pois, os nossos heróis farão parte dessa amostra, e sempre que alguém procurar exemplos do que é que resulta e não resulta, esse alguém só vai ter acesso à amostra visível. 

Logo porque os cães lá do parque nunca tiveram nenhum treino e andam bem sem trela, isso não significa que isso seja o correcto, isso não significa que isso vá durar para sempre, e isso não significa que isso vá resultar para si. Pense sempre que não tem acesso ao conjunto de pessoas a quem a coisa correu mal. 
Uma vez mais, educar um cão é como um jogo de sorte. Pode sempre acontecer um imprevisto em qualquer situação; mas treinar e gerir o ambiente ajudam a voltar as probabilidades a nosso favor. Nosso, do dono e do cão.