quarta-feira, 26 de junho de 2013

As metamorfoses da comida, ou o "outro" condicionamento - parte III

(continuação)

Um terceiro e último exemplo: um cão é agressivo perante outros cães, sobretudo cães estranhos. 
Um pedaço de comida é, normalmente, visto como forma de premiar um comportamento. Razão pela qual, muito compreensivelmente, as pessoas acham que não se pode tratar de um caso de agressividade usando comida. Se um cão está a rosnar para outro, ou se investiu contra uma criança, vamos estar a recompensar o quê, na verdade? Numa situação de agressividade, só podemos agir castigando a agressividade e, no máximo, recompensar quando a agressividade parar. Certo? Errado. Como já vimos, podemos usar a comida como forma de criar um ajustado condicionamento clássico. Mas, mesmo dentro do quadro simples do condicionamento operante, existe algo mais a fazer para além de castigar primeiro e recompensar depois. A primeira mudança na atitude passa por deixar de considerar a agressividade como comportamento activo primeiro. Existe um momento anterior à exibição do comportamento agressivo, e existe algo que despoleta essa exibição. Como tal, a agressividade é reactiva segunda. O segredo, na componente técnica, está em achar o momento primeiro, aquele que antecede a exibição de agressividade. Nesse momento, o cão ainda não exibiu o comportamento agressivo, ou seja, ainda não reagiu. Então, toca a reforçar. "Mas vou recompensar o quê, se ele ainda não fez nada?" Isso mesmo, não fez nada e é isso que vai querer reforçar, não é? Qual é o comportamento que quer ver repetido no futuro: o terminar da agressividade ou o não-começar da agressividade? Boa escolha. Então, se é isso que pretende ver repetido no futuro, reforce esse momento. 
Na verdade, já não é estritamente no campo do condicionamento operante que estamos a  trabalhar quando reforçamos o momento anterior à exibição de agressividade (que não chegou a existir, bem entendido). Estamos, simultaneamente, a trabalhar também dentro do quadro do condicionamento clássico. Ao usarmos um pedaço de comida (ou outro reforço) para reforçar, positivamente, o comportamento específico de não reagir agressivamente, estamos, ao mesmo tempo, a associar a presença do outro cão (ou seja, do estímulo que normalmente gera a reactividade do cão, seja ele qual for) ao pedaço de comida. Eis o poder de um simples cubinho de queijo: ao mesmo tempo que exerce uma função de reforço positivo de uma acção desejada, exerce também a sua função de condicionador clássico associando o seu valor (positivo) ao conjunto de estímulos próximos; passando estes estímulos a começarem a ser revestidos de uma conotação, também ela, positiva. A pouco e pouco, de "revestimento em revestimento", o estímulo que outrora gerava reactividade agressiva passa a ser visto como seguro. 
Não podemos nunca negligenciar que um esticão na trela (ou um choque eléctrico) tem um poder muito similar, ou seja, trabalha também nos dois campos ao mesmo tempo, embora de modo inverso: ao mesmo tempo que funciona como castigo positivo, o esticão exerce a sua função de condicionador clássico associando o seu valor (aversivo) ao conjunto de estímulos próximos. Isto justifica a perplexidade com que muitos donos e treinadores presenciam a agressividade de um cão perante um dado estímulo, mesmo depois de repetidamente terem sido castigados por tal apresentação de agressividade. "Mas será que não percebe que está a proceder mal?". Por cada esticão, o cão está a ser castigado (condicionamento operante) mas, ao mesmo tempo, está a ser condicionado classicamente, associando o efeito do esticão (efeito aversivo) ao estímulo. Resultado: o cão pode aprender (digo 'pode' porque, no meio de tanto stress que envolve (i) proximidade de um estímulo negativo, (ii) permanência numa situação considerada perigosa, e (iii) constantes castigos, no meio disso tudo é bem possível que não haja aprendizagem muito clara nesse sentido) que o seu comportamento é "errado" (na verdade, por 'errado' devemos entender: antecipador ou indicador de más consequências), mas certamente vai criar uma associação entre toda a situação com o estímulo que estava presente. Recapitulando: um cão pode até aprender que a sua acção (reactividade agressiva) é "errada"; mas, ao mesmo tempo, o castigo efectuado é associado (transferido) para a situação, ou seja, para a presença de outros cães. Os cães passam a ser previsores ou indicadores de coisas más. Nem que não fosse por um efeito de exclusão: em situações nas quais o estímulo em causa não está presente, não há castigos; quando o estímulo em causa aparece, há castigo. 1+1=...
Seguindo a técnica do castigo positivo+reforço negativo (ou seja, o esticão na trela e afins), no melhor (deveria dizer, no menos mau) dos casos, o cão aprende que o seu comportamento traz más consequências, e, como tal, pára-o. "Missão cumprida, o cão parou de ladrar, deixou de haver reactividade". Correcto? Errado. O cão aprendeu, de acordo com as leis do condicionamento operante, que é melhor não reagir do que reagir, já que a reactividade lhe traz más consequências (o castigo positivo e aversivo), e a ausência de reactividade lhe traz consequências melhores (o reforço negativo). Mas, ao mesmo tempo, segundo as leis do condicionamento clássico, esse cão não deixou de ver nos outros cães (ou no estímulo que gera a agressividade) um perigo, um motivo de insegurança; na verdade, ainda gosta menos deles, já que todos os esticões que levou ficaram associados à presença dos outros cães. Em vez de combatermos as razões do comportamento, combatemos os sintomas. A reactividade continua lá, em latência e em potência, até ao dia em que se torna acto. 
Existem duas formas de lidar com esta fase de latência, isto é, a fase em que o cão suprimiu a reactividade, mas continua reactivo em potência: ou (i) o treinador e donos acham que o problema está resolvido, iludidos pela aparente calmaria do seu cão, ou (ii) ambos têm consciência de que este é apenas um estado passageiro e existe ainda um trabalho a fazer. O primeiro dos casos é, sem dúvida, o mais imprudente, o mais desinformado e, sobretudo, o mais perigoso. Eu acho-o até arrogante e ignorante: arrogante, porque assenta na ideia de que um estado tão extremo como a agressividade seja solucionado apenas porque o dono o castigou; ou seja, interpreta-se a agressividade de um cão como um caso de desobediência, para o qual basta mostrar quem manda e mostrar que determinado comportamento não é aceite pelo dono. Ignorante, porque desconhece a forma como, para além do mundo dos castigos e recompensas (condicionamento operante) existe todo um conjunto de leis de comportamento que obedecem a associações criadas entre certas situações contíguas; numa palavra, ignora o que seja o condicionamento clássico. Duas vezes ignorante, até, porque não é capaz de ver, nos sinais oferecidos pelo cão, que ele continua intranquilo e tenso, apesar de já não reagir com agressividade. O segundo caso é mais cauteloso, mais técnico, e mais consciente das consequências e do modo como um cão não se limita a aprender com castigos e consequências. O primeiro caso tem sido muito explorado para efeitos de espectacularidade mediática, pois funciona muito bem, em termos de audiência, apresentar um cão que deixou de agir agressivamente como consequência da imposição de liderança do dono. E como a televisão não capta o estado interno de latência da agressividade, fica a impressão de case solved. O segundo caso é o da maioria dos treinadores profissionais, tanto aqueles que cairiam na gaveta do treino tradicional quanto aqueles a quem se convencionou denominar "balanceados" ou, como eu prefiro chamar, treinadores do meio termo. Claro que, entre uns e outros (entre aqueles que param o trabalho quando o cão deixa de aparentar agressividade, e aqueles que sabem que existe uma segunda metade do trabalho), eu prefiro os do "segundo caso", não por uma questão de maior ou menor violência (aliás, muitos dos treinadores que encaixariam neste segundo caso usam formas bem mais violentas do que aquelas que se usam em televisão), mas porque têm uma noção mais realista da forma como o comportamento de um cão evolui. 
Em relação à segunda forma de lidar com o referido período de latência, uma palavra. Eu admito que haja casos em que, durante este período de latência, seja possível ir combatendo essa reactividade "adormecida" até ao ponto em que ela possa vir a desaparecer. De facto, um cão que, embora continue desconfiado de outros cães, aprendeu a não reagir, ele poderá ir convivendo com outros cães até poder, eventualmente, perder as razões internas da sua reactividade, isto é, perder o medo aos outros cães. Certo. E qual vai ser a forma que vai ser usada para trabalhar neste período de latência? Certamente, um trabalho de condicionamento clássico, ou seja, de associações positivas feitas aos outros cães com os quais irá relacionar-se durante este período de latência. Tais associações poderão ser feitas de forma activa, com o dono/treinador a alimentarem o cão na presença próxima de outros cães, ou promovendo outras actividades de que o cão goste mas que não impliquem nenhum grau de excitação incontrolada; ou poderão ser feitas de forma passiva, simplesmente esperando que a convivência entre os cães faça o trabalho por si. Eu, da minha parte, prefiro que haja trabalho activo, até porque a segunda (a associação passiva) acaba por surgir de qualquer forma. 
Mas agora pergunto: se se vai fazer um trabalho de condicionamento positivo relativo à presença de outros cães (ou, claro, do estímulo que provoque a reacção, seja ele qual for), por que razão fazê-lo neste período de latência proporcionado por um trabalho prévio de castigo positivo e aversivo? Por que razão não o fazer desde logo, antes e em vez de qualquer tipo de aversão? Se fizermos o trabalho de condicionamento clássico depois de um trabalho de castigo aversivo que induza o cão a restringir ou suprimir a reactividade, esse trabalho de condicionamento clássico vai ser redobrado; é que, enquanto o treinador castiga o comportamento reactivo agressivo, como vimos, está também a condicionar o cão de modo a que este associe o castigo à presença dos outros cães. Ora, o trabalho de condicionamento clássico que se segue vai ter de lidar não só com um cão que é reactivo com outros cães, como também com um cão que associou uma série de esticões de trela (ou choques, ou dedadas em forma de mandíbula, ou toques de calcanhar...) à presença de outros cães. Era tão mais fácil, rápido e seguro se o trabalho de condicionamento clássico começasse antes de tudo, não era? O curioso é que as técnicas do método centrado no reforço positivo é que são conhecidas por serem lentas e por complicarem o que é simples...

terceiro passo para desmistificar o mito de que o uso de comida não serve para tratar de casos de agressividade é, portanto, o seguinte: compreender que, de uma forma ou de outra, para se "reabilitar" um cão com problemas de agressividade ter-se-á de fazer um intenso trabalho de condicionamento clássico, de forma a associar o estímulo que gera a agressividade (outros cães, pessoas, etc.) com coisas positivas e seguras. Como, dê por onde der, vai ter de ser feito esse trabalho de condicionamento clássico, por que não fazê-lo desde logo? É mais tortuoso, lento, arriscado e frustrante começar por castigar o cão até o comportamento de agressividade ser colocado em hiato ou latência; e é mais directo, rápido, seguro e motivante começar imediatamente pelo trabalho de condicionamento clássicoPara isso, é boa ideia começar com uma distância de segurança, em vez de expor o cão a uma proximidade que ainda não é capaz de tolerar. 



Sem comentários:

Enviar um comentário