jueves, 5 de septiembre de 2013

Timing, esencial para un correcto aprendizaje

La palabra timing es un anglicismo que traducido literalmente significa "temporizado". Actualmente se ha convertido en un vocablo bastante utilizado en el mundo del adiestramiento canino para referirnos al momento preciso en el que hay que aplicar un refuerzo.

Hay que tener en cuenta que perros y humanos hablamos lenguajes muy distintos y si queremos enseñar algo a nuestros perros es esencial que le "expliquemos" con la mayor claridad posible lo que deseamos de él. En este proceso entran en juego como elementos fundamentales los refuerzos y el timing, el momento en el que aplicamos el refuerzo.

En la teoría es un concepto muy sencillo pero en la práctica es uno de los elementos que más dificultad entraña para los principiantes.

Lo más importante para conseguir un buen timing es tener claro el objetivo que se persigue antes de comenzar la sesión de adiestramiento. No hay que aplicar el mismo timing cuando estamos enseñando un nuevo ejercicio que si estamos perfeccionando uno que el perro ya conoce.

Pongamos un ejemplo. Si estamos enseñando a nuestro perro a tumbarse el timing correcto sería aplicar el refuerzo en cuando el perro tiene el cuerpo apoyado en el suelo. En esta fase no nos importa que el perro haya tardado en tumbarse o que la postura no sea todo lo estética que nos gustaría. Estamos ensenando por lo tanto lo que necesitamos que el perro entienda es que cada vez que se tumbe recibirá un premio. Ahora digamos que queremos perfeccionar el ejercicio, nuestro perro ya sabe tumbarse y queremos comenzar a trabajar la duración del ejercicio, es decir, que se mantenga tumbado hasta que se le libere. Para ello nuestro timing habrá de cambiar, el refuerzo tardará unos segundos en aparecer, siempre y cuando el perro haya mantenido la postura. Es importante señalar que el intervalo de presentación entre la ejecución de la conducta y la aparición del refuerzo ha de ir aumentando de forma progresiva y muy poco a poco, si no el perro no va ha entender que es lo que se espera de él.

El timing es siempre importante pero cobra especial relevancia cuando trabajamos el moldeado libre o free shaping ya que con este tipo de trabajo se captura literalmente la conducta que queramos que aprenda el perro. Con esta técnica yo recomiendo fervientemente utilizar un marcador como el clicker, ya que esto nos facilitará mucho el manejo del timig. En el free shaping si no hay un buen timing es imposible que se produzca aprendizaje. Puedes encontrar más información sobre esta técnica en el siguiente artículo "Guiado, Targeting y moldeado libre. Ventajas e inconvenientes."

El Condicionamiento Operante o Instrumental

Actualmente se utilizan de forma indistinta los términos Condicionamiento Instrumental y Condicionamiento Operante y se refieren exactamente a lo mismo, el primer término fue acuñado por Edward Thorndije y el segundo por B.F. Skinner. En estas líneas se utilizaran ambos términos de forma indistinta.

En el Condicionamiento Opertante se basan todos los sistemas de adiestramiento, las grandes diferencias entre ellos radican en los paradigmas y principios aplicados en cada uno de ellos.

La premisa fundamental en la que se basa el Condicionamiento Operante es que la probabilidad de que una determinada conducta se presente depende de las consecuencias que dicha conducta tiene para el individuo. Las consecuencia positivas (refuerzo positivo) aumentan las probabilidades de aparición de una conducta determinada, del mismo modo, las consecuencia negativa (refuerzo negativo) disminuyen la probabilidad de que dicha conducta se repita en el el futuro. Como puede observarse el refuerzo es un factor fundamental en el proceso de aprendizaje, por lo tanto es posible ejercer control sobre la conducta de un individuo a través de los distintos reforzadores.

Existen dos tipo de reforzados que podríamos clasificar de la siguiente manera:
  • Reforzadores Primarios: Satisfacen alguna necesidad biológica y es independiente de la experiencia del individuo.
  • Reforzadores Secundarios: Es un estímulo que funciona como reforzador por estar asociado a la aparición de un refuerzo primario.
El aprendizaje a través de este tipo de condicionamiento se basa en una triple relación de contingencia: la ocasión en la que ocurre una respuesta, la respuesta en si y las consecuencia de dicha respuesta. Aquí entra en juego otro factor importante en cualquier tipo de adiestramiento, el Timing. Sin un buen timing no se puede establecer la relación que acabamos de mencionar. Puedes encontrar más información en el siguiente artículo: "El timing, esencial para un correcto aprendizaje"

Dentro del Condicionamiento Operante hay que distinguir varias etapas:

Adquisición
Este término se refiere al condicionamiento en sí. La fase en la que el sujeto aprende que ejecutar una conducta concreta le reporta un refuerzo positivo, ya sea primario o secundario. La rapidez con que un animal se condiciona depende de varios factores:

  • La probabilidad de que la conducta sea reforzada.
  • El tiempo transcurrido desde que se produce la respuesta hasta que recibe el refuerzo.
  • El número de refuerzos.
  • El estado de motivación del sujeto.
Generalización
Este concepto se refiere a la capacidad del organismo de presentar una respuesta ante estímulos de la misma dimensión.

La generalización puede darse tanto del lado del estímulo como del lado de la respuesta.

Discriminación
Consiste en responder de forma diferente a situaciones similares. Esto suelo ocurrir cuando el aprendizaje esta bien asentado, aunque hay que tener en cuenta que este proceso fortalece una respuesta y debilita la otra.

Extinción
La extinción es la desaparición de una conducta. Normalmente ocurre cuando se retira el refuerzo. Hay que tener en cuenta que este proceso no se da automáticamente con la primera desaparición del refuerzo, en este proceso también entra el juego otro concepto la resistencia a la extinción. Este concepto podemos definirlo como la tendencia del animal a emitir la respuesta después de que se haya suspendido el reforzamiento.

Otro concepto fundamental del condicionamiento instrumental que es básico en la aplicación práctica es el de expectativa de las consecuencias, es decir que los organismos anticipan las consecuencias de su conducta, ya sean positivas o negativas y esto sirve de motivación para realizar una conducta. El organismo conoce o anticipa que su respuesta producirá un determinado resultado.

Otro término importante es el de Estímulo Discriminativo. Este estímulo es aquel que precede a la conducta y que controla dicha conducta proporcionando la ocasión de realizar una respuesta específica pero no la provoca.

Programas de Reforzamiento

Un programa de reforzamiento es una patrón de recompensa que mantiene las respuesta condicionadas. Existen dos tipos de programas de reforzamiento:

  • Programa Continuo: Todas las veces que el animal presenta la respuesta recibe refuerzo.
  • Programa Intermitente: La respuesta recibe refuerzo unas veces si y otra no.

Cada programa es útil para cada fase del aprendizaje. Una respuesta se aprende con mayor rapidez si se refuerzan todas las respuestas correctas, sin embargo el reforzamiento intermitente es muy útil para mantener las destrezas bien establecidas y aumentan la resistencia a la extinción.

Dentro de los programas de reforzamiento intermitente hay cuatro tipos básicos de programas:
  • Intervalo fijo: Las recompensas se dan en un intervalo de tiempo establecido. La tasa de respuesta se incrementa cuando se acerca el momento del reforzamiento ya que es completamente predecible.
  • Intervalo variable: Aquí el sujeto no puede predecir cuando va a recibir el refuerzo ya que no hay una pauta establecida. La tasa de respuesta es más lenta pero más estable y el sujeto tenderá a mantener la conducta independientemente de lo que tarde en recibir el refuerzo.
  • Razón fija: El refuerzo aparece después de que el sujeto haya realizado la conducta deseada un número determinado de veces.
  • Razón variable: La conducta será reforzada cuando se haya presentado un número variable de veces (1,3,2,7...). Este programa produce una conducta mucho más estable y se mantiene con la misma intensidad hasta la aparición del reforzador.
La resistencia a la extinción esta íntimamente relacionada con el programa de reforzamiento que se haya seguido. Las conductas reforzadas con patrones variable son más resistentes a la extinción.

Dentro del condicionamiento instrumental hay que destacar otro concepto relevante para el adiestramiento: el encadenamiento. Este concepto es el que explica como se adquieren las conductas complejas aprendidas. El encadenamiento consiste en una serie de respuestas enlazadas de tal manera que los estímulos discriminativos de una respuesta son los reforzadores de la anterior. Las conductas complejas se dividen en unidades de conducta y cada una de estas unidades contiene tres elementos: un estímulo discriminativo, una respuesta y una consecuencia. Estas unidades de conducta han de estar correctamente enlazadas para formar la conducta compleja. La idea de encadenamiento es que las conductas complejas no se aprenden de una vez, si no que hay que aprenderlas de forma paulatina, paso a paso, por aproximaciones sucesivas. Reforzar cada aproximación a la meta es crucial para el encadenamiento.

Paradigma de recompensa

En este paradigma no suele haber estímulo discriminativo y una conducta siempre es seguida de un reforzador positivo. En este paradigma la contingencia entre la respuesta y el reforzador es muy importante. Cuanto más corto es el intervalo entre la conducta y la aparición del refuerzo más fácil es el aprendizaje.

La calidad o magnitud del reforzador también es un elemento importante en el aprendizaje. Cuanto más satisfactorio sea el refuerzo para el sujeto más rápido será el aprendizaje.

El nivel de impulso es otro factor que influye de forma determinante en el proceso de aprendizaje. Este concepto esta íntimamente ligado a la motivación. A mayor motivación mayor nivel de impulso y por lo tanto mayor tasa de aprendizaje.

Paradigma de escape

En este paradigma la situación es inversa al paradigma de recompensa. Ante un estímulo aversivo presente en el ambiente el sujeto ha de realizar una conducta para que este desaparezca. Normalmente no existe estímulo discriminativo, el organismo ha de actuar sobre algo que ya esta presente en el medio para librarse de ello.

Dentro de este paradigma también existen elementos importantes a tener en cuenta. Cuanto más intenso es el reforzador negativo más rápidamente se adquiere la respuesta, cuanto mayor es la reducción del estímulo aversivo mejor ejecución y cuanto menor sea la demora entre la ejecución de la respuesta y la desaparición del estímulo aversivo mejor es la ejecución.

Paradigma de evitación

En este paradigma la conducta del animal trae como consecuencia la no aparición de un estímulo aversivo. En este paradigma es necesario la presencia de un estímulo discriminativo que indique al animal que de no aparecer la conducta deseada, aparecerá el estímulo aversivo. Al principio dicho estímulo discriminativo es un estímulo neutro y se convertirá en estímulo discriminativo una vez que se ha producido la asociación con el estímulo aversivo.

Al igual que en los paradigmas anteriores hay factores que influyen en el aprendizaje. La intensidad del estímulo incondicionado: si la intensidad es demasiado alta la adquisición de la respuesta de evitación se retrasa ya que aparecen respuestas competitivas que perturban el aprendizaje, el animal recurre a cualquier respuesta en un intento de hacer desaparecer el estímulo aversivo. Los niveles bajos de estímulo aversivo al comienzo del condicionamiento mejoran el aprendizaje.

A medida que se incrementa el intervalo de presentación entre el estímulo condicionado y el estímulo incondicionado la tasa de adquisición de la respuesta de evitación mejora.
Otro facto importante es el intervalo entre ensayos.No existe una duración de tiempo determinado entre los intervalos optimo, si no que este valor depende de la especie.

El aprendizaje previo es otra cuestión importante, si el animal ya ha sido sometido a situaciones en las que la conducta de escape ha sido efectiva es más sencillo que adquiera la conducta de evitación.

Dentro del paradigma de evitación hay un concepto de suma importancia la indefensión aprendida. Este concepto se refiere a un estado de desmotivación y desmoralización debido a que ningún tipo de conducta realizada hace desaparecer el estímulo aversivo. Cuando un animal entra en este estado es imposible que se produzca aprendizaje ya que el animal pierde todo tipo de iniciativa y la única conducta que es capaz de desarrollar es esperar a que desaparezca el estímulo aversivo.

Paradigma de castigo

El castigo es un procedimiento operante que disminuye la probabilidad de ocurrencia de una respuesta.

Existen dos tipo de castigo, el positivo o el negativo. El castigo positivo consiste en la aplicación de un estímulo aversivo que debilita o elimina una conducta. El castigo negativo es la retirada de un estímulo positivo cuando aparece la conducta que se desea eliminar.

Hay seis variable muy importantes que influyen en la eficacia del castigo, las dos primeras solo son aplicables al castigo positivo.

  1. Modo de presentación: la presentación súbita o repentina del castigo ante una respuesta que se desea erradicar produce una mayor reducción de la misma.
  2. Intensidad del castigo: cuanto mayor es la intensidad del estímulo aversivo mayor es su eficacia.
  3. Inmediatez del castigo: para que un castigo sea eficaz es necesario aplicarlo inmediatamente cuando aparece la respuesta que se desea erradicar.
  4. Duración del castigo: cuanto más tiempo dura el castigo mayor es la tasa de supresión de la conducta.
  5. Constancia: para que el castigo sea eficaz hay que aplicarlo siempre que aparezca la conducta indeseada si no pierde todo su poder como herramienta de modificación de conducta.
  6. Reforzamiento de conductas incompatibles: se enseña al animal a sustituir la conducta indeseada por otra conducta alternativa, de esta manera no se castiga la conducta indeseada si no que se ofrece una alternativa y cuando el animal ejecuta esa conducta alternativa recibe un refuerzo positivo. La modificación de conducta es más rápida y menos traumática.
Hay que tener muy en cuenta que el castigo produce fuertes respuestas emocionales en los animales y es fundamental usarlo con cautela y precisión.

Los perros adquieren condicionamientos con bastante rapidez y les son muy útiles para anticipar que se espera de ello.

El Clicker ¿Sistema o Herramienta de Adiestramiento?

El Clicker no es un sistemas de adiestramiento, únicamente es una herramienta utilizada en el adiestramiento. 

Es cierto que , coloquiálmente, cuando se utiliza el término adiestramiento con clicker nos estamos refiriendo a toda una filosofía y una forma de entender al perro, algo mucho más profundo que la herramienta en si. De hecho se puede realizar el mismo tipo de adiestramiento con cualquier otro marcardor, la voz, un juguete que pita, la voz.... 

Imaginemos que nuestro perro es sordo, evidentemente el clicker no sería la herramienta más apropiada, pero podríamos realizar exactamente el mismo trabajo utilizando un marcador luminoso. esta claro que el trabajo será algo más complejo ya que el perro habrá de ver la señal luminosa justo en el momento en el que ejecuta la conducta que queremos capturar. Otra opción sería utilizar un collar con un sistema de vibración como el del móvil, de esta manera el trabajo sería mucho más sencillo. La filosofía sería la misma utilizando distintas herramientas.

Los principios en los que se sustenta en adiestramiento con clicker (o cualquier otro marcador) son los mismos que en los que se basa el adiestramiento canino en general: los paradigmas del condicionamiento Instrumental u Operante. El supuesto principal de este tipo de condicionamiento es que un animal asocia mecánicamente una actividad con sus resultados, ya sean estos positivos o negativos. La diferencia radica en que el adiestramiento con clicker se sustenta en reforzar las conductas que deseamos que se repitan e ignorar o contracondicionar las conductas o comportamientos que deseamos que desaparezcan.

Cualquier conducta que en una situación produce un efecto satisfactorio, se hará más probable en el futuro

Podríamos decir que  esta cita de Thorndike es la máxima en la que se sustenta en adiestramiento con clicker. 

No olvidemos que el clicker en si no es positivo ni negativo, es un refuerzo condicional secundario, es decir, un marcador que indica que va a aparecer un refuerzo primario determinado. Evidentemente el clicker siempre lo asociamos a un refuerzo positivo y su sonido indica al perro que la conducta ofrecida tendrá recompensa.

En estas lineas no profundizaremos sobre el condicionamiento operante, pero puedes obtener más información en este artículo "Condicionamiento Instrumental u Operante".

Creo esencial hacer hincapié en que el "timing" es de vital importancia para un correcto aprendizaje utilizando marcadores, en el siguiente artículo puede encontrar más información al respecto "El timing, esencial para un correcto aprendizaje"

La importancia del Juego

El juego es un elemento fundamental para mantener a nuestro perro sano tanto física como psicológicamente. Es importante señalar que el perro es un animal social y el juego es un pilar esencial para establecer relaciones sociales, tanto con sus congéneres como con las personas.

No a todos los perros les gusta jugar de la misma manera, unos son felices corriendo detrás de una pelota mientras otros prefieren discutir contigo un mordedor. El juego es una poderosa herramienta de aprendizaje, no la subestimemos y aprovechemos todo lo que puede ofrecer.

La conducta de juego aparece a una edad muy temprana, prácticamente cuando los cachorros comienzan a moverse. Los primeros juegos consisten en pequeñas luchas y revolcones por el suelo ya que su movilidad aún es muy limitada. Estos primeros juegos tienen una gran importancia ya que estimula la psicomotricidad de los cachorros.




A medida que los cachorros van creciendo los juegos también aumentan en intensidad y comienzan a aparecer las primeras lecciones importantes, como el control en la fuerza de la mordida, a pedir juego de la forma correcta o el respeto a  los momentos de descanso.

El juego no solo es importante durante la fase de cachorro si no a lo largo de toda su vida ya que es mediante el juego como nuestro perro quema el exceso de energía, evidentemente esta necesidad va decreciendo con el paso de los años pero, normalmente, nunca llega a desaparecer por completo.

Es cierto que hay perros con más predisposiciòn a jugar que otros. Esta predisposiciòn también esta influida por la estimulación ambiental durante la crianza, es fundamental jugar con el cachorro y que el cachorro juegue con otros perros.

El juego también es una poderosa herramienta para el adiestramiento, el adiestramiento basado en el juego es divertido y exige mucha concentración ya que trabajamos con niveles de motivaciòn muy altos pero también conseguimos una gran implicación por parte del perro así como una comprensión profunda de los ejercicios y un gran nivel de autocontrol.

Existen gran variedad de juegos que podemos practicar con nuestros compañeros que podemos agrupar de la siguiente forma.
  • Juegos de olfato.
  • Juegos de lucha.
  • Juegos de estimulación mental.
  • Juegos de agilidad.
Elegir el tipo de juego que mejor se adapte a las necesidades físicas y psicológicas de nuestro compañero es muy importante ya que se trata de disfrutar de la mutua compañia.

No todos los juegos gustan a todos los perros!!!!

Aprendiendo a Aprender

La capacidad de aprendizaje de los perros es algo incuestionable, sin embargo hay que tener en cuenta que la estimulación temprana y los retos mentales pueden multiplicar esa capacidad de forma muy notable ya que la mente, al igual que los músculos del cuerpo, si no se ejercita se atrofia.

Las fases tempranas del desarrollo son cruciales para asentar unas buenas bases para el aprendizaje. Esto no quiere decir que los perros a los que se inicia en el adiestramiento a una edad avanzada no sean capaces de aprender pero si es cierto que es algo más difícil ya que no tienen, por decirlo de alguna manera, "hábitos de estudio".

Evidentemente la capacidad de aprendizaje de un perro también esta influida por su herencia genética pero el entorno también es un elemento fundamental a la hora de desarrollar todo el potencial de nuestro compañero.

En estas líneas nos vamos a centrar básicamente en las ventajas de comenzar el aprendizaje cuando nuestro perro aún es un cachorro. Los cachorros son verdaderas esponjas, son capaces de aprender con una facilidad pasmosa y, lo que es todavía mejor, están deseando hacerlo. Esto puede convertirse en un arma de doble filo ya que aprenden con la misma rapidez lo que no queremos que aprendan.
No permitas al cachorro lo que no deseas en el perro adulto
Otra cosa que creo importante destacar y que hay que tener en cuenta es que su nivel de concentración es muy alto pero que dura pocos minutos por lo tanto es muy importante que las sesiones de aprendizaje sean cortas. No nos interesa que el cachorro se aburra, si no todo lo contrario, que se quede con ganas de que llegue la siguiente sesión, de esta manera conseguiremos un perro que este deseando aprender.

La edad ideal para empezar a enseñar a un cachorros son los dos meses de edad. Comenzar a una edad tan temprana tiene importantes ventajas.
  • Aprovechamos su predisposición al aprendizaje haciendo que el proceso sea rápido y divertido.
  • El cachorro no tiene vicios que corregir.
  • Estrecha el vínculo entre el perro y el propietario.
  • Conseguiremos un perro adulto al que le gusta aprender cosas nuevas y lo hará de forma más rápida.
Todo el proceso de aprendizaje tiene que ser divertido y basado en el estímulo positivo y el juego, en fomentar las ganas de nuestro cachorro por aprender nuevas cosas y, lo más importante, las sesiones deben ser divertidas y estimulantes.

A continuación os dejo un vídeo de una sesión de un cachorro de dos meses y medio.


Lo más leido

Con la tecnología de Blogger.

Archivo del blog

Buscar este blog

Traducir