jueves, 5 de septiembre de 2013

El Condicionamiento Operante o Instrumental

Actualmente se utilizan de forma indistinta los términos Condicionamiento Instrumental y Condicionamiento Operante y se refieren exactamente a lo mismo, el primer término fue acuñado por Edward Thorndije y el segundo por B.F. Skinner. En estas líneas se utilizaran ambos términos de forma indistinta.

En el Condicionamiento Opertante se basan todos los sistemas de adiestramiento, las grandes diferencias entre ellos radican en los paradigmas y principios aplicados en cada uno de ellos.

La premisa fundamental en la que se basa el Condicionamiento Operante es que la probabilidad de que una determinada conducta se presente depende de las consecuencias que dicha conducta tiene para el individuo. Las consecuencia positivas (refuerzo positivo) aumentan las probabilidades de aparición de una conducta determinada, del mismo modo, las consecuencia negativa (refuerzo negativo) disminuyen la probabilidad de que dicha conducta se repita en el el futuro. Como puede observarse el refuerzo es un factor fundamental en el proceso de aprendizaje, por lo tanto es posible ejercer control sobre la conducta de un individuo a través de los distintos reforzadores.

Existen dos tipo de reforzados que podríamos clasificar de la siguiente manera:
  • Reforzadores Primarios: Satisfacen alguna necesidad biológica y es independiente de la experiencia del individuo.
  • Reforzadores Secundarios: Es un estímulo que funciona como reforzador por estar asociado a la aparición de un refuerzo primario.
El aprendizaje a través de este tipo de condicionamiento se basa en una triple relación de contingencia: la ocasión en la que ocurre una respuesta, la respuesta en si y las consecuencia de dicha respuesta. Aquí entra en juego otro factor importante en cualquier tipo de adiestramiento, el Timing. Sin un buen timing no se puede establecer la relación que acabamos de mencionar. Puedes encontrar más información en el siguiente artículo: "El timing, esencial para un correcto aprendizaje"

Dentro del Condicionamiento Operante hay que distinguir varias etapas:

Adquisición
Este término se refiere al condicionamiento en sí. La fase en la que el sujeto aprende que ejecutar una conducta concreta le reporta un refuerzo positivo, ya sea primario o secundario. La rapidez con que un animal se condiciona depende de varios factores:

  • La probabilidad de que la conducta sea reforzada.
  • El tiempo transcurrido desde que se produce la respuesta hasta que recibe el refuerzo.
  • El número de refuerzos.
  • El estado de motivación del sujeto.
Generalización
Este concepto se refiere a la capacidad del organismo de presentar una respuesta ante estímulos de la misma dimensión.

La generalización puede darse tanto del lado del estímulo como del lado de la respuesta.

Discriminación
Consiste en responder de forma diferente a situaciones similares. Esto suelo ocurrir cuando el aprendizaje esta bien asentado, aunque hay que tener en cuenta que este proceso fortalece una respuesta y debilita la otra.

Extinción
La extinción es la desaparición de una conducta. Normalmente ocurre cuando se retira el refuerzo. Hay que tener en cuenta que este proceso no se da automáticamente con la primera desaparición del refuerzo, en este proceso también entra el juego otro concepto la resistencia a la extinción. Este concepto podemos definirlo como la tendencia del animal a emitir la respuesta después de que se haya suspendido el reforzamiento.

Otro concepto fundamental del condicionamiento instrumental que es básico en la aplicación práctica es el de expectativa de las consecuencias, es decir que los organismos anticipan las consecuencias de su conducta, ya sean positivas o negativas y esto sirve de motivación para realizar una conducta. El organismo conoce o anticipa que su respuesta producirá un determinado resultado.

Otro término importante es el de Estímulo Discriminativo. Este estímulo es aquel que precede a la conducta y que controla dicha conducta proporcionando la ocasión de realizar una respuesta específica pero no la provoca.

Programas de Reforzamiento

Un programa de reforzamiento es una patrón de recompensa que mantiene las respuesta condicionadas. Existen dos tipos de programas de reforzamiento:

  • Programa Continuo: Todas las veces que el animal presenta la respuesta recibe refuerzo.
  • Programa Intermitente: La respuesta recibe refuerzo unas veces si y otra no.

Cada programa es útil para cada fase del aprendizaje. Una respuesta se aprende con mayor rapidez si se refuerzan todas las respuestas correctas, sin embargo el reforzamiento intermitente es muy útil para mantener las destrezas bien establecidas y aumentan la resistencia a la extinción.

Dentro de los programas de reforzamiento intermitente hay cuatro tipos básicos de programas:
  • Intervalo fijo: Las recompensas se dan en un intervalo de tiempo establecido. La tasa de respuesta se incrementa cuando se acerca el momento del reforzamiento ya que es completamente predecible.
  • Intervalo variable: Aquí el sujeto no puede predecir cuando va a recibir el refuerzo ya que no hay una pauta establecida. La tasa de respuesta es más lenta pero más estable y el sujeto tenderá a mantener la conducta independientemente de lo que tarde en recibir el refuerzo.
  • Razón fija: El refuerzo aparece después de que el sujeto haya realizado la conducta deseada un número determinado de veces.
  • Razón variable: La conducta será reforzada cuando se haya presentado un número variable de veces (1,3,2,7...). Este programa produce una conducta mucho más estable y se mantiene con la misma intensidad hasta la aparición del reforzador.
La resistencia a la extinción esta íntimamente relacionada con el programa de reforzamiento que se haya seguido. Las conductas reforzadas con patrones variable son más resistentes a la extinción.

Dentro del condicionamiento instrumental hay que destacar otro concepto relevante para el adiestramiento: el encadenamiento. Este concepto es el que explica como se adquieren las conductas complejas aprendidas. El encadenamiento consiste en una serie de respuestas enlazadas de tal manera que los estímulos discriminativos de una respuesta son los reforzadores de la anterior. Las conductas complejas se dividen en unidades de conducta y cada una de estas unidades contiene tres elementos: un estímulo discriminativo, una respuesta y una consecuencia. Estas unidades de conducta han de estar correctamente enlazadas para formar la conducta compleja. La idea de encadenamiento es que las conductas complejas no se aprenden de una vez, si no que hay que aprenderlas de forma paulatina, paso a paso, por aproximaciones sucesivas. Reforzar cada aproximación a la meta es crucial para el encadenamiento.

Paradigma de recompensa

En este paradigma no suele haber estímulo discriminativo y una conducta siempre es seguida de un reforzador positivo. En este paradigma la contingencia entre la respuesta y el reforzador es muy importante. Cuanto más corto es el intervalo entre la conducta y la aparición del refuerzo más fácil es el aprendizaje.

La calidad o magnitud del reforzador también es un elemento importante en el aprendizaje. Cuanto más satisfactorio sea el refuerzo para el sujeto más rápido será el aprendizaje.

El nivel de impulso es otro factor que influye de forma determinante en el proceso de aprendizaje. Este concepto esta íntimamente ligado a la motivación. A mayor motivación mayor nivel de impulso y por lo tanto mayor tasa de aprendizaje.

Paradigma de escape

En este paradigma la situación es inversa al paradigma de recompensa. Ante un estímulo aversivo presente en el ambiente el sujeto ha de realizar una conducta para que este desaparezca. Normalmente no existe estímulo discriminativo, el organismo ha de actuar sobre algo que ya esta presente en el medio para librarse de ello.

Dentro de este paradigma también existen elementos importantes a tener en cuenta. Cuanto más intenso es el reforzador negativo más rápidamente se adquiere la respuesta, cuanto mayor es la reducción del estímulo aversivo mejor ejecución y cuanto menor sea la demora entre la ejecución de la respuesta y la desaparición del estímulo aversivo mejor es la ejecución.

Paradigma de evitación

En este paradigma la conducta del animal trae como consecuencia la no aparición de un estímulo aversivo. En este paradigma es necesario la presencia de un estímulo discriminativo que indique al animal que de no aparecer la conducta deseada, aparecerá el estímulo aversivo. Al principio dicho estímulo discriminativo es un estímulo neutro y se convertirá en estímulo discriminativo una vez que se ha producido la asociación con el estímulo aversivo.

Al igual que en los paradigmas anteriores hay factores que influyen en el aprendizaje. La intensidad del estímulo incondicionado: si la intensidad es demasiado alta la adquisición de la respuesta de evitación se retrasa ya que aparecen respuestas competitivas que perturban el aprendizaje, el animal recurre a cualquier respuesta en un intento de hacer desaparecer el estímulo aversivo. Los niveles bajos de estímulo aversivo al comienzo del condicionamiento mejoran el aprendizaje.

A medida que se incrementa el intervalo de presentación entre el estímulo condicionado y el estímulo incondicionado la tasa de adquisición de la respuesta de evitación mejora.
Otro facto importante es el intervalo entre ensayos.No existe una duración de tiempo determinado entre los intervalos optimo, si no que este valor depende de la especie.

El aprendizaje previo es otra cuestión importante, si el animal ya ha sido sometido a situaciones en las que la conducta de escape ha sido efectiva es más sencillo que adquiera la conducta de evitación.

Dentro del paradigma de evitación hay un concepto de suma importancia la indefensión aprendida. Este concepto se refiere a un estado de desmotivación y desmoralización debido a que ningún tipo de conducta realizada hace desaparecer el estímulo aversivo. Cuando un animal entra en este estado es imposible que se produzca aprendizaje ya que el animal pierde todo tipo de iniciativa y la única conducta que es capaz de desarrollar es esperar a que desaparezca el estímulo aversivo.

Paradigma de castigo

El castigo es un procedimiento operante que disminuye la probabilidad de ocurrencia de una respuesta.

Existen dos tipo de castigo, el positivo o el negativo. El castigo positivo consiste en la aplicación de un estímulo aversivo que debilita o elimina una conducta. El castigo negativo es la retirada de un estímulo positivo cuando aparece la conducta que se desea eliminar.

Hay seis variable muy importantes que influyen en la eficacia del castigo, las dos primeras solo son aplicables al castigo positivo.

  1. Modo de presentación: la presentación súbita o repentina del castigo ante una respuesta que se desea erradicar produce una mayor reducción de la misma.
  2. Intensidad del castigo: cuanto mayor es la intensidad del estímulo aversivo mayor es su eficacia.
  3. Inmediatez del castigo: para que un castigo sea eficaz es necesario aplicarlo inmediatamente cuando aparece la respuesta que se desea erradicar.
  4. Duración del castigo: cuanto más tiempo dura el castigo mayor es la tasa de supresión de la conducta.
  5. Constancia: para que el castigo sea eficaz hay que aplicarlo siempre que aparezca la conducta indeseada si no pierde todo su poder como herramienta de modificación de conducta.
  6. Reforzamiento de conductas incompatibles: se enseña al animal a sustituir la conducta indeseada por otra conducta alternativa, de esta manera no se castiga la conducta indeseada si no que se ofrece una alternativa y cuando el animal ejecuta esa conducta alternativa recibe un refuerzo positivo. La modificación de conducta es más rápida y menos traumática.
Hay que tener muy en cuenta que el castigo produce fuertes respuestas emocionales en los animales y es fundamental usarlo con cautela y precisión.

Los perros adquieren condicionamientos con bastante rapidez y les son muy útiles para anticipar que se espera de ello.

0 comentarios:

Lo más leido

Con la tecnología de Blogger.

Archivo del blog

Buscar este blog

Traducir