Una amplia gama de reglas puede gobernar la contingencia entre las
respuestas y el refuerzo; estos diferentes tipos de reglas se
conocen como programas de refuerzo. La mayoría de estos programas de
refuerzo se pueden dividir en aquellos en los que la contingencia
depende del número de respuestas y aquellos en los que depende de su
temporalidad.
Programas de razón.
Si la contingencia entre respuestas y refuerzo depende del número de
respuestas, el programa se llama programa de razón. El programa "clásico",
en el que se entrega un reforzador por cada respuesta, se llama programa
de refuerzo continuo. El programa de refuerzo continuo tiene una razón
de 1. Un programa en el que se deben hacer dos respuestas por cada reforzador
tiene una razón de 2, y así sucesivamente.
También se hace una distinción entre programas en los que debe
hacerse exactamente el mismo número de respuestas para cada
reforzador (programas de razón fija) y aquellos en los que se debe
hacer un número promedio de respuestas para cada reforzador
(programas de razón variable). Dos ejemplos:
1. Un programa en el que se requieren exactamente 20 respuestas por
cada reforzador se llama programa de razón fija 20 o FR20.
2. Un programa en el que, en promedio, se requieren 30 respuestas
por cada reforzador se llama programa de razón variable 30 o VR30.
Programas de intervalo.
Si la contingencia entre respuestas y refuerzo depende del tiempo, el
programa se llama programa de intervalo. En términos sencillos, la primera
respuesta realizada después de un período de tiempo específico es reforzada.
También se hace una distinción entre programas en los que debe pasar
exactamente el mismo tiempo antes de que la respuesta produzca el
refuerzo (programas de intervalo fijo) y aquellos en los que debe
pasar un tiempo promedio antes de que la siguiente respuesta
produzca el refuerzo (programas de intervalo variable). Dos
ejemplos:
1. Un programa en el que la primera respuesta que haga un animal
después de que una luz esté encendida durante 20 segundos se llama
programa de intervalo fijo 20 o FI20. Esto significa que cualquier
respuesta hecha durante esos 20 segundos sería ignorada.
2. Un programa en el que la primera respuesta que haga un animal
después de que una luz esté encendida en promedio durante 25
segundos se llama programa de intervalo variable 25 o VI25.
Estos programas básicos de refuerzo proporcionan tasas predecibles
de respuestas.
Comprender cómo funcionan estos programas puede ser muy útil para
tomar decisiones. Por ejemplo, dejar algo de golpe (ver la línea
rosa en la parte inferior: ¡eso es extinción!) puede ser a veces la
mejor ruta porque un desvanecimiento gradual tiende a mantener el
comportamiento debido a que tendemos a persistir cuando sabemos que
ha dado resultados antes. Pero, como sabemos, esta propiedad es
beneficiosa para aumentar los comportamientos deseados; es como
moldeamos nuevos comportamientos y eventualmente desvanecemos el
refuerzo continuo. Sin embargo, otras veces mantiene comportamientos
no deseados, incluso causando adicción.
Como señaló Schneider (2012), "Las consecuencias siguen un horario,
no cuando queramos" (p. 77). Y la vida real tiende a presentar más
programas de intervalo que de razón.
La espera limitada se puede agregar a un cronograma de intervalo.
Esto significa que una vez que ha pasado el tiempo suficiente para
que el reforzador esté disponible, sólo hay un tiempo finito para
responder. Básicamente, se trata de un “límite de tiempo”. Puedes
imaginar que esto ayuda a “acelerar” un comportamiento.
Existen muchas variaciones de los programas intermitentes definidos
anteriormente. El refuerzo diferencial de las tasas de respuesta
aborda la velocidad con la que las personas realizan ciertos
comportamientos. A veces actuamos demasiado lentamente; otras veces
actuamos con demasiada prisa. Algunos de ustedes pueden responder
apresuradamente a las preguntas en un examen, cometiendo errores
tontos. Otras personas pueden hacer ejercicio, pero no a un ritmo
que favorezca la pérdida de peso. Otras veces, necesitamos
desarrollar "perseverancia", y para esto podemos usar el programa
progresivo. Básicamente, el refuerzo se reduce de forma
independiente al desempeño del aprendiz. Esto funciona siempre que
la tarea no aumente de dificultad demasiado rápido.
Programas Compuestos de Refuerzo
Al igual que con cualquier bloque básico de construcción, estos
programas simples se combinan para formar programas compuestos de
refuerzo. Estamos bajo todos estos programas la mayor parte del
tiempo.
Programas Concurrentes.
Aquí, el refuerzo ocurre cuando (a) dos o más contingencias de refuerzo
(b) operan de manera independiente y simultánea (c) para dos o más comportamientos.
Esto se demuestra fácilmente en el entorno natural: una elección. Estamos
en un programa concurrente para hacer lo correcto o lo incorrecto. Estamos
en un programa concurrente para revisar Facebook o escribir nuestra publicación
de discusión.
Programas Múltiples.
Aquí, el refuerzo ocurre en una secuencia alternante, generalmente aleatoria,
y puede identificarse mediante el estímulo discriminativo. Esto se demuestra
fácilmente en el entorno natural: tendemos a responder en presencia de
ciertos estímulos, pero no de otros. Consideremos el uso de palabras
malsonantes. Cuando visitamos a la abuela, podemos abstenernos de decir
palabrotas porque, típicamente, no se refuerza en esta situación. Sin
embargo, cuando estamos con amigos, es posible que nuestro lenguaje apropiado
se deteriore.
Programas Encadenados.
Muy similares a los programas múltiples, el programa encadenado es una
secuencia que depende de un estímulo discriminativo; sin embargo, el
orden no es aleatorio, siempre es el mismo. Cuando aprendas sobre las
cadenas de comportamiento en el próximo curso (es posible que ya tengas
un conocimiento práctico del encadenamiento), todo tendrá sentido. Pero
un ejemplo común es atarse los zapatos.
Ley de Correspondencia.
Volvamos a los programas concurrentes, ya que hay un número infinito
de estos programas disponibles en cualquier momento dado en el entorno.
Si recuerdas, mencionamos que los programas concurrentes podrían equipararse
a la "elección". Al equiparar "elección" con "preferencia", tomamos un
constructo subjetivo (preferencia) y permitimos que se represente mediante
un comportamiento observable (elección).
¿Cómo hacemos esto? Calculando las respuestas relacionadas con las
opciones disponibles.
“Simplemente registrando cómo un cliente distribuye sus respuestas,
podemos identificar la preferencia” (Reed & Kaplan, 2011, p. 15).
Como habrás leído en Reed y Kaplan (2011), Herrnstein conceptualizó
la ley de correspondencia al descubrir una correlación casi perfecta
entre refuerzo y comportamiento. Puedes verlo en la página 16 del
artículo. Por supuesto, el entorno natural rara vez (si es que
alguna vez) ofrecerá exactamente dos programas concurrentes con la
misma calidad. Por lo tanto, en la aplicación, la ley de
correspondencia tuvo que ampliarse. Neef, Mace, Shea y Shade (1992)
descubrieron que la preferencia está influida por algo más que la
tasa de refuerzo. Resulta que hay varias dimensiones de un
reforzador: tasa, calidad, demora y esfuerzo. Aplicado al entorno
natural, Reed y Kaplan resumieron que los profesionales deberían:
“…hacer que sea menos esforzado para el aprendiz obtener altas tasas
de recompensas de alta calidad disponibles de inmediato por el
comportamiento deseado, en comparación con aquellas asociadas con
comportamientos indeseados” (p. 18).
Comprender el contexto de las contingencias regidas por la ley de
correspondencia permite que los procedimientos de refuerzo
diferencial sean efectivos, ¡sin tener que extinguir el
comportamiento inapropiado!
Podemos ver cómo la ley de correspondencia, considerando la tasa, la
calidad, la demora y el esfuerzo, afecta nuestra vida cotidiana.
Pensemos en empresas que lo han logrado, como Amazon. Es posible que
tengas un gran monto de reforzadores condicionados generalizados en
tu bolsillo, listo para comprar algo que viste anunciado en línea y
que deseas. ¿Vas a ir al sitio web de esa empresa, crear un usuario,
ingresar tu número de tarjeta de crédito, y así sucesivamente? ¿O
verificarás rápidamente si Amazon tiene el mismo artículo? Porque
con Amazon, obtienes refuerzo inmediato (¡pedido realizado!), el
mismo artículo está disponible, la demora es mínima (especialmente
si tienes Prime), y el esfuerzo es tan fácil (en algunas ocasiones)
como “un clic”. A veces, incluso estamos dispuestos a pagar un poco
más por el menor esfuerzo. Brillante.