El condicionamiento operante, a veces denominado condicionamiento instrumental, es un método de aprendizaje que emplea recompensas y castigos por el comportamiento. A través del condicionamiento operante, se realiza una asociación entre un comportamiento y una consecuencia (ya sea negativa o positiva) de ese comportamiento.
Por ejemplo, cuando las ratas de laboratorio presionan una palanca cuando hay una luz verde encendida, reciben una bolita de comida como recompensa. Cuando presionan la palanca cuando hay una luz roja encendida, reciben una leve descarga eléctrica. Como resultado, aprenden a presionar la palanca cuando la luz verde está encendida y evitar la luz roja.
Pero el condicionamiento operante no es solo algo que tiene lugar en entornos experimentales mientras se entrenan animales de laboratorio. También juega un papel importante en el aprendizaje diario. El refuerzo y el castigo tienen lugar en entornos naturales todo el tiempo, así como en entornos más estructurados, como aulas o sesiones de terapia.
La historia del condicionamiento operante
El condicionamiento operante fue descrito por primera vez por el conductista BF Skinner, razón por la cual es posible que de vez en cuando se le llame condicionamiento skinneriano. Como conductista, Skinner creía que no era realmente necesario observar los pensamientos y motivaciones internas para explicar el comportamiento. En cambio, sugirió, deberíamos mirar solo las causas externas y observables del comportamiento humano.
Durante la primera parte del siglo XX, el conductismo se convirtió en una fuerza importante dentro de la psicología. Las ideas de John B. Watson dominaron esta escuela de pensamiento desde el principio. Watson se centró en los principios del condicionamiento clásico, una vez que sugirió que podía tomar a cualquier persona, independientemente de su origen, y entrenarla para que fuera lo que él eligiera.
Los primeros conductistas centraron sus intereses en el aprendizaje asociativo. Skinner estaba más interesado en cómo el Consecuencias de las acciones de las personas influyeron en su comportamiento.
Skinner usó el término operante para referirse a cualquier «comportamiento activo que opera sobre el medio ambiente para generar consecuencias». La teoría de Skinner explicaba cómo adquirimos la gama de conductas aprendidas que exhibimos todos los días.
Su teoría estuvo fuertemente influenciada por el trabajo del psicólogo Edward Thorndike, quien propuso lo que él llamó la ley del efecto.De acuerdo con este principio, las acciones seguidas de resultados deseables tienen más probabilidades de repetirse, mientras que las seguidas de resultados indeseables tienen menos probabilidades de repetirse.
El condicionamiento operante se basa en una premisa bastante simple: las acciones seguidas de refuerzo se fortalecerán y es más probable que ocurran nuevamente en el futuro. Si cuentas una historia graciosa en clase y todos se ríen, es probable que vuelvas a contar esa historia en el futuro.
Si levantas la mano para hacer una pregunta y tu profesor elogia tu comportamiento cortés, será más probable que levantes la mano la próxima vez que tengas una pregunta o un comentario. Debido a que el comportamiento fue seguido por un refuerzo o un resultado deseable, la acción anterior se fortalece.
Por el contrario, las acciones que resultan en castigo o consecuencias indeseables se debilitarán y será menos probable que vuelvan a ocurrir en el futuro. Si vuelves a contar la misma historia en otra clase pero nadie se ríe esta vez, será menos probable que vuelvas a repetir la historia en el futuro. Si gritas una respuesta en clase y tu profesor te regaña, es menos probable que vuelvas a interrumpir la clase.
Tipos de comportamientos
Skinner distinguió entre dos tipos diferentes de comportamientos
- Comportamientos de los encuestados son los que ocurren de forma automática y refleja, como retirar la mano de una estufa caliente o sacudir la pierna cuando el médico le da golpecitos en la rodilla. No tienes que aprender estos comportamientos. Simplemente ocurren de forma automática e involuntaria.
- Comportamientos Operantes, por otro lado, son aquellos bajo nuestro control consciente. Algunas pueden ocurrir espontáneamente y otras a propósito, pero son las consecuencias de estas acciones las que luego influyen en que vuelvan a ocurrir o no en el futuro. Nuestras acciones sobre el medio ambiente y las consecuencias de esa acción constituyen una parte importante del proceso de aprendizaje.
Si bien el condicionamiento clásico podría explicar los comportamientos de los encuestados, Skinner se dio cuenta de que no podía explicar una gran cantidad de aprendizaje. En cambio, Skinner sugirió que el condicionamiento operante tenía una importancia mucho mayor.
Skinner inventó diferentes dispositivos durante su niñez y puso estas habilidades a trabajar durante sus estudios sobre el condicionamiento operante. Creó un dispositivo conocido como cámara de condicionamiento operante, a menudo denominada hoy en día como caja de Skinner. La cámara podría contener un animal pequeño, como una rata o una paloma. La caja también contenía una barra o llave que el animal podía presionar para recibir una recompensa.
Para rastrear las respuestas, Skinner también desarrolló un dispositivo conocido como registrador acumulativo. El dispositivo registró las respuestas como un movimiento ascendente de una línea para que las tasas de respuesta pudieran leerse observando la pendiente de la línea.
Componentes del condicionamiento operante
Hay varios conceptos clave en el condicionamiento operante.
Refuerzo en Condicionamiento Operante
El refuerzo es cualquier evento que fortalece o aumenta el comportamiento que sigue. Hay dos clases de reforzadores. En ambos casos de refuerzo, el comportamiento aumenta.
- reforzadores positivos Son eventos o resultados favorables que se presentan después de la conducta. En situaciones de refuerzo positivo, una respuesta o comportamiento se fortalece con la adición de elogios o una recompensa directa. Si haces un buen trabajo en el trabajo y tu jefe te da una bonificación, esa bonificación es un reforzador positivo.
- reforzadores negativos Implican la eliminación de eventos o resultados desfavorables después de la exhibición de un comportamiento. En estas situaciones, la respuesta se fortalece con la eliminación de algo que se considera desagradable. Por ejemplo, si su hijo comienza a gritar en medio de un restaurante, pero se detiene una vez que le entrega un bocadillo, su acción condujo a la eliminación de la condición desagradable, reforzando negativamente su comportamiento (no el de su hijo).
Castigo en el condicionamiento operante
El castigo es la presentación de un evento o resultado adverso que provoca una disminución en el comportamiento que sigue. Hay dos tipos de castigo. En ambos casos, el comportamiento disminuye.
- castigo positivo, a veces denominado castigo por aplicación, presenta un evento o resultado desfavorable para debilitar la respuesta que sigue. Dar nalgadas por mala conducta es un ejemplo de castigo por aplicación.
- castigo negativo, también conocido como castigo por eliminación, ocurre cuando se elimina un evento o resultado favorable después de que ocurre un comportamiento. Quitarle el videojuego a un niño después de una mala conducta es un ejemplo de castigo negativo.
Horarios de refuerzo
El refuerzo no es necesariamente un proceso sencillo, y hay una serie de factores que pueden influir en la rapidez y la eficacia con que se aprenden las cosas nuevas. Skinner descubrió que Cuándo y con qué frecuencia Los comportamientos reforzados jugaron un papel en la velocidad y la fuerza de adquisición. En otras palabras, el momento y la frecuencia del refuerzo influyeron en cómo se aprendieron los nuevos comportamientos y cómo se modificaron los antiguos.
Skinner identificó varios programas diferentes de refuerzo que impactan el proceso de condicionamiento operante:
- Refuerzo continuo Implica entregar un refuerzo cada vez que ocurre una respuesta. El aprendizaje tiende a ocurrir con relativa rapidez, pero la tasa de respuesta es bastante baja. La extinción también ocurre muy rápidamente una vez que se detiene el refuerzo.
- Horarios de razón fija son un tipo de refuerzo parcial. Las respuestas se refuerzan solo después de que se haya producido un número específico de respuestas. Esto generalmente conduce a una tasa de respuesta bastante constante.
- Horarios de intervalo fijo son otra forma de refuerzo parcial. El reforzamiento ocurre solo después de que ha transcurrido un cierto intervalo de tiempo. Las tasas de respuesta se mantienen bastante estables y comienzan a aumentar a medida que se acerca el momento del refuerzo, pero disminuyen inmediatamente después de que se ha entregado el refuerzo.
- Horarios de razón variable También son un tipo de reforzamiento parcial que consisten en reforzar la conducta después de un número variado de respuestas. Esto conduce tanto a una tasa de respuesta alta como a tasas de extinción lentas.
- Horarios de intervalo variable son la forma final de refuerzo parcial descrita por Skinner. Este cronograma implica la entrega de refuerzo después de que haya transcurrido una cantidad variable de tiempo. Esto también tiende a conducir a una tasa de respuesta rápida y una tasa de extinción lenta.
Ejemplos de condicionamiento operante
Podemos encontrar ejemplos de condicionamiento operante en el trabajo a nuestro alrededor. Considere el caso de niños que completan la tarea para ganar una recompensa de un padre o maestro, o empleados que terminan proyectos para recibir elogios o promociones. Más ejemplos de condicionamiento operante en acción incluyen:
- Después de actuar en una obra de teatro comunitaria, recibe el aplauso del público. Esto actúa como un reforzador positivoinspirándolo a probar para más roles de rendimiento.
- Entrenas a tu perro para que vaya a buscar ofreciéndole elogios y una palmada en la cabeza cada vez que realiza el comportamiento correctamente. Este es otro reforzador positivo.
- Un profesor les dice a los estudiantes que si tienen asistencia perfecta todo el semestre, entonces no tienen que tomar el examen comprensivo final. Al eliminar un estímulo desagradable (la prueba final), los estudiantes son reforzado negativamente para asistir a clase con regularidad.
- Si no entrega un proyecto a tiempo, su jefe se enoja y reprende su desempeño frente a sus compañeros de trabajo. Esto actúa como un castigador positivopor lo que es menos probable que termine los proyectos tarde en el futuro.
- Una adolescente no limpia su habitación como se le pidió, por lo que sus padres le quitan el teléfono por el resto del día. Éste es un ejemplo de un castigo negativo en el que se retira un estímulo positivo.
En algunos de estos ejemplos, la promesa o posibilidad de recompensas provoca un aumento en el comportamiento. El condicionamiento operante también se puede utilizar para disminuir un comportamiento mediante la eliminación de un resultado deseable o la aplicación de un resultado negativo. Por ejemplo, se le puede decir a un niño que perderá los privilegios del recreo si habla fuera de su turno en clase. Este potencial de castigo puede conducir a una disminución de los comportamientos disruptivos.
Una palabra de Psyathome
Si bien el conductismo puede haber perdido gran parte del dominio que tuvo durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una herramienta importante y de uso frecuente en el proceso de modificación del aprendizaje y la conducta. A veces, las consecuencias naturales conducen a cambios en nuestro comportamiento. En otros casos, las recompensas y los castigos pueden repartirse conscientemente para crear un cambio.
El condicionamiento operante es algo que puede reconocer de inmediato en su propia vida, ya sea en su enfoque para enseñar a sus hijos el buen comportamiento o en el entrenamiento del perro de la familia. Recuerda que cualquier tipo de aprendizaje lleva tiempo. Considere el tipo de refuerzo o castigo que puede funcionar mejor para su situación particular y evalúe qué tipo de programa de refuerzo puede conducir a los mejores resultados.