¿Qué es el condicionamiento operante y cómo funciona?
El condicionamiento operante (a veces denominado condicionamiento instrumental) es un método de aprendizaje que se produce a través de recompensas y castigos por el comportamiento. A través del condicionamiento operante, se hace una asociación entre un comportamiento y una consecuencia de ese comportamiento..
Por ejemplo, cuando una rata de laboratorio presiona un botón azul, recibe una bolita de comida como recompensa, pero cuando presiona el botón rojo recibe una leve descarga eléctrica. Como resultado, aprende a presionar el botón azul pero evita el botón rojo.
Pero el condicionamiento operante no es solo algo que tiene lugar en entornos experimentales mientras se entrena a animales de laboratorio; También juega un papel poderoso en el aprendizaje diario. El refuerzo y el castigo se llevan a cabo casi todos los días en entornos naturales, así como en entornos más estructurados, como el aula o las sesiones de terapia..
Veamos más de cerca cómo se descubrió el condicionamiento operante, el impacto que tuvo en la psicología y cómo se usa para cambiar viejos comportamientos y enseñar nuevos..
La historia del condicionamiento operante
El condicionante operante fue acuñado por el conductista B.F. Skinner, que es la razón por la que ocasionalmente puede escucharlo denominado condicionamiento skinneriano. Como conductista, Skinner creía que no era realmente necesario mirar los pensamientos y motivaciones internos para explicar el comportamiento. En su lugar, sugirió, deberíamos mirar solo las causas externas y observables del comportamiento humano..
A lo largo de la primera parte del siglo XX, el conductismo se había convertido en una fuerza importante dentro de la psicología. Las ideas de John B. Watson dominaron esta escuela de pensamiento desde el principio. Watson se centró en los principios del condicionamiento clásico, sugiriendo una vez que podía tomar a cualquier persona independientemente de sus antecedentes y capacitarla para que fuera lo que eligiera..
Donde los conductistas tempranos habían centrado sus intereses en el aprendizaje asociativo, Skinner estaba más interesado en cómo Consecuencias Las acciones de las personas influyeron en su comportamiento..
Skinner usó el término operante para referirse a cualquier "comportamiento activo que opera sobre el entorno para generar consecuencias". En otras palabras, la teoría de Skinner explica cómo adquirimos el rango de comportamientos aprendidos que exhibimos todos los días..
Su teoría fue fuertemente influenciada por el trabajo del psicólogo Edward Thorndike, quien propuso lo que él llamó la ley del efecto. De acuerdo con este principio, es más probable que se repitan las acciones seguidas por resultados deseables, mientras que las seguidas por resultados indeseables tienen menos probabilidades de repetirse.
El condicionamiento operante se basa en una premisa bastante simple: las acciones seguidas por el refuerzo se reforzarán y es más probable que vuelvan a ocurrir en el futuro. Si cuenta una historia divertida en clase y todos se ríen, es probable que sea más probable que la vuelva a contar en el futuro. Si levanta la mano para hacer una pregunta y su maestro elogia su comportamiento educado, será más probable que levante la mano la próxima vez que tenga una pregunta o comentario. Debido a que el comportamiento fue seguido por un refuerzo, o un resultado deseable, las acciones anteriores se fortalecen.
A la inversa, las acciones que resulten en castigos o consecuencias indeseables se debilitarán y es menos probable que vuelvan a ocurrir en el futuro. Si vuelve a contar la misma historia en otra clase, pero esta vez nadie se ríe, será menos probable que la repita en el futuro. Si gritas una respuesta en clase y tu profesor te regaña, entonces es menos probable que vuelvas a interrumpir la clase..
Tipos de Comportamientos
Skinner distinguió entre dos tipos diferentes de comportamientos.
- Conductas respondientes son aquellos que ocurren de forma automática y por reflejo, como retirar su mano de una estufa caliente o sacudir la pierna cuando el médico le toca la rodilla. No tiene que aprender estos comportamientos, simplemente ocurren de forma automática e involuntaria..
- Conductas operantes, Por otro lado, están aquellos bajo nuestro control consciente. Algunos pueden ocurrir de manera espontánea y otros a propósito, pero son las consecuencias de estas acciones las que influyen en que ocurran o no en el futuro. Nuestras acciones sobre el medio ambiente y las consecuencias de esa acción constituyen una parte importante del proceso de aprendizaje..
Si bien el condicionamiento clásico podría explicar los comportamientos de los encuestados, Skinner se dio cuenta de que no podía explicar mucho el aprendizaje. En cambio, Skinner sugirió que el condicionamiento operante tenía mucha mayor importancia..
Skinner inventó diferentes dispositivos durante su infancia y puso en práctica estas habilidades durante sus estudios sobre el condicionamiento operante..
Creó un dispositivo conocido como cámara de condicionamiento operante, que a menudo se conoce como una caja de Skinner. La cámara era esencialmente una caja que podía contener un pequeño animal como una rata o una paloma. La caja también contenía una barra o llave que el animal podía presionar para recibir una recompensa.
Para rastrear las respuestas, Skinner también desarrolló un dispositivo conocido como un registrador acumulativo. El dispositivo registró las respuestas como un movimiento hacia arriba de una línea para que las tasas de respuesta puedan leerse mirando la pendiente de la línea.
Componentes del Acondicionamiento Operante
Existen varios conceptos clave en el condicionamiento operante..
Refuerzo en Condicionamiento Operante.
Refuerzo es cualquier evento que fortalece o aumenta el comportamiento que sigue. Hay dos tipos de refuerzos:
- Refuerzos positivos Son eventos o resultados favorables que se presentan después del comportamiento. En situaciones que reflejan un refuerzo positivo, una respuesta o comportamiento se fortalece con la adición de algo, como un elogio o una recompensa directa. Por ejemplo, si hace un buen trabajo en el trabajo y su gerente le otorga una bonificación.
- Refuerzos negativos Implica la eliminación de eventos o resultados desfavorables después de mostrar un comportamiento. En estas situaciones, una respuesta se fortalece al eliminar algo que se considera desagradable. Por ejemplo, si su hijo comienza a gritar en medio de la tienda de comestibles, pero se detiene una vez que le da una golosina, es más probable que le dé una golosina la próxima vez que comience a gritar. Su acción condujo a la eliminación de la condición desagradable (el niño gritando), reforzando negativamente su comportamiento.
En ambos casos de refuerzo, el comportamiento aumenta..
Refuerzo en el Condicionamiento Conductual.Castigo en Condicionamiento Operante
El castigo es la presentación de un evento o resultado adverso que causa una disminución en el comportamiento que sigue. Hay dos tipos de castigo:
- Castigo positivo, algunas veces denominado castigo por aplicación, presenta un evento o resultado desfavorable para debilitar la respuesta que sigue. Nalgadas por mala conducta es un ejemplo de castigo por aplicación.
- Castigo negativo, también conocido como castigo por eliminación, ocurre cuando un evento o resultado favorable se elimina después de que ocurre un comportamiento. Quitar el juego de video de un niño después de una mala conducta es un ejemplo de castigo negativo.
En ambos casos de castigo, el comportamiento disminuye..
El castigo y su influencia en el comportamientoHorarios de Refuerzo
El refuerzo no es necesariamente un proceso sencillo y hay varios factores que pueden influir en la rapidez y el buen aprendizaje de las cosas. Skinner encontró que cuando y Con qué frecuencia Los comportamientos que se reforzaron jugaron un papel en la velocidad y la fuerza de adquisición. En otras palabras, el momento y la frecuencia de refuerzo influyeron en cómo se aprendieron los nuevos comportamientos y en cómo se modificaron los viejos..
Skinner identificó varios programas de refuerzo diferentes que afectan el proceso de condicionamiento operante:
- Refuerzo continuo Implica la entrega de un refuerzo cada vez que se produce una respuesta. El aprendizaje tiende a ocurrir con relativa rapidez, pero la tasa de respuesta es bastante baja. La extinción también ocurre muy rápidamente una vez que se detiene el refuerzo.
- Horarios de relación fija Son un tipo de refuerzo parcial. Las respuestas se refuerzan solo después de que haya ocurrido un número específico de respuestas. Esto generalmente conduce a una tasa de respuesta bastante constante.
- Horarios de intervalo fijo Son otra forma de refuerzo parcial. El refuerzo ocurre solo después de un cierto intervalo de tiempo. Las tasas de respuesta se mantienen bastante estables y comienzan a aumentar a medida que se acerca el tiempo de refuerzo, pero se ralentizan inmediatamente después de que se haya entregado el refuerzo.
- Horarios de relación variable También son un tipo de refuerzo parcial que implica reforzar el comportamiento después de un número variado de respuestas. Esto conduce tanto a una tasa de respuesta alta como a tasas de extinción lentas.
- Horarios de intervalo variable Son la forma final de refuerzo parcial que describe Skinner. Este programa implica la entrega de refuerzos después de que haya transcurrido un tiempo variable. Esto también tiende a llevar a una tasa de respuesta rápida y una tasa de extinción lenta.
Ejemplos de condicionamiento operante
Podemos encontrar ejemplos de condicionamiento operante en el trabajo que nos rodea. Considere el caso de los niños que completan la tarea para ganar una recompensa de un padre o maestro, o los empleados que terminan proyectos para recibir elogios o promociones.
Algunos ejemplos más de condicionamiento operante en acción:
- Si su hijo actúa durante un viaje de compras, puede darle un gusto para que se quede callado. Debido a que ha reforzado positivamente el mal comportamiento, es probable que sea más probable que actúe nuevamente en el futuro para recibir otro tratamiento..
- Después de actuar en una obra de teatro comunitaria, recibes un aplauso del público. Esto actúa como un refuerzo positivo que lo inspira a probar para obtener más roles de desempeño.
- Usted entrena a su perro para que vaya a buscarlo, ofreciéndole elogios y una palmadita en la cabeza cada vez que realice el comportamiento correctamente..
- Un profesor les dice a los estudiantes que si tienen asistencia perfecta durante todo el semestre, entonces no tienen que tomar el examen completo final. Al eliminar un estímulo desagradable (la prueba final) se refuerza negativamente a los estudiantes para que asistan a clase regularmente.
- Si no entrega un proyecto a tiempo, su jefe se enoja y reprende su desempeño frente a sus compañeros de trabajo. Esto actúa como un castigador positivo, por lo que es menos probable que termine los proyectos en el futuro..
- Una niña adolescente no limpia su habitación como se le pidió, por lo que sus padres le quitan el teléfono por el resto del día. Este es un ejemplo de un castigo negativo en el que se elimina un estímulo positivo.
En algunos de estos ejemplos, la promesa o posibilidad de recompensas provoca un aumento en el comportamiento, pero el condicionamiento operante también se puede usar para disminuir un comportamiento. La eliminación de un resultado deseable o la aplicación de un resultado negativo se puede usar para disminuir o prevenir comportamientos indeseables. Por ejemplo, a un niño se le puede decir que perderá los privilegios de recreo si habla fuera de lugar en la clase. Este potencial de castigo puede llevar a una disminución en las conductas disruptivas.
Una palabra de Verywell
Si bien el conductismo puede haber perdido gran parte del dominio que tenía durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una herramienta importante y frecuentemente utilizada en el proceso de aprendizaje y modificación del comportamiento. A veces las consecuencias naturales conducen a cambios en nuestro comportamiento. En otros casos, las recompensas y los castigos pueden ser distribuidos conscientemente para crear un cambio.
El condicionamiento operante es algo que puede reconocer inmediatamente en su propia vida, ya sea en su enfoque para enseñar a sus hijos el buen comportamiento o en entrenar al perro de la familia para que deje de morder sus zapatillas favoritas. Lo importante a recordar es que con cualquier tipo de aprendizaje, a veces puede llevar tiempo. Considere el tipo de refuerzo o castigo que puede funcionar mejor para su situación particular y evalúe qué tipo de programa de refuerzo podría conducir a los mejores resultados.