Condicionamiento instrumental en psicología

Condicionamiento instrumental es otro término para el condicionamiento operante, un proceso de aprendizaje descrito por primera vez por B. F. Skinner. En el condicionamiento instrumental, el refuerzo o el castigo se usan para aumentar o disminuir la probabilidad de que una conducta vuelva a ocurrir en el futuro..

Ejemplos

Por ejemplo, si un estudiante es recompensado con elogios cada vez que levanta la mano en clase, es más probable que la levante de nuevo en el futuro..

Si ella también es regañada cuando habla fuera de turno, es menos probable que interrumpa la clase. En estos ejemplos, el maestro está usando refuerzos para fortalecer el comportamiento de levantar las manos y el castigo para debilitar el comportamiento de hablar fuera de turno.

El acondicionamiento instrumental se usa a menudo en el entrenamiento de animales también. Por ejemplo, entrenar a un perro para darle la mano implicaría ofrecer una recompensa cada vez que ocurra el comportamiento deseado.

Historia

Psicóloga E.L. Thorndike fue uno de los primeros en observar el impacto del refuerzo en experimentos con cajas de rompecabezas con gatos. Durante estos experimentos, Thorndike observó un proceso de aprendizaje que denominó aprendizaje de "prueba y error"..

Los experimentos incluyeron colocar a un gato hambriento en una caja de rompecabezas y para liberarse, el gato tuvo que descubrir cómo escapar. Thorndike luego notó cuánto tardaron los gatos en liberarse en cada prueba experimental. Inicialmente, los gatos se involucraban en métodos de escape ineficaces, rascando y cavando en los lados o en la parte superior de la caja. Eventualmente, la prueba y error llevaría a los gatos a empujar o tirar con éxito la ruta de escape. Después de cada prueba sucesiva, los gatos se involucraron cada vez menos en las conductas de escape ineficaces y respondieron más rápidamente con las acciones de escape correctas..

Thorndike se refirió a sus observaciones como la Ley de Efecto. La fuerza de una respuesta aumenta cuando es seguida inmediatamente por un "satisfecho" (reforzador). Por otro lado, es más probable que las acciones que son seguidas por efectos desagradables se debiliten..

En los experimentos de la caja de rompecabezas de Thorndike, escapar de la caja fue lo más satisfactorio. Cada vez que los gatos escaparon exitosamente de la caja, el comportamiento que inmediatamente precedió al escape fue reforzado y fortalecido..

El trabajo de Thorndike tuvo un efecto tremendo en la investigación posterior de B.F. Skinner sobre el condicionamiento operante. Skinner incluso creó su propia versión de las cajas de rompecabezas de Thorndike a la que se refirió como cámara operante, también conocida como caja de Skinner..

Cómo funciona

Skinner identificó dos tipos de comportamientos clave. El primer tipo es el comportamiento de los encuestados. Estas son simplemente acciones que ocurren reflexivamente sin ningún aprendizaje. Si toca algo caliente, inmediatamente retirará su mano en respuesta. El condicionamiento clásico se centra en estos comportamientos encuestados..

En los experimentos clásicos de Pavlov con perros, el comportamiento de los encuestados fue salivar a la presentación de los alimentos. Sin embargo, al formar una asociación entre el sonido de una campana y la presentación de la comida, Pavlov pudo entrenar perros para que realmente salivaran simplemente con el sonido de esa campana..

Skinner se dio cuenta de que, si bien el condicionamiento clásico podía explicar cómo los comportamientos de los encuestados podían conducir al aprendizaje, no podía explicar todo tipo de aprendizaje. En cambio, sugirió que fueron las consecuencias de las acciones voluntarias las que llevaron a la mayor cantidad de aprendizaje..

El segundo tipo de conductas es lo que Skinner denomina conductas operantes. Los definió como cualquier comportamiento voluntario que actúa sobre el entorno para crear una respuesta. Estos son los comportamientos voluntarios que están bajo nuestro control consciente. Estas son también acciones que se pueden aprender. Las consecuencias de nuestras acciones juegan un papel importante en el proceso de aprendizaje..

Refuerzo y Castigo

Skinner identificó dos aspectos clave del proceso de condicionamiento operante. El refuerzo sirve para aumentar el comportamiento, mientras que el castigo sirve para disminuir el comportamiento.

También hay dos tipos diferentes de refuerzo y dos tipos diferentes de castigo. El refuerzo positivo implica presentar un resultado favorable, como darle un tratamiento a un niño después de que ella limpie su habitación.

El refuerzo negativo implica la eliminación de un estímulo desagradable, como decirle a un niño que si come todas sus papas, entonces no tendrá que comer su brócoli. Como el niño considera que el brócoli es una consecuencia desagradable y comer las papas conduce a eliminar esta consecuencia indeseable, el comer las papas se refuerza negativamente..

El castigo positivo significa aplicar un evento desagradable después de un comportamiento. Azotar, por ejemplo, es un ejemplo común de castigo positivo. Este tipo de castigo a menudo se conoce como castigo por aplicación. Una consecuencia negativa se aplica directamente para reducir el comportamiento no deseado..

El castigo negativo implica quitar algo agradable después de que ocurra un comportamiento. Por ejemplo, si un niño no limpia su habitación, sus padres podrían decirle que no puede ir al centro comercial con sus amigos. Quitar la actividad deseable actúa como un castigo negativo en el comportamiento anterior.