En educación, en muchas ocasiones se utiliza el castigo y la recompensa de forma casi instintiva sin darse cuenta que se sigue un condicionamiento operante. Es muy importante conocer qué es exactamente el condicionamiento operante para poder saber sus pros y sus contras, y de esta manera, en caso que se vea necesario, poder trabajarlo de forma correcta, dentro de las teorías conductistas o cambios de comportamiento en los seres.
Definición del condicionamiento operante
El condicionamiento operante es un tipo de aprendizaje donde se controla el comportamiento a través de consecuencias. Los conceptos clave en el acondicionamiento operante son el refuerzo positivo, el refuerzo negativo, el castigo positivo y el castigo negativo.
El condicionamiento operante también se puede conocer por acondicionamiento instrumental. Cuando se utiliza el condicionamiento operante, se establece una asociación entre el comportamiento que se establece y la consecuencia que existe para ese comportamiento.
En los estudios con ratas, por ejemplo, si una rata de laboratorio apretaba un botón azul recibía comida, y cuando apretaba el botón rojo, recibía una leve descarga eléctrica. Este aprendizaje basado en recompensa y castigo, le hacía aprender a la rata que debía presionar el botón azul porque el rojo era ‘peligroso’ y el azul le proporcionaba alimento.
Muchos padres y madres, y también en las escuelas utilizan esta forma de enseñanza-aprendizaje para modificar la conducta de los niños. Esto quiere decir que se utiliza el condicionamiento operante en el día a día de las personas en cualquier tipo de entorno, no solo en uno estructurado. En terapias, escuelas e incluso en ambientes naturales se utiliza el condicionamiento operante.
Esquemas del condicionamiento operante
El esquema del condicionamiento operante seguiría lo siguiente, teniendo en cuenta el comportamiento de las ratas del estudio:
- Estimulo condicionado: botón azul o rojo
- Respuesta condicionada: apretar o no el botón azul o rojo
Estímulo incondicionado: bola de alimento o descarga - Respuesta incondicionada: apretar el botón azul en lugar del rojo
Tipos de condicionamiento operante
En el condicionamiento operante hay varios tipos que se debe tener en cuenta, para poder entender esta teoría de aprendizaje es necesario saber distinguir bien entre los tipos de refuerzos y castigos que existen.
Tipos de refuerzo en el condicionamiento operante
El refuerzo es un estímulo que aumenta el comportamiento que se tiene, hay dos tipos de refuerzos, los refuerzos positivos y los negativos.
- Refuerzos positivos: Es el resultado favorable que se presenta después de un comportamiento. En los refuerzos positivos se utilizan las recompensas favorables o los elogios para favorecer el comportamiento. Por ejemplo, si le das un regalo a tu hijo cuando ha sido capaz de no gritar en una rabieta, la próxima vez será más fácil que controle el impulso de gritar.
- Refuerzos negativos: Es el resultado desfavorable que se presenta después de un comportamiento. Suele utilizarse a través de la eliminación de resultados, reforzando normalmente una mala conducta. Por ejemplo, si a tu hijo le das un regalo para que deje de gritar, gritará siempre porque querrá más regalos.
Tipos de castigo en el acondicionamiento operante
El castigo es una imposición para disminuir el comportamiento que sigue. Hay dos tipos de castigos a tener en cuenta; el castigo positivo y el castigo negativo.
- El castigo positivo. En este caso es un castigo que resulta después de un resultado negativo para que disminuya la respuesta. Por ejemplo, si un padre le da un cachete a su hijo por una mala conducta sería lo que se conoce como castigo positivo.
- Castigo negativo. Este castigo es conocido también como castigo por remoción, es cuando se quiere eliminar un resultado favorable después de un comportamiento. Por ejemplo, si tu hijo ha tenido un mal comportamiento le quitas un juguete por haberse comportado así.
Contras de emplear los castigos del condicionamiento operante
Es necesario remarcar que con este tipo de enseñanza – aprendizaje, cuando se trata de cambios de conducta en los niños o en cualquier persona, quizá se puedan conseguir resultados a corto plazo, pero a largo plazo no.
Para que un niño o una persona pueda modificar su conducta realmente debe interiorizarlo primero y sobre todo, querer hacerlo. Cuando existe un castigo, del tipo que sea, es algo impuesto y por lo tanto, los niños o las personas no modificarán su conducta de forma interna y a la larga, volverá a salir el mal comportamiento. Es necesario tener reflexión sobre los comportamientos y que en lugar de castigos, existan consecuencias. De esta manera se cede cierto control en el cambio de comportamiento y se puede conseguir con resultados más efectivo.
Programas de refuerzo
El refuerzo no necesariamente es un proceso directo, ya que hay factores que pueden influir en la capacidad de aprender las cosas o desaprenderlas. Skinner, que fue el impulsor de esta teoría del aprendizaje se dio cuenta que el cuándo y la frecuencia era primordial para que el aprendizaje se adquiriera. Por lo tanto, el momento y la frecuencia de los reforzadores era importante tenerlo presente para la modificación de conducta. Para entender mejor esto hay que tener en cuenta los programas de refuerzo que afectan al proceso del condicionamiento operante:
- Refuerzo continuo: refuerzo cada vez que hay una respuesta. Aprendizaje con rapidez y tasas de respuestas bajas. Si se detiene el refuerzo se detiene la extinción del comportamiento.
- Programas de relación fija: refuerzo parcial. Las respuestas se refuerzan solo después de producir un número de respuestas específicas. Tasa de respuesta estable.
- Horarios de intervalo fijo: refuerzo parcial. El refuerzo ocurre solo después que pasa cierto tiempo. Tasa de respuestas estables y aumentan a medida que se acerca el refuerzo. Si se entrega el refuerzo la respuesta disminuye.
- Programas de relación variable: tipo de refuerzo parcial que implica un comportamiento reforzado después de varias respuestas. Tasa de respuesta y de extinción lentas.
- Programas de intervalos variables: forma final de refuerzo parcial. Entregar refuerzo después de tiempo variable. Tasa de respuesta rápida y extinción lenta.
Ejemplos cotidianos de condicionamiento operante
- Refuerzo positivo. Refuerzo agradable que aumenta las probabilidades de que el comportamiento continúe: ir a trabajar todos los días y recibir un sueldo a cambio a final de mes.
- Refuerzo negativo. Se quita algo desagradable como resultado de comportamiento aceptable: Un niño tiene una rabieta porque no tuvo una golosina. El padre le da una golosina y la rabieta para. La próxima vez habrán golosinas para que no hayan rabietas.
- Castigo positivo. Se usa para disminuir un comportamiento con algo desagradable después del comportamiento: si un niño no hace sus tareas un día, al día siguiente hace las tareas del día y del día anterior, por tanto tendrá doble tiempo de tareas.
- Castigo negativo. Se usa para disminuir un comportamiento y se elimina algo agradable después del comportamiento: un niño le rompe un juguete a su hermana y es castigado sin salir con los amigos.