sábado, 20 de junio de 2009

Psicología General I tema 10 1pp

 

INTERPRETACIONES COGNITIVAS DEL CONDICIONAMIENTO CLÁSICO
Teorías asociacionistas
Se centran en el supuesto nexo asociativo del condicionamiento clásico, intentando averiguar cómo y porqué se produce este paradigma del aprendizaje.
El argumento principal de todas las teorías asociacionistas es asumir que todo aprendizaje se reduce a la formación de hábitos por asociación de elementos psíquicos o conductuales, previamente inconexos.
El condicionamiento clásico es una contigüidad temporal entre un EC y un EI. De esta manera, cuando dos estímulos se presentan en contigüidad una o más veces, tienden a asociarse, de tal manera que la presentación de uno tiende a provocar la respuesta del otro.
La mayoría de los psicólogos asociacionistas creen que el fortalecimiento de la asociación entre los estímulos, depende del número de veces que ocurren conjuntamente, debido a la ley de la contigüidad. Por estas razones, es la contigüidad el principal pilar en el que se basan estas teorías.
Son teorías asociacionistas:
 Teoría pavloviana: Para Pavlov, la asociación entre el EC y el EI en el condicionamiento clásico consiste en que el EC se convierte en una señal del EI. El concepto de señal lo aplica en sentido fisiológico, adquiriendo un significado parecido al del estímulo señal que pone en funcionamiento el mecanismo desencadenador innato.
 Teoría de la sustitución del estímulo: El EC llega finalmente a sustituir al EI. El proceso es el siguiente: el EI provoca inicialmente una RI pero, debido a la contigüidad de los estímulos, el EC sustituye o asume la función del EI, al provocar la RC. Por lo tanto, lo que se aprende ocurre porque el EC se presenta en contigüidad con el EI. 
Este proceso presenta varias dificultades:
1. Para que se logre una verdadera sustitución del EI por el EC, es también necesario que sus respuestas (RI y RC) sean idénticas; se ha comprobado experimentalmente que la RC no es exactamente igual a la RI, sino sólo bastante semejante.
2. Existen algunos reflejos concretos en los que se ha comprobado que el EI no puede ser sustituido, porque el nexo EI-RI es muy específico y consistente; por lo que no siempre el EC puede sustituir al EI.
 Teoría de la anticipación: El nexo asociativo consiste en la anticipación o facilitación que suministra la RC para la aparición de la RI; es decir, lo que en realidad hace el EC es provocar una respuesta, que no es la misma que la RI, y cuya misión fundamental radica en preparar al organismo, anticipando y/o facilitando, la emisión de la RI ante la presentación del EI. Esta teoría es también conductista porque se basa en el concepto de las respuestas fraccionarias anticipatorios de meta, es decir, se centra en el encadenamiento de respuestas hasta conseguir el condicionamiento. De esta manera, la RC se convierte en una fracción de la RI.
La principal dificultad de esta teoría reside en que no siempre es fácil considerar la RC como una respuesta fraccionaria de la RI. Además, tampoco está clara la existencia del principio conductista de las cadenas de fracciones de respuesta.

Todas estas teorías asociacionistas no admiten la existencia de otras formas de aprendizaje que no sean por asociación entre los dos estímulos, defendiendo la contigüidad como base del condicionamiento. Estas teorías son teorías continuistas e igualitarias, en el sentido de que no admiten la existencia de niveles adquisitivos cualitativamente jerarquizables, ya que para ellas todas las conductas tienen el mismo nivel. Se limitan a explicar los distintos aprendizajes, reduciéndolos a combinaciones más o menos complejas de los mismos elementos básicos: los estímulos y las respuestas.

Controversia contigüidad- contingencia
Al fenómeno que ocurre cuando el EC es capaz de predecir el EI se le denomina Contingencia entre los estímulos y suele expresarse en términos de probabilidades condicionadas. En otras palabras, el concepto de contingencia en el condicionamiento hace referencia al valor informativo que el EC proporciona acerca del EI, y este valor informativo se define en base a la relación entre las dos probabilidades que condicionan la ocurrencia del EI a la presencia o ausencia del EC. Por lo tanto, cuando la probabilidad de que ocurra el EI es igual en presencia que en ausencia del EC, no habrá condicionamiento. En cambio, si el EC predice la ocurrencia del EI se producirá un condicionamiento excitatorio y, al contrario, si el EC predice la ausencia del EI se producirá un condicionamiento inhibitorio.
Rescorla pone en duda el concepto de contigüidad como único nexo necesario para que se produzca el condicionamiento clásico; señala que es la contingencia entre el EC y el EI, el acontecimiento más importante en el condicionamiento clásico.
Para Rescorla, el determinante fundamental de la RC es la relación probabilística entre el EC y el EI. Si la probabilidad del EI es mayor en presencia del EC que en su ausencia, entonces se da lo que Rescorla denomina contingencia positiva y sus efectos excitatorios aumentan, produciéndose la adquisición; por el contrario, si la probabilidad del EI es menor en presencia del EC que en su ausencia, se producirá una contingencia negativa y aumentarán los efectos inhibitorios.
Según Rescorla, el condicionamiento clásico consiste en el grado en que el EC informa del EI, y este informar es algo cognitivo.

Teorías cognitivas contemporáneas
Las posiciones contemporáneas definen el aprendizaje como la formación de una nueva estructura mental que sólo se manifiesta indirectamente en un cambio conductual. Han intentado explicar la naturaleza del mecanismo que determina cómo los hechos son procesados de manera que se produzca el aprendizaje, señalando que si la información es procesada de forma adecuada por el mecanismo de aprendizaje, se producirá un cambio en la representación de la relación entre los hechos en la memoria.
La fuerza de la representación interna de la asociación (EC-EI) se la denomina fuerza asociativa del EC (respecto al EI), se la designa con el símbolo V. De esta manera, la capacidad del EC para activar la representación del EI y provocar una RC está directamente relacionada con esa fuerza asociativa; por lo que cuanto mayor sea la fuerza asociativa del EC, mayor será la RC que provoque.
Desde esta perspectiva, la tarea de cualquier teoría del aprendizaje consiste en especificar cómo cambia la fuerza asociativa de un determinado EC, con respecto a la situación de aprendizaje en que interviene.

 ΔV = (procesamiento del EC) (procesamiento del EI)

Donde ΔV que es la variación o cambio de la fuerza asociativa del EC en un determinado ensayo, es igual al procesamiento conjunto de ambos estímulos; es decir, que depende del grado en que la información acerca del EC y el EI es procesada conjuntamente. Por lo que si el EC o el EI no reciben el procesamiento adecuado, no se producirá ningún cambio en la fuerza asociativa del EC.
El efecto de bloqueo de Kamin
Para Kamin, según los principios de la contigüidad, la asociación se debería establecer por igual entre todos los elementos del EC compuesto; sin embargo, esto no ocurre y uno de los componentes adquiere toda la fuerza asociativa, bloqueando al otro componente que no adquiere dicha fuerza y, por lo que no es capaz de producir la RC.
Kamin no niega la contigüidad, sino que añade un factor cognitivo basado en la información. Kamin sugiere que el sujeto sólo aprende una asociación EC-EI, si cuando se presenta el EI su aparición resulta sorpresiva o inesperada para el sujeto del condicionamiento.
Muchos investigadores se han cuestionado qué factores son verdaderamente necesarios para que se produzca el condicionamiento; para responder a esta pregunta han surgido dos posturas claramente diferenciadas:
 La primera indica que para que un estímulo sea procesado por el mecanismo de aprendizaje, ha de ser inesperado o sorpresivo. Esta es la postura del propio Kamin.
 La segunda mantiene que el procesamiento de un estímulo depende de si es un predictor fiable de otros estímulos, más que reflejar el grado en que es sorpresivo.
Teoría de Rescorla y Wagner
La teoría de Rescorla y Wagner ha sido la teoría contemporánea del aprendizaje más completa e influyente, porque sus planteamientos pueden explicar la mayoría de los fenómenos del aprendizaje, incluido el efecto de bloqueo, simplemente en términos del procesamiento del EI.
Esta teoría parte de tres supuestos fundamentales:
 Que el cambio de la fuerza asociativa del EC producido en un determinado ensayo, depende del procesamiento conjunto del EC y el EI.
 Que el EI debe ser sorpresivo o imprevisto para que se produzca el procesamiento.
 Que el procesamiento del EI dependerá también de las propiedades de los estímulos utilizados, es decir, de la prominencia del EC y del EI.
Según Rescorla y Wagner, el que un EI sea sorpresivo dependerá de si el sujeto conoce o no la relación entre ambos estímulos, es decir, dependerá de la fuerza asociativa que en ese momento posea la representación interna de la asociación EC-EI. Cuanto más sorpresivo sea el EI, mejor procesado será y mayor será el incremento de la fuerza asociativa del EC. Por el contrario, cuanto menor sea el incremento de la fuerza asociativa del EC menos sorpresiva será la ocurrencia del EI y la cantidad de procesamiento recibido por un EI irá disminuyendo a medida que el sujeto aprenda a esperarlo.
“El incremento de la fuerza asociativa del EC en un ensayo (n), es igual a los valores de prominencia de ambos estímulos, por el nivel máximo que puede alcanzar el procesamiento del EI, menos la fuerza asociativa del EC en el ensayo anterior (n-1)”.

  ΔVn = αβ (λ - Vn-1)

ΔVn = variación de la fuerza asociativa del EC en un ensayo determinado (n)
α = valor de la prominencia del EC
β = valor de la prominencia del EI
λ = nivel máximo que puede alcanzar el procesamiento del EI
Vn-1 = fuerza asociativa del EC en el ensayo anterior (n-1)

Esta ecuación señala que el grado en que un sujeto aprende el emparejamiento entre un EC y un EI, depende de lo inesperado que sea la ocurrencia del EI.
De esta ecuación es importante matizar:
 λ : es el nivel máximo que puede alcanzar el procesamiento del EI cuando éste es totalmente sorpresivo, coincide con el valor máximo de la RI y con la asíntota en la gráfica de aprendizaje, cuyo valor máximo (en proporciones) es de 1.
 λ – V: representa el nivel de discrepancia entre el procesamiento del EI y el procesamiento del EC.
 β (λ- Vn): indica el nivel de procesamiento del EI en un determinado ensayo (n).
 los valores α y β: representan la prominencia de cada uno de los estímulos, no son valores apriorísticos, es decir, que no se pueden determinar con anterioridad al condicionamiento.
Si lo que queremos es seguir el curso del condicionamiento a lo largo de una serie de ensayos, la formula sería:

  Vn = Vn-1 + ΔVn

Cuyo enunciado sería:
“La fuerza asociativa del EC tras un ensayo concreto “n” (Vn), vendrá dada por la suma de la fuerza asociativa total obtenida en el ensayo anterior (Vn-1), más el incremento de la fuerza asociativa en ese ensayo “n” (ΔVn)”.

Para Rescorla y Wagner, al igual que para Kamin, el bloqueo se debe a que el preentrenamiento del EI con uno de los EC, durante una fase previa, hace que durante la segunda fase la ocurrencia del EI resulte poco sorpresiva, de tal forma que el sujeto aprenda poco acerca del nuevo EC añadido.
La teoría de Rescorla y Wagner puede explicar el fenómeno del ensombrecimiento, que consiste en que un estímulo puede interferir con el condicionamiento de otro estímulo, bien porque sea más intenso o porque haya recibido más condicionamiento previo.
La idea fundamental de la teoría es que la cantidad de aprendizaje resultante en un determinado ensayo depende del grado en que la ocurrencia del EI resulte sorpresiva. De esta manera, cuanto más sorpresiva sea la ocurrencia del EI, más se aprende; y al contrario, cuanto más esperada sea la ocurrencia del EI, menos se aprende. Respecto al procesamiento del EC, supone que es fijo a lo largo del aprendizaje, y que está determinado solamente por su prominencia (α).
Las principales críticas a la teoría se centran en que el procesamiento del EC es fijo a lo largo del aprendizaje.
Wagner señaló que al igual que el procesamiento del EI depende de que el EI sea sorpresivo o no, lo mismo ocurre con el EC. Consideró la posible simetría de los mecanismos que rigen el procesamiento del EC y el EI, y amplió la ecuación de la teoría de Rescorla y Wagner de tal forma que incorporase dicha simetría. De esta manera, el procesamiento del EC debería verse afectado no sólo por su prominencia, sino también por el grado en que es predicho por las claves contextuales.
Teoría de Mackintosh
Sostiene que a medida que varía el valor de predicción del EC, la atención de los sujetos al EC varía en consecuencia.
La idea fundamental de esta teoría es que el procesamiento de un determinado EC depende del grado en que este estímulo sea, en comparación con otros estímulos compuestos concurrentes, un predictor válido del EI.
Según Mackintosh, después de cada ensayo de aprendizaje se efectúa una evaluación de la capacidad predictiva de todos los estímulos compuestos presentes con respecto al EI. Esta evaluación es utilizada para controlar el procesamiento de cada EC durante las posteriores experiencias de aprendizaje. Por lo tanto, si un EC es mejor predictor del EI que todos los demás eventos presentes en ese ensayo, el grado de procesamiento que ese EC recibe en un ensayo posterior aumentará; mientras que si no lo es, tal procesamiento se verá reducido. 
Mackintosh parte de tres supuestos:
1. El cambio de la fuerza asociativa del EC producido en un determinado ensayo depende del procesamiento conjunto del EC y el EI. Este supuesto es común a todas las teorías.
2. Da mayor peso al procesamiento del EC, y señala que puede cambiar con la experiencia, dependiendo de su valor predictivo.
3. Para que un EC pueda ser considerado un predictor perfecto de un EI, la fuerza asociativa de ese EC debe ser igual al nivel máximo que puede alcanzar el procesamiento del EI cuando es totalmente inesperado.
Mackintosh piensa que todo el peso del aprendizaje puede atribuirse a los cambios en el procesamiento del EC y supone que el mismo procesamiento del EI es constante y está determinado por su prominencia, de forma que el incremento de la fuerza asociativa es un producto del actual nivel de procesamiento del EC y del valor fijo del procesamiento del EI. Según esta teoría, no se aprenderá nada más acerca de la relación entre el EC y el EI, cuando la fuerza asociativa del EC iguale el valor máximo que puede alcanzar el EI.
 Según la teoría de Rescorla y Wagner, debería producirse bloqueo en el primer ensayo con estímulos compuestos, ya que al ser esperado, el EI no recibirá el procesamiento necesario para que el animal aprenda la asociación entre el EC añadido y el EI. En cambio, la teoría de Mackintosh mantiene que el nivel de aprendizaje está controlado por las variaciones en el procesamiento del EC, y no del EI; como antes del primer ensayo con estímulos compuestos, el sujeto no ha tenido oportunidad de evaluar el valor predictivo relativo del EC preentonado y el EC añadido, ese primer ensayo de aprendizaje debería producirse normalmente, y por lo tanto no se observará bloqueo. Sin embargo, después del primer ensayo compuesto, el sujeto ya habrá podido observar que el EC añadido es peor predictor del EI que el EC preentrenado, pudiendo reducir en posteriores ensayos la cantidad de procesamiento otorgado al EC añadido. El bloqueo se produce después del primer ensayo con el compuesto, porque el sujeto aprende que el EC añadido es un predictor relativamente inferior del EI, de forma que en los siguientes ensayos la asociación no llega a aprenderse.
La principal crítica que se hace a la teoría de Mackintosh se centra en la idea de que el sujeto aprende acerca de un evento, en la medida en que éste haya sido un predictor fiable y adecuado en el pasado. Se ha comprobado experimentalmente que los sujetos aprenden más lentamente cuando un EC es un buen predictor del EI, que cuando es completamente nuevo. De dicha crítica, surge el modelo de Pearce y Hall.
Teoría de Pearce y Hall
Su teoría sobre los mecanismos responsables del aprendizaje suponiendo, igual de Mackintosh, que el procesamiento del EC depende de su valor predictivo en ensayos anteriores. Sin embargo, a diferencia de Mackintosh, afirman que el tipo de procesamiento que lleva al aprendizaje asociativo se mantendrá sólo si el EC no ha sido en el pasado un predictor adecuado del EI.
Esta teoría afirma que cuando se sorprende a un sujeto, se produce la atención y el procesamiento de un EC, incrementándose de este modo la fuerza asociativa de ese EC. A medida que el EI es predicho por el EC, resulta menos sorprendente para el sujeto, y el procesamiento disminuye. El grado de procesamiento y por lo tanto la asociabilidad de un EC varía en cada ensayo dependiendo de que el EI sea o no predecible. Si éste fuese predecible, disminuiría la atención del sujeto al EC y el grado de asociabilidad resultará más débil en el siguiente ensayo; en cambio, si el EI no fuese predecible, la atención del sujeto a ese EC aumentará.
La atención al EC es intensa al comienzo del condicionamiento, cuando el EI se predice de forma deficiente.
Modelos SOP y AESOP de Wagner
La teoría de Rescorla y Wagner indicó que una asociación se desarrolla cuando la consecuencia de un ensayo (el EI) no es del todo prevista; la teoría de Pearce y Hall, afirmó que un EC se procesa, y se desarrollan asociaciones, cuando el EC no es informativo.
Los modelos SOP y AESOP son modelos en tiempo real y, en consecuencia, pueden explicar los efectos de condicionamiento dependientes del tiempo.
El modelo SOP (proceso a veces opuesto) desarrollado por Wagner, proporciona una explicación de cómo procesa el sistema nervioso los estímulos del condicionamiento, tanto del procesamiento de la información que subyace tras la formación de una asociación, como de la ejecución de la RC y la RI. Intenta explicar por qué se forman las asociaciones, en qué condiciones se forman y cómo interaccionan para producir una conducta basada en la activación de varios centros de memoria.
Este modelo indica que existen varios procesos de memoria opuestos que explican el condicionamiento. Señala que los atributos de los estímulos se agrupan en nodos de memoria, y que cuando un nodo es activado por un estímulo, sus elementos se transfieren a un estado activo (llamado A1). Con el tiempo, estos elementos decaen en otro estado (llamado A2) y permanecen activos pero no son procesados. Por último, pasado el tiempo, los elementos vuelven otra vez a decaer, pero esta vez en un estado inactivo (llamado I).
Según el modelo, cuando se presenta un EC y poco después aparece el EI, los elementos de los nodos del EC y el EI se hallan en el estado A1 y, de esta manera, se produce una asociación excitatoria. Se supone que, en este caso, se desarrolla una asociación excitatoria entre un EC y el EI si el estado A1 del EC se solapa con el estado A1 del EI. Por lo tanto, se supone que el EC no actúa como sustituto del EI sino que activa sólo el estado A2 del EI. Si el intervalo EC-EI es largo, los elementos del nodo EC se habrán transferido al estado A2 en el momento en que se active el EI; por lo que se forma una asociación inhibitoria, ya que los elementos de los dos nodos se hallan en estados distintos.
El AESOP elaborado por Wagner y Brandon, es una prolongación del SOP concebida especialmente para incorporar los aspectos emocionales y motivacionales de los estímulos incondicionados.

INTREPRETACIONES COGNITIVAS DEL CONDICIONAMIENTO OPERANTE
Efecto del reforzamiento parcial
Cuando una respuesta ha sido premiada constantemente, la extinción ocurre más rápidamente que si aquélla ha sido premiada sólo algunas veces.
Se ha comprobado experimentalmente que la extinción se produce más lentamente tras el reforzamiento parcial que tras el reforzamiento continuo.
Se conoce con el nombre de efecto del reforzamiento parcial, a una mayor resistencia a la extinción que se produce en el reforzamiento parcial en comparación con el reforzamiento continuo.
Skinner y Humphreys fueron los primeros investigadores en describir, en animales, la mayor resistencia a la extinción con el reforzamiento parcial. También se ha demostrado este efecto en sujetos humanos adultos y en niños. Lewis y Duncan llevaron a cabo un estudio con colegiales, que recibían recompensas (unas fichas canjeables por dinero) por tirar de la palanca de una máquina tragaperras. El porcentaje de respuestas reforzadas varió entre los colegiales. Durante la extinción, se les permitió jugar con la máquina tanto como desearan, comprobando que la resistencia a la extinción era mayor cuanto más bajo había sido el porcentaje de respuestas reforzadas durante la adquisición.
La principal consecuencia de este fenómeno es que los sujetos reforzados parcialmente son más resistentes a la posterior extinción que los que han sido reforzados de forma continua. La fuerza de la respuesta no aumenta en función del número de reforzamientos y la resistencia a la extinción no sigue normas de adquisición de la fuerza de la respuesta, lo que hace pensar que existe algún otro mecanismo que influye en él y que produce dicho efecto.
El estudio experimental de este fenómeno, obligó a los investigadores del aprendizaje a cuestionar el modelo del aprendizaje instrumental con variables públicamente observables, ya que ese modelo era insuficiente para sus objetivos porque no podía explicar cómo y por qué se producía el efecto.
Se han planteado diversas hipótesis y teorías explicativas, entre las que se encuentran: la teoría de la frustración condicionada y la teoría secuencial. La diferencia de opiniones entre ambas teorías ha dado lugar a la controversia Amsel-Capaldi que indica la discrepancia de estos dos autores a la hora de interpretar dos aspectos importantes del efecto del reforzamiento parcial:
1. ¿qué proceso es el responsable de la interización de los estímulos que actúan en el reforzamiento parcial?
 Amsel indica que la interización de los estímulos es debido a un mecanismo de aprendizaje
 Capaldi indica que es un mecanismo de memoria.
2. ¿de qué naturaleza son estos estímulos interiores?
 Para Amsel estos estímulos son de naturaleza emocional.
 Para Capaldi no tienen naturaleza emocional sino cognitiva.
En definitiva, la controversia Amsel-Capaldi es una discrepancia a la hora de interpretar el reforzamiento parcial.
La teoría de la frustración condicionada (Amsel)
 La interiorización de los estímulos viene favorecida por un mecanismo de aprendizaje.
 La naturaleza de los estímulos interiores que actúan en el reforzamiento parcial son de naturaleza emocional.
 En la fase de adquisición, las respuestas recompensadas producen una expectativa en el sujeto; en cambio, las respuestas no recompensadas producen frustración. La respuesta siguiente refuerza esta frustración, con lo que el sujeto aprende una nueva relación.
 Los estímulos interiores producidos por la respuesta y característicos de la frustración pasan a formar parte del total de estímulos que desencadenan una respuesta y durante la extinción siguen provocando una respuesta.
 El sujeto al que se le ha reforzado de forma continua, no ha experimentado frustración anteriormente y no ha sido condicionado a responder en presencia de la frustración, que experimenta por primera vez durante la extinción.
La teoría secuencial (Capaldi)
 La interiorización de los estímulos que dirigen la conducta es un mecanismo de memoria.
 La naturaleza de los estímulos interiores no es emocional sino cognitiva.
 En cada ensayo de adquisición el sujeto recuerda si, en el anterior, fue recompensado o no-recompensado; de esta manera, si la memoria de la experiencia no reforzada viene a coincidir con el refuerzo en el ensayo siguiente, esta memoria se condicionará con la respuesta operante, adquiriendo ésta un valor discriminativo con respecto a la recompensa. Por lo tanto, la memoria de la conducta operante no reforzada será la responsable del incremento de la resistencia a la extinción tras el reforzamiento parcial.
 Durante la extinción, la única memoria presente después de la primera experiencia no reforzada es la memoria de la conducta operante no reforzada.
 Cuando se da un reforzamiento continuo durante la adquisición, los estímulos presentes durante la extinción son diferentes de los que se han condicionado a la respuesta, produciéndose de esta manera una reducción de la fuerza de la respuesta debido al decremento de la generalización.
 Cuando existe un reforzamiento parcial durante la adquisición, la ausencia de decremento de la generalización hace que la fuerza de la respuesta operante al comienzo de la extinción permanezca al mismo nivel que durante la adquisición. Por lo que la inhibición producida durante la extinción solamente suprimirá lentamente la respuesta operante y, en consecuencia, la extinción será más lenta con el reforzamiento parcial.
 Para esta teoría es muy importante tener en cuenta la secuencia de cómo se fijan los ensayos de adquisición, con el fin de que los estímulos interiores procedentes del no refuerzo se condicionen, convirtiéndose en estímulos discriminativos de la conducta del sujeto.
 Capaldi postuló que el nivel de resistencia a la extinción producido por el reforzamiento parcial dependía de dos factores secuenciales:
1. La resistencia a la extinción es más grande cuanto mayor es el número de ensayos reforzados y no reforzados efectuados durante la adquisición.
2. Cuanto mayor es el número de ensayos consecutivos no reforzados antes de recibir la recompensa, más lenta es la extinción de la respuesta operante, porque se intensifica la presencia de la memoria de la experiencia no reforzada.
 En definitiva, la teoría secuencial indica que el condicionamiento de la memoria de la experiencia no reforzada con la respuesta operante en la condición de recompensa parcial, pero no en la de reforzamiento continuo, es el mecanismo responsable de la mayor resistencia a la extinción.
Efecto Patterning
El efecto patterning consiste en la aplicación de un patrón de reforzamiento parcial con secuencias alternativas regulares de ensayos con premio (R) y ensayos de no-premio (N).
Se llama efecto porque en él se invierte el modelo general, y se llama patterning porque se sigue un determinado patrón de reforzamiento. La importancia de este efecto radica en que conlleva la presencia de algún proceso cognitivo, que hace posible la explicación de este fenómeno, que el modelo general de aprendizaje era incapaz de realizar.
El efecto del reforzamiento parcial no se puede explicar sin la presencia de un proceso emocional o cognitivo que interioriza el reforzador, por lo que tampoco se puede explicar el efecto patterning sin ese proceso de interiorización.
Para la teoría de la frustración condicionada de Amsel, lo que ocurre en el efecto patterning es que en los ensayos R, la recompensa produce una expectativa en el animal, los ensayos N producen frustración y la respuesta siguiente a éstas refuerza esa frustración, con lo cual el animal lo aprende, sirviendo en lo sucesivo como estímulos discriminativos de la proximidad del refuerzo.
Para la teoría de la secuencia de Capaldi, si la recompensa sigue a un ensayo N, el animal asociará la memoria de la experiencia no reforzada con la respuesta operante; por lo que la memoria de la conducta operante no reforzada será también la responsable de que los sujetos corran más tras los ensayos N.

APRENDIZAJE OBSERVACIONAL
Se le denomina también aprendizaje por imitación.
En psicología, ha sido conocido como:
 aprendizaje imitativo
 aprendizaje sin ensayo
 aprendizaje vicario
 aprendizaje social
 aprendizaje observacional
El intento de estudio hasta ahora más logrado sobre el aprendizaje observacional es el efectuado por el norteamericano Albert Bandura.
Bandura define el aprendizaje observacional como: “todo fenómeno de aprendizaje que se produce por experiencias directas, puede obtenerse sobre una base vicaria por medio de la observación de la conducta de otra persona, y de las consecuencias que esta conducta ha tenido para ella”.
Para este modelo de aprendizaje es completamente necesaria la presencia de dos elementos fundamentales:
• El modelo: que realiza una determinada conducta.
• El observador: que aprende la conducta realizada por el modelo.
De esta manera, la observación de un modelo produce aprendizaje gracias a la transmisión de información. Durante la exposición de los observadores a la conducta de un modelo, éstos adquieren representaciones simbólicas de las actividades que son modeladas.
Influido por las teorías asociacionistas, Bandura defendió la existencia de la contigüidad como condición necesaria, aunque no suficiente, para que aparezca el aprendizaje. Su teoría es calificada por él mismo como la teoría de la contigüidad mediacional.
Según Bandura, una vez que los estímulos de modelado han sido codificados en imágenes o palabras para su representación en la memoria, funcionan como mediadores para la recuperación, actualización y reproducción de las pautas de conductas modeladas. Por medio de símbolos verbales o icónicos, las personas procesan las experiencias en forma de representaciones que sirven de guías para conductas futuras. De esta manera, sobre la condición de contigüidad mediacional discurren para Bandura dos sistemas de mediación o representación que actúan conjuntamente: 
• El sistema de mediación imaginativo: opera sobre la base de un proceso de condicionamiento sensorial. Señala que durante el periodo de exposición a un modelo, los estímulos presentes, evocan por contigüidad respuestas perceptivas en el observador que son integradas a nivel cortical por la mediación imaginativa, de manera que, tras sucesivas presentaciones, un estímulo dado adquiere la capacidad de evocar imágenes. Esta evocación puede aparecer ante la presencia física de los estímulos pero también ante la sola evocación imaginativa de una de estas imágenes.
• El sistema de mediación verbal: explica, a través de la codificación lingüística-verbal de los fenómenos del comportamiento, la rapidez del aprendizaje observacional en el hombre y la retención a largo plazo de los contenidos modeladores, debido a que permiten contener gran cantidad de información fácilmente almacenable y posibilitan un mayor poder de generalización de respuestas y estímulos.
Para Bandura, las variables cognitivas son más eficaces cuando se convierten en códigos y se repiten, y sobre todo, cuando esos códigos se transforman en unidades que de alguna forma le sean familiares al individuo.
Aparte de la contigüidad y de los dos sistemas mediacionales, en el aprendizaje observacional intervienen unos procesos básicos que ocurren entre los eventos modelados y su reproducción, con complejas interacciones entre ellos y cada uno con el influjo de sus propias variables. Bandura ha señalado cuatro procesos que influyen marcadamente en el grado y contenido del aprendizaje:
• Procesos atencionales: La presentación continuada de estímulos de modelado a un observador, no determina por sí sola la adquisición de la conducta imitativa, ya que el sujeto puede o no prestar atención a estos estímulos o, si se la presta, puede que no perciba los aspectos más relevantes para que se pueda producir la aparición de la respuesta. Por lo que se considera esencial la focalización y el mantenimiento de algún proceso atencional para la adquisición de las conductas imitativas. 
Los procesos atencionales determinan lo que se extrae de la enorme cantidad de influencias que se recibe a través de los modelos.
La adquisición de la conducta imitativa está influenciada por una serie de variables que ejercen un control sobre estos procesos atencionales y que determinan qué estímulos de modelado se observarán y cuáles no.
Las variables que inciden positivamente en el rendimiento del aprendizaje son:
  Con respecto a las propiedades físicas de la estimulación como tal: 
- Intensidad
- Tamaño
- Viveza
- Novedad
  Con respecto a las características del modelo:
- Sexo
- Edad
- Estatus socioeconómico
- Prestigio social
- Competencia
- Experiencia
  Con respecto a las características del observador:
- Edad
- Sexo
- Dependencia
- Autoestima
- Nivel de competencia
- Estatus socioeconómico
- Historia de refuerzo
• Procesos de retención: Estos procesos constituyen la piedra angular en la teoría de Bandura; de acuerdo con esta teoría, para que se puedan aprovechar y reproducir las conductas observadas en un modelo, cuando no esté presente, es necesario que los patrones de conducta se almacenen en la memoria del observador en forma de representaciones simbólicas. Hay dos sistemas de representación o mediación: uno imaginativo y otro verbal.
Las representaciones en imágenes parecen especialmente importantes en niños de corta edad, cuyas habilidades verbales están aún poco desarrolladas y, también, en todas aquellas conductas cuya codificación verbal resulta difícil.
De acuerdo con Bandura, las representaciones simbólicas, tanto las referidas a las imágenes como a las verbales, guían la futura ejecución de la conducta.
Durante la exposición a la estimulación, el observador de una forma activa se dedica a codificar, clasificar y reorganizar los elementos en esquemas familiares con el fin de recordarlos más fácilmente; de esta manera, la codificación simbólica, la repetición mental y la propia ejecución aumentan la retención y eficiencia de lo aprendido.
• Procesos de reproducción motora: Se refieren a la conversión de las representaciones simbólicas en sus correspondientes acciones motoras. Estos procesos, que resultan imprescindibles para la puesta en práctica de las respuestas aprendidas, están relacionados con dos tipos de variables:
  La propia capacidad física de los sujetos.
  Las representaciones simbólicas que guían la reproducción diferida de la conducta.
• Procesos motivacionales: Posibilitan la transformación del aprendizaje en ejecución. Los sujetos no ejecutan todo lo que aprenden. La probabilidad de ejecución de la conducta observada en un modelo, depende de la probabilidad de las consecuencias, si se espera que éstas sean favorables o desfavorables. 
Cuando existen condiciones de incentivo desfavorables sobre la conducta presentada por el modelo, esta conducta, aunque haya sido aprendida y retenida por el observador, es muy difícil que se traduzca en una acción manifiesta; por el contrario, si estos incentivos desfavorables se cambian por incentivos favorables, el aprendizaje se transforma inmediatamente en ejecución. 
La ejecución de una conducta dependerá también de la escala de valores del observador; de esta manera, se adoptará aquello que produce autosatisfacción y se rechazará lo que se desaprueba.


El papel del reforzamiento en el aprendizaje observacional
Bandura considera que el aprendizaje observacional desempeña un papel fundamental tanto en la adquisición como en la ejecución de las conductas de imitación, considera que no es necesario que el reforzamiento se ejecute para que la conducta sea aprendida; en cambio, en el enfoque conductual, el reforzamiento es un requisito indispensable para que haya aprendizaje.
El refuerzo vicario se puede definir como: “Los cambios en la conducta de los observadores en función de la observación de las consecuencias que acompañan a las actuaciones de los modelos”.
Según la naturaleza del estímulo que se utilice para el reforzamiento, el refuerzo vicario puede ser:
• Refuerzo vicario de recompensa: se da cuando se produce un incremento de respuestas imitativas en los observadores, por haber visto cómo la conducta del modelo es recompensada. Este tipo de refuerzo tiene un papel fundamentalmente desinhibidor en las conductas de los observadores.
• Castigo vicario: tiene lugar cuando los observadores presentan una reducción de sus respuestas como resultado de haber observado modelos que padecían consecuencias desagradables. Éste ejerce efectos supresores en las conductas de los observadores.
Las técnicas de modelado en el aprendizaje observacional
Las principales técnicas de modelado más utilizadas son:
• Modelado no participativo: En esta técnica no existe relación entre el modelo y el observador, y éste posee únicamente información de las consecuencias que se derivan de la acción del modelo.
• Modelo participativo: Aquí el modelo, a su vez dispensador de refuerzos, interacciona con el observador. Se comienza presentado repetidamente la conducta a imitar haciendo que por aproximaciones sucesivas se vaya acercando y participando el observador.
Aplicaciones del aprendizaje observacional en humanos
Dentro de la psicología, la aplicación viene definida primero por las investigaciones que se han realizado dentro del aprendizaje observacional, y por su puesta en marcha en los campos aplicados. Dichas investigaciones han seguido, principalmente, dos vertientes diferentes, que han llevado a su vez a la utilización de dos tipos de metodologías distintas:
• Por un lado, están aquellos trabajos referidos al ámbito de la psicología evolutiva.
• Por otro lado, se encuentran las investigaciones enmarcadas dentro de la psicología clínica aplicada que, o bien buscaban la aplicabilidad de las técnicas de modelado para determinar alteraciones conductuales, o bien comparaban su eficacia con otros tipos de tratamientos.
Dentro de la psicología general, podemos afirmar que el aprendizaje observacional debe ser considerado como un modelo principal y a la vez complementario de los otros modelos de aprendizaje, porque puede ser utilizado en ocasiones más adecuadas y evitar algunas dificultades y limitaciones de los condicionamientos clásico y operante.
El aprendizaje observacional debe ocupar un lugar central al estudiar los fenómenos de sociabilización, ya que se encuentra presente en todo tipo de interacción social.

COGNICIÓN ANIMAL
La palabra cognición (derivada del latín cognitîo) que significa conocimiento (acción y efecto de conocer) se utiliza normalmente como sinónimo para describir los procesos del pensamiento. Cotidianamente, consideramos el pensamiento como algo que implica una reflexión voluntaria, deliberada y consciente sobre un asunto concreto; se considera vulgarmente como una forma de hablar consigo mismo.
El concepto de cognición animal se refiere al uso de una representación neuronal, de algunas experiencias pasadas como base para la acción.
Una representación neuronal es un registro interno o mental que puede codificar varias clases de información, como características o estímulos particulares o relaciones entre los estímulos. Una representación interna es un constructo hipotético que no puede investigarse directamente analizando el sistema nervioso, sino que tiene que inferirse a través del estudio de la conducta.
Las investigaciones sobre la cognición animal se centran en el modo en que se forman las representaciones internas, qué aspectos de la experiencia se codifican, cómo se almacena la información y cómo se utiliza posteriormente para guiar la conducta de los animales. La cognición animal pretende estudiar los procesos cognitivos en los animales, como son: la formación de conceptos, el razonamiento, el lenguaje y la memoria, siempre dentro de la psicología del aprendizaje.
Memoria animal
En general se puede decir que el aprendizaje no es posible sin la memoria.
Los procesos de memoria implican tres fases: adquisición, retención y recuperación.
Si en los estudios sobre el aprendizaje lo importante eran las manipulaciones de las condiciones de la adquisición de una conducta, en los estudios sobre la memoria lo importante es la retención por un lado, variando el intervalo de retención para determinar cómo se modifica con el tiempo la disponibilidad de la información adquirida, y por otro, la recuperación de la información almacenada sobre la conducta adquirida.
Con respecto a la retención, los mecanismos de la memoria se han clasificado de diversas maneras en función de lo que se recuerda, es decir, sobre los contenidos de la memoria, y qué cantidad se recuerda o cuál es el intervalo de retención. 
Se entiende por memoria de trabajo, aquella retención que opera cuando se tiene que mantener una información suficiente para completar una tarea.
Se entiende por memoria de referencia, aquella retención a largo plazo necesaria para el uso acertado de la información entrante y recién adquirida.
Con respecto a la recuperación, las investigaciones se han centrado en la memoria de referencia y en los procesos de recuperación, porque la mayoría de los problemas de memoria se deben a un fallo en la recuperación de la información, más que a la pérdida de esa información. Dichos procesos de recuperación son desencadenados por las claves de recuperación o recordatorios, que son eficaces para hacer que se acuerde el sujeto de la experiencia pasada pues están asociadas con la memoria para tal suceso.
Diversas investigaciones con animales se han llevado a cabo para comprobar la facilitación de la recuperación de la memoria mediante tratamientos recordatorios. Dentro de las claves de recuperación, las contextuales son especialmente eficaces para la estimulación de la recuperación de la memoria (Gordon y Klein). Se ha descubierto, utilizando la experimentación con animales, otros tratamientos recordatorios que facilitan el recuerdo, incluyendo la exposición al estímulo incondicionado (MacArdy y Riccio), la exposición al estímulo condicionado reforzado (Gisquet-Verrier y Alexinsky) y la exposición al estímulo condicionado no reforzado que estaba presente durante el entrenamiento (Miller, Jagielo y Spear). Se ha observado que dichos tratamientos aumentan los bajos niveles de respuestas condicionadas que tienen lugar típicamente en los procedimientos de inhibición latente, de ensombrecimiento y de bloqueo.
La memoria espacial o memoria de ubicación de lugares ha sido investigada en el laboratorio con ayuda de complejos laberintos, como el laberinto de los brazos radiales utilizado por Olton y Samuelson. Este laberinto consistía en una zona central, donde se introducía a la rata, de la cual partían ocho brazos radiales, en cada uno de los cuales se colocaba en cada extremo comida; dichos investigadores estudiaban la manera en que la rata situada en el centro del laberinto era capaz de encontrar la comida. A priori, determinaron que la estrategia más eficaz para comer toda la comida en el menor tiempo posible, era visitar uno a uno cada brazo del laberinto entrando sólo una vez en cada brazo, sin repetir dos veces en el mismo; esto es lo que hicieron las ratas del experimento, lo que implicaba que tenían un tipo de memoria espacial que las permitía situarse, moverse y localizar la comida en el laberinto sin equivocarse. A través de las claves espaciales que son estímulos que señalan la ubicación de un objeto en el medio, las ratas del experimento lograron situarse y conseguir la comida (Mazmanian y Roberts). Se ha verificado que la memoria espacial no es permanente pero que puede durar incluso varias horas.
Otra línea de investigación ha señalado la posibilidad de que en las ratas del experimento de Olton se formara un mapa cognitivo o representación mental de cómo estaban dispuestos el laberinto y los recipientes de comida; y a través de la utilización de ese mapa mental podían decidir a qué brazo del laberinto entrar después (Roberts). 
Mediante escalamientos multidimensionales y análisis correlacionales de los errores en una tarea de aprendizaje espacial, Wilkie fue capaz de demostrar que las distancias mentales en una representación espacial corresponden en realidad a espacios físicos.
Además de comprender las clases de información espacial que se incluyen en un mapa cognitivo, también tenemos que entender los aspectos del mapa que los animales tienen en mente a medida que van buscando en el laberinto radial. De esta manera, se sirven de la memoria retrospectiva como estrategia para recordar los sitios en los que ya han estado, y de la memoria prospectiva como estrategia para recordar los brazos del laberinto que todavía deben visitar.

PANORAMA ACTUAL DE LA PSICOLOGÍA DEL APRENDIZAJE
Hoy en día, la psicología del aprendizaje se estudia dentro de dos grandes grupos:
1. En este grupo se encuentran:
• El estudio tradicional del aprendizaje animal o enfoque del análisis experimental de la conducta: se utiliza la experimentación con animales y se estudia, principalmente, la ejecución de la conducta.
• El enfoque del aprendizaje cognitivo animal: ya no se considera el aprendizaje como una mera asociación estímulo-respuesta, sino como el conocimiento de la relación entre estímulos y trata, principalmente, todo lo relacionado con la adquisición de la conducta, estudiando aspecto como la organización y reestructuración del conocimiento y lo que hoy se llama cognición comparada.
2. En este grupo se encuentra:
• La psicología del aprendizaje claramente cognitiva y humana o enfoque del aprendizaje humano y memoria.
• El enfoque de los modelos conexionistas, con una orientación más computacional, en donde se vuelve a dar importancia a la asociación dentro del estudio de la conducta humana. Para estas corrientes conexionistas no se explica el cambio en la conducta por asociación E-R, sino por un cambio en el patrón de redes neurales, y por la modificación de los pesos de las asociaciones de sus elementos.



Psicología General I tema 9 1pp



 


LOS INICIOS DEL CONDICIONAMIENTO INSTRUMENTAL U OPERANTE
  A finales del siglo XIX (19) un psicólogo americano interesado por la conducta en sí, Edgard Thorndike empezó sus trabajos sobre lo que él denominó “aprendizaje por ensayo y error”. Su línea, influido por las teorías evolucionistas de la tradición funcionalista americana, se centró en saber cómo consigue la mente de un organismo adaptarlo a las exigencias de su ambiente.
Su trabajo estuvo influenciado por el estudio de la psicología animal angloamericana que estudiaba e investigaba las capacidades mentales de las distintas especies. Partió de los trabajos de Romanes, amigo de Darwin, y de sus propios trabajos sobre la inteligencia animal en los que observaba ciertos comportamientos en animales de compañía en distintas situaciones, e intentaba reconstruir los procesos mentales intervinientes, para hacer una evaluación de su capacidad intelectual.
  Thorndike decidió estudiar la conducta de los animales en situación de laboratorio para así crear un ambiente controlado al que el animal tuviera que adaptarse. Para la realización de su tesis doctoral diseñó la caja-problema, una especie de jaula de madera con una puerta que el animal podía abrir desde el interior. Diseñó distintos tipos de cajas-problema pero en todas era preciso que el animal maniobrara una cuerda en el interior de la jaula que, a su vez, pasaba por una polea que abría la puerta para poder acceder a un plato de comida situado en el exterior y a la vista del animal.
  Esta situación experimental creada por él, es lo que se conoce como la técnica de ensayos discretos, en la que el sujeto sólo puede emitir una respuesta correcta cada vez que se le introduce en la situación. Thorndike inicialmente interpretó su trabajo de una forma asociacionista.
  Thorndike consideró el aprendizaje de una forma muy simple puesto que lo que se asociaban no eran ideas, sino simplemente situaciones y respuestas. El aprendizaje se explicaba por la conexión entre estímulos presentes en el ambiente y las respuestas del sujeto, y, posteriormente, el reforzamiento lo que hacía era fortalecer esa asociación entre los estímulos de la caja y dicho movimiento, una vez que el animal había realizado la acción de tirar de la cuerda.
  Este planteamiento le llevó a formular la ley del efecto: si una respuesta en presencia de una determinada situación es seguida por un acontecimiento satisfactorio, la asociación entre la respuesta y la situación se fortalece. Si la respuesta es seguida por un acontecimiento insatisfactorio, la asociación se debilita.
Los primeros conductistas (Watson y Guthrie) critican los conceptos mentalistas de esos estados satisfactorios e insatisfactorios empleados por Thorndike y rechazan la ley del efecto, puesto que la conducta podía ser explicada por simple contigüidad.
Treinta años después, Skinner critica el aspecto teórico de la ley del efecto y la reformula como la ley del refuerzo. Skinner demuestra que las consecuencias de nuestra conducta tienen un importante efecto sobre ella y, de esta forma, el sujeto opera en el ambiente.
  Skinner necesitaba un ambiente estructurado para estudiar la conducta operante. Para ello, creó una situación denominada de operante libre en la cuál el animal, una vez puesto en la situación experimental, podía emitir tantas respuestas como deseara, lo que permitía estudiar la conducta de forma continua, siendo, en este caso, el sujeto el que determinaba la frecuencia de aparición de la respuesta y no el experimentador, como ocurría con la técnica de ensayos discretos. Diseñó un dispositivo experimental “caja de Skinner” consistente en una caja oscura resistente al sonido, con una palanca de bronce situada en una pared que cuando se apretaba dispensaba una bolita de comida en un pequeño comedero situado debajo de la palanca. La palanca estaba conectada a un sistema de registro que producía un trazo gráfico del número de presiones que se realizaban. Así, cada vez que se presionaba la palanca, se producía una marca vertical en el registro acumulativo. La consecuencia del reforzamiento inmediato era el aumento de la tasa de emisión de la conducta operante lo que, a su vez, era indicativo del incremento de la probabilidad de la respuesta y que constituía una medida de la fuerza de esa respuesta operante.
  Un registro acumulativo sirve para el almacenamiento continuo de la conducta y consiste en un tambor rotatorio que facilita papel a una velocidad constante. La distancia horizontal en el registro acumulativo es una medida del tiempo transcurrido en la sesión y la pendiente del trazo representa la tasa de respuestas.
  El término de condicionamiento instrumental u operante hace referencia a la situación experimental que se crea para reforzar la conducta. En las situaciones de ensayos discretos se habla de condicionamiento instrumental, ya que la emisión de la respuesta es un instrumento para conseguir el reforzador y sólo se puede conseguir uno en cada sesión. Con la técnica de operante libre, el sujeto opera en el ambiente para conseguir tantos reforzadores como respuestas emita, por lo que se le llama condicionamiento operante. Ambos conceptos hacen referencia a diferentes técnicas.

UN EXPERIMENTO DE CONDICIONAMIENTO OPERANTE
  Un corredor recto o runway es un dispositivo experimental diseñado para trabajar con ratas y consiste en un pasillo de unos dos metros de largo y veinte centímetros de ancho, con las paredes y el suelo de color negro. El corredor tiene tres secciones consecutivas: salida, carrera y meta. En cada una de ellas existe un sensor conectado a un cronometro para controlar el tiempo que tarda en recorrer cada una de las zonas. En la sección de meta hay un comedero con un sensor para dispensar automáticamente una bolita de comida o pellet cuando el animal coloque ahí el hocico. Las tres partes se encuentran separadas entre sí por unas trampillas que se utilizan si se quiere que el animal permanezca en uno de los habitáculos.
  Conforme se ejecute la respuesta de aproximación que se considere correcta en cada momento, se dispensará una bolita de comida que, por su asociación con el sonido del comedero, hará que nuestra rata tienda a repetir esa conducta. Esta técnica se llama técnica de aproximaciones sucesivas o modelamiento y se pretende con ella reforzar las conductas previas de aproximación a la meta que había emitido anteriormente el sujeto experimental, para facilitar así la ejecución de la conducta final.

PARADIGMA DEL CONDICIONAMIENTO OPERANTE
  En todas las situaciones de condicionamiento operante la conducta del sujeto produce algún tipo de consecuencia en el ambiente.
  El término condicionamiento se refiere al proceso en el que la frecuencia de una respuesta viene determinada por las consecuencias que de ella se derivan. De esta forma la probabilidad de la respuesta dependerá de sus efectos, es decir, los acontecimientos ambientales que siguieron a dicha respuesta. Así se establece una relación de contingencia entre la respuesta y sus consecuencias.

  Modelo: E-R → Reforzador

ELEMENTOS DEL CONDICIONAMIENTO OPERANTE
La respuesta operante
Es la que se desea que el sujeto aprenda. 
La respuesta operante puede estar ya en el repertorio de conductas de un individuo y lo que se pretende es que se realice con mayor frecuencia o ante una situación determinada. En este caso el objetivo del condicionamiento es incrementar su probabilidad.
Existen dos técnicas para facilitar la tarea de adquisición de una respuesta:
 El modelado: Consiste en reforzar selectivamente las respuestas próximas a la conducta deseada. A través del refuerzo de las conductas nuevas y el no refuerzo de las ya existentes, lo que se conoce como reforzamiento diferencial, se consigue que se realice la conducta deseada.
 El fraccionamiento de la conducta meta: La conducta solicitada por ser difícil de conseguir, pasa a considerarse el objetivo final y se descompone en una serie de conductas que son más fáciles de lograr por separado. La realización de todas y cada una de esas respuestas sucesivas lleva a la ejecución de la conducta meta.
Thorndike fue el primero en observar las diferencias en la condicionabilidad de diversas respuestas, y propuso el término pertenencia para explicar los fallos en el condicionamiento de determinadas respuestas. Ciertas respuestas están más próximas al repertorio de conductas del sujeto, según la propia historia evolutiva de la especie (filogénesis) o del propio individuo (ontogénesis).
Seligman establece el término preparación para justificar esas diferencias en el aprendizaje de respuestas, que hace depender del grado de preparación evolutiva del animal para aprender la respuesta y las asociaciones requeridas.

El estímulo reforzador
El estímulo reforzador es aquel que se dispensa al sujeto experimental ante la realización de la conducta deseada. Depende de la respuesta y se define por sus efectos. Cualquier estímulo se puede definir como reforzador si aumenta la probabilidad de la respuesta.
Es necesario controlar una serie de variables relacionadas con el reforzador para comprobar que actúe como tal. Una de las variables más importante está en relación con el nivel motivacional del sujeto.
Genéricamente se puede afirmar que la edad, el sexo y la historia previa del sujeto determinarán la eficacia del reforzador.
Existen varias teorías sobre el papel que desempeña el estímulo en el condicionamiento. Las más importantes son:
 La teoría de la probabilidad condicional: 
D. Premack mantiene con su teoría de la probabilidad condicional o principio de Premack; que puede actuar como reforzador cualquier actividad cuya probabilidad de ocurrencia sea mayor que la de la conducta exigida y no sólo un estímulo en sí. Las actividades con alta probabilidad refuerzan las actividades de baja probabilidad.
 La hipótesis de la privación de la respuesta: 
Timberlake y Allison ampliaron la teoría de Premack al comprobar que también podían actuar como reforzadores de conductas más frecuentes aquellas conductas del repertorio del sujeto que ocurrían con menor frecuencia siempre y cuando a los sujetos se les limitara el acceso a esas conductas. Propusieron la hipótesis de la privación de la respuesta en la que se defiende que los programas de refuerzos son principios que gobiernan la actuación más que el aprendizaje en si, y afectan al reparto que un sujeto hace de sus conductas ya adquiridas. Con ello se quería indicar que la conducta no es algo que se pueda manipular independientemente de la voluntad del sujeto, sino, por el contrario, los seres actúan de forma activa y persiguen su adaptación dentro de los límites que establezca el ambiente.
 La teoría de la distribución conductual: 
En posteriores investigaciones estos mismos autores han comprobado que, en condiciones normales, los sujetos emiten el menor número de respuestas contingentes para sacar el máximo provecho a los reforzadores. De esta forma, cualquier actividad se puede convertir en reforzadora de otra, lo que han pasado a denominar teoría de la distribución conductual. Según dicha teoría los organismos hacen una distribución adaptativa de sus actividades y lo que se pretende, durante el condicionamiento, es romper esa distribución para condicionar la realización de una tarea a la ejecución a la que se desea implantar. El sujeto durante el condicionamiento, dentro de la situación que se le impone, pretende llegar a su propia distribución adaptativa.
Este aspecto no era importante para el conductismo, dado que sólo estaba interesado en el análisis de los estímulos y las respuestas.

La situación
La situación en la que se produce el condicionamiento se convierte en un elemento facilitador e instigador al ser una clave contextual de la respuesta operante en sí. Gran parte de la situación se convierte en un estímulo que facilita la discriminación de la situación.
Los estímulos antecedentes indican las consecuencias que tiene una determinada conducta y se denominan estímulos discriminativos, y su efecto es el de alterar la probabilidad de que ocurra la respuesta determinada. El control que ejercen sobre la respuesta dependerá de las consecuencias que siguen a la operante. El reforzador y el estímulo discriminativo están fuertemente vinculados, puesto que su presencia indica si el reforzador está disponible en el caso de emitirse la conducta. Existen dos tipos:
 Los estímulos discriminativos positivos (Ed +) son aquellos eventos que acompañan la respuesta cuando es reforzada.
 Los estímulos discriminativos negativos (Ed -) son aquellos que están presentes cuando la respuesta está siendo sometida a castigo o extinción.
La presencia de un estímulo discriminativo positivo hará más probable la aparición de respuestas que se reforzaron estando ellos presentes; un estímulo discriminativo negativo reducirá la probabilidad o la tasa de respuesta que fueron castigadas en su presencia.
Una situación experimental de reforzamiento es cuando las consecuencias de una conducta hacen que ésta se vuelva a dar ante la misma situación y, por tanto, se consolide. Se han diseñado dos tipos de situaciones experimentales en condicionamiento instrumental ante la respuesta del sujeto:
 De reforzamiento positivo: Se produce cuando la conducta provoca la presencia de un reforzador. Se ha establecido que si el sujeto realiza una determinada respuesta se le dará un reforzador para que esa respuesta se consolide.
 De reforzamiento negativo: Se emplea cuando la emisión de la respuesta tiene como consecuencia que se elimine el reforzador. En este caso el experimento se ha diseñado para que cuando el sujeto emita la respuesta que debe aprender, desaparezca el reforzador.


TIPOS DE REFORZADORES
Se han distinguido fundamentalmente dos tipos de reforzadores:
 Los reforzadores primarios que tienen características innatas de reforzador (comida, caricias, agua). Su valor de incentivo es innato porque reducen algún impulso o necesidad.
 Los reforzadores secundarios, que no tienen características innatas de reforzador, pero que, por condicionamiento clásico, adquieren las características de reforzador por presentarse asociadas a un reforzador primario. Cualquier estímulo neutro puede convertirse en reforzador secundario por presentarse asociado a un primario.
Las variables que determinan la fuerza de un reforzador secundario son:
 La magnitud del reforzador primario al que se ha asociado.
 El número de emparejamientos que se ha producido entre ambos reforzadores. Cuanto mayor número de emparejamientos se hayan establecido, mayor será la fuerza del condicionamiento secundario.
 El tiempo transcurrido entre la presentación de ambos reforzadores. A mayor distanciamiento temporal entre ellos, el reforzador secundario se irá debilitando y perdiendo fuerza.

PROCEDIMIENTOS DEL CONDICIONAMIENTO OPERANTE
Una situación experimental con condicionamiento operante puede clasificarse de acuerdo a dos criterios:
1. Según sea la naturaleza del estímulo reforzador que se dispensa al sujeto por su conducta: el estímulo puede ser de dos tipos:
 Estímulo apetitivo: es un acontecimiento agradable, placentero para el sujeto.
 Estímulo aversivo: es un acontecimiento desagradable e incomodo para el sujeto.
Inicialmente no se puede establecer la naturaleza del estímulo reforzante, sino que dependerá de su efecto sobre la conducta. Una vez establecido el nivel de una conducta, se puede comprobar si aumenta o disminuye tras la presentación de un estímulo determinado, lo que nos indicará si ese estímulo actúa realmente como reforzador.
2. Según la relación que se establezca entre la respuesta del sujeto y el reforzador: la respuesta emitida por el sujeto puede provocar que se dispense el estímulo, que se elimine o que no se presente. Esto tiene que ver con la contingencia o probabilidad de ocurrencia.
Se hablará de una relación de contingencia positiva cuando la respuesta emitida por el sujeto provoca la aparición del reforzador. Por el contrario, estaremos ante una relación de contingencia negativa cuando la respuesta del sujeto provoca la desaparición del reforzador. Una acontigencia se producirá cuando no existe ninguna relación causal entre la respuesta emitida y el reforzador.





 El reforzador es:
 apetitivo aversivo
La respuesta provoca que el reforzador:
 aparezca Recompensa
(contingencia positiva) Castigo
(contingencia positiva)
 desaparezca Omisión
(contingencia negativa) Evitación / escape
(contingencia negativa)

En una situación de reforzamiento se pretende incrementar la probabilidad de una respuesta, el castigo se opone a ello, ya que lo que se pretende es eliminar la respuesta. El castigo es lo contrario al refuerzo.
En la evitación la emisión de la respuesta operante hace que no aparezca el estímulo aversivo, mientras que con el escape la respuesta permite al sujeto escapar de una estimulación aversiva presente.

MEDIDAS DE LA RESPUESTA OPERANTE
Hay distintas formas de medir la respuesta operante, entre ellas se puede destacar dos:
• La tasa de respuesta: es el número de operantes que emite el sujeto en la unidad de tiempo que decida el experimentador, es decir, la frecuencia de emisión de la respuesta. El tiempo que se establezca dependerá de la respuesta con la que se trabaje.
Para considerar que un sujeto ha adquirido una respuesta cuando ya ha alcanzado una tasa previamente establecida, es necesario recordar que la tasa final dependerá del nivel basal de esa conducta previamente a la intervención, es lo que se conoce como nivel operante.
• La latencia: la latencia de la respuesta es el tiempo que transcurre desde que se presenta el estímulo hasta que el sujeto empieza a emitir la respuesta. La reducción de la latencia de la respuesta es un buen indicativo de que la conducta se va adquiriendo. Al igual que ocurre con la tasa, la latencia de la respuesta puede tener distintos márgenes de tiempo en función del grado de complejidad de la tarea.

VARIABLES QUE AFECTAN AL CONDICIONAMIENTO
Las variables que determinan el condicionamiento operante tienen que ver, principalmente, con aquellas que afectan al reforzador.

Cantidad del reforzador
La conducta operante aumenta conforme se incrementa la magnitud o cantidad del estímulo reforzante.
Los cambios en la magnitud o en la calidad del reforzador durante la adquisición de una conducta, provocan cambios en la respuesta de tal forma que producen efectos exagerados en ella. Esto es lo que se conoce como efecto de contraste.
El contraste conductual positivo, también llamado efecto de elación, se denomina al hecho por el que si a un sujeto se le ha entrenado con una magnitud de recompensa determinada y luego ésta se incrementa, la tasa de respuesta aumenta y su latencia disminuye.
El efecto de contraste conductual negativo es conocido igualmente por efecto de depresión, y es el efecto contrario. Si a lo largo del experimento se disminuye la magnitud de la recompensa, los sujetos responden menos o peor.
En cuanto a la calidad del reforzador, se puede admitir que la conducta operante aumenta conforme se incrementa la calidad del reforzador.

Demora
Puede decirse que el aprendizaje es mejor cuando el reforzador se aplica inmediatamente a la realización de la respuesta y, que demoras en el acceso al reforzador retardan la ejecución, debido a que no se establece claramente la asociación entre ambos elementos: operante- reforzador.
En un principio se creyó que la demora en la aplicación del reforzador afectaba tanto a la adquisición de la conducta que, a partir de determinado periodo de tiempo, el aprendizaje se hacía imposible. Posteriormente se ha comprobado que no es exactamente así, dado que en la propia situación experimental aparecen estímulos de marcaje o estímulos marca que actúan como reforzadores secundarios para que se emita la respuesta, aunque no esté el reforzador disponible. Estos reforzadores secundarios sí son contingentes con la respuesta operante, con lo que minimizan los efectos de la demora del reforzador.
Se ha comprobado que la demora del reforzador provoca que se reduzca su valor de incentivo lo que ha venido a llamarse descuento de la demora.
Mazur ha demostrado que el valor incentivo de un reforzador que se ofrece demorado aumenta en una proporción creciente por unidad de tiempo conforme disminuye la demora. El margen de tiempo en el que se cambia el criterio de decisión y se pasa a preferir el reforzador más inmediato, se denomina margen de vulnerabilidad, porque durante ese tiempo se tiene reacciones más impulsivas y menos adaptativas.
En general se puede afirmar que el margen de vulnerabilidad depende de la magnitud y la demora del reforzador, por una parte, y del autocontrol y la impulsividad del sujeto, por la otra.

Detección de casualidad
Cuando se produce un emparejamiento accidental de una conducta con un reforzador, aumenta la probabilidad de que se repita esa respuesta. En este caso no se da contingencia puesto que la respuesta en estas circunstancias no es la causante del reforzador, pero el sujeto los liga y tiende a repetirlo, es lo que se ha denominado conducta supersticiosa.

PROGRAMAS DE REFUERZO
Un programa de refuerzo continuo es aquel en el que la conducta emitida es reforzada en todos los ensayos.
Cuando la ejecución de la conducta no siempre es contingente con el reforzador nos encontramos ante lo que se denomina: programas de refuerzo parcial. Estos se subdividen en dos:
• Programas de refuerzo simple: son aquellos en los que el sujeto sólo debe emitir una respuesta determinada. En estos programas se puede manipular el número de respuestas o se puede programar a un periodo de tiempo. Cuando se ha establecido que el sujeto ejecute la respuesta un número determinado de veces antes de recibir el reforzador, nos encontramos ante un programa de refuerzo de razón. En los programas de razón el sujeto emite la respuesta, y la tiene que repetir hasta que la realice las veces que haya determinado el experimentador para que se reciba el reforzador.
Pero si lo que establecemos es una situación experimental en la que sólo daremos el reforzador cuando haya transcurrido un tiempo determinado, nos encontramos ante un programa de refuerzo de intervalo. En esta situación, el sujeto, aunque ejecute repetidamente la respuesta, sólo tendrá disponible el reforzador ante aquella respuesta pasado el tiempo que se haya establecido previamente y, a partir de ahí, empezará a contar nuevamente otro intervalo de tiempo.
Existen dos clases de programas de razón y de intervalo: 
 Fijo: el número de respuestas o el intervalo de tiempo siempre es el mismo.
 Variable: cambia la cantidad de respuestas o el intervalo exigido para obtener el reforzador.
• Programas de refuerzo compuesto: si el objetivo es que el sujeto emita dos o más respuestas diferentes, o se le someta a varios programas de refuerzo parcial simples diferentes.
Programa de razón fija (RF)
En estos programas se dispensa el reforzador emitidas un número (n) predeterminado de respuestas.
Estos programas producen una tasa de respuesta consistente con una característica, la respuesta se interrumpe temporalmente nada más recibir el reforzador, lo que se denomina pausa post-reforzamiento, pasada esta pausa la respuesta vuelve a emitirse con vigor.
Programa de razón variable (RV)
En estos programas se administra el refuerzo después de un número promedio de respuestas, aquí el número de respuestas que debe emitir el sujeto para obtener el reforzador varía de un ensayo a otro, pero deben alcanzar un promedio. 
En estos programas se produce una tasa de respuesta constante y cuanto más elevado es el número medio de respuestas que debe dar el sujeto para recibir el reforzador, mayor es la tasa de respuestas. En este caso la pausa post-reforzamiento se produce de forma ocasional, por lo que el sujeto emite más respuestas bajo este programa.


Programa de intervalo fijo (IF)
En este programa el reforzador está disponible cuando el sujeto emite la respuesta pasado un periodo de tiempo determinado. Mientras transcurre el intervalo de tiempo el sujeto puede dar la respuesta operante, pero sólo recibirá el reforzador cuando haya pasado el tiempo establecido y emita la respuesta correctamente; a partir de que se emita esa respuesta se empezará a contabilizar el tiempo para administrar el reforzador en el próximo ensayo. A medida que se va adquiriendo una respuesta cuando se trabaja con este programa, el sujeto va aprendiendo la situación, lo que lleva a predecir la aparición del reforzador y provoca que al aproximarse la finalización del plano de tiempo, el sujeto incremente significativamente su tasa de respuestas, lo que se conoce como efecto festoneado, que aumenta con la experiencia, con lo cual conforme se incrementa el intervalo para administrar el reforzador, la pausa de emisión de la respuesta por parte del sujeto también aumenta.

Programa de intervalo variable (IV)
En estos programas se manipula un intervalo de tiempo medio, por lo que varía de un ensayo a otro. La tasa de respuesta en estos programas es estable por lo que no se produce tan claramente el efecto de festoneado. Además la cantidad de respuestas está influida por la duración del intervalo variable: hay menor número de respuestas conforme el intervalo medio sea más largo.

ADQUISICIÓN DE LA RESPUESTA OPERANTE
Procedimientos para instaurar conductas
Se entiende por procedimientos para instaurar conductas a aquellos con los que se pretende aumentar el repertorio de conductas del sujeto y, en este sentido, su conducta será contingente con un reforzador que incremente la probabilidad de ocurrencia de la respuesta.
Condicionamiento de recompensa
En esta situación la respuesta es seguida por una recompensa o premio, lo que llevará al sujeto en los sucesivos ensayos a repetir nuevamente la respuesta, cada vez más rápido o a elevar su tasa, para obtener mayor número de recompensas.
A través del condicionamiento de recompensa no siempre se refuerzan conductas deseables.
Condicionamiento de escape / evitación (refuerzo negativo)
La respuesta del sujeto le permite escapar /evitar el estímulo aversivo. Introducido nuevamente en la situación y a medida que se va adquiriendo la conducta, el sujeto emitirá más rápidamente la respuesta para limitar los efectos de dicho estímulo aversivo. El objetivo de este procedimiento es incrementar una respuesta con el empleo de un estímulo aversivo a través de una contingencia negativa.
La principal diferencia entre una situación de escape y otra de evitación es:
• En una situación de condicionamiento de escape el estímulo aversivo está presente y el sujeto al emitir la respuesta, se le permite terminar con él y dejar de sufrir sus consecuencias.
• En la situación experimental de evitación se hace uso de un estímulo discriminativo que avise de la próxima aparición del estímulo aversivo. Si se emite la respuesta ante el estímulo discriminativo, se huye de la situación y no se llega a producir el reforzador aversivo.
Las principales variables que afectan al condicionamiento de evitación son:
• La intensidad de la estimulación aversiva, de tal forma que a mayor intensidad, mayor adquisición de la respuesta.
• La cantidad de reforzamiento negativo, de manera que si la respuesta del sujeto logra finalizar la estimulación aversiva totalmente, antes se logrará el condicionamiento.
Mowrer propuso la teoría de los dos factores o teoría bifactorial: la conducta de escape se adquiere por una fase de condicionamiento clásico y otra de condicionamiento operante. Inicialmente el sujeto recibe el reforzador aversivo y de esta forma el estímulo discriminativo se condiciona clásicamente a la respuesta de miedo. Así aunque el reforzador no llegue a aparecer posteriormente, el estímulo discriminativo hace las veces de reforzador aversivo por lo que, igualmente, se emitirá la respuesta deseada para escapar del miedo que produce. La respuesta se ve reforzada por la reducción del miedo.
Se ha comprobado que no se puede condicionar cualquier tipo de respuesta de escape, sino que, por el contrario, el organismo muestra reacciones defensivas específicas de la especie, que le llevan a emitirlas ante situaciones de peligro o de amenaza.
Investigaciones posteriores se inclinan a dar una interpretación cognitiva del condicionamiento de escape, incidiendo en las expectativas que crea el sujeto ante la situación. Defienden que la respuesta de evitación sigue dándose aunque el sujeto ya no muestre miedo, puesto que sabe cómo controlar la no aparición del estímulo aversivo. La evitación, por tanto, se produce por las expectativas de actuar que elabora el sujeto ante la situación.

Paradigma de evitación de Sidman 
Sidman diseñó una situación experimental de evitación dónde no se presentaba un estímulo discriminativo, sino que el sujeto podía evitar el estímulo, siempre y cuando emitiese la operante en unas condiciones de tiempo determinadas, de tal forma que la respuesta retrasaba dicho estímulo. El control del tiempo permitía evitar el estímulo y, así, el sujeto aprendía a posponer indefinidamente el reforzador aversivo.

Procedimientos para disminuir conductas
Castigo
Por castigo se entiende aquel procedimiento de condicionamiento operante en el que la emisión de la conducta lleva contingente la aplicación de un estímulo aversivo. Si el sujeto emite la respuesta, recibe el estímulo. El objetivo de este entrenamiento es no emitir una respuesta o la desaparición de la conducta ya existente a través de la disminución de la tasa de respuesta. Este procedimiento se ha llamado también castigo positivo porque es una situación experimental de contingencia positiva. El propósito de este tipo de entrenamiento es suprimir una conducta no deseada; si el castigo es eficaz, disminuirá tanto la probabilidad como la intensidad de la conducta en la que se trabaje.
Skinner demostró que el castigo sólo suprimía la conducta temporalmente pero no la eliminaba.
La mayoría de las investigaciones sobre el castigo se han centrado en las variables que llevan a determinar los resultados del castigo:
• Intensidad del estímulo aversivo: la eficacia del castigo depende de su intensidad, inicialmente se debe aplicar en su máxima intensidad para que sea eficaz.
• Duración del estímulo aversivo: Cuanto más prolongado mayor efecto supresor tiene.
• Consistencia del castigo: Para que sea eficaz siempre se debe administrar el castigo ante la conducta inadecuada, es decir, siempre se debe producir la contingencia. Si no se aplica de forma continua el estímulo aversivo, la respuesta tarda más en suprimirse.
• Efecto de la demora: Para que sea eficaz un castigo debe aplicarse de inmediato. Demoras entre la emisión de la respuesta y la aplicación del estímulo aversivo, producen menor supresión de la respuesta.
• Disponibilidad de una respuesta alternativa: La disponibilidad de una fuente alternativa de reforzamiento aumenta enormemente el efecto supresor del castigo. Es decir, si a la vez que castigamos una respuesta premiamos otra diferente, la probabilidad de ocurrencia de la respuesta castigada, disminuye drásticamente.
• Empleo de un estímulo discriminativo: La situación experimental en la que se emplea u n estímulo de este tipo con anterioridad a la aparición del reforzador, se denomina castigo discriminativo. El sujeto aprende a responder sólo en presencia del estímulo discriminativo, de tal forma que sólo se deja de emitir la respuesta para evitar el estímulo aversivo si se presenta el estímulo discriminativo.
Si se manipulan bien estas variables se podrán controlar los efectos del castigo sobre la supresión de la conducta y de esta manera, el castigo será eficaz. Su mal empleo o su utilización constante provoca ansiedad en el que lo padece. Se ha comprobado que cuando se vive en un ambiente dónde se emplea continuamente el castigo para eliminar conductas, uno se hace finalmente más agresivo.
Cuando se expone a un sujeto a estímulos aversivos de los que no se puede escapar se produce un estado que se denomina indefensión aprendida e induce, fundamentalmente, a que no se sepa responder ante otras situaciones. Genéricamente la indefensión aprendida provoca un retraso en futuros aprendizajes si se reciben previamente contingencias incontrolables o acontingencias (tanto sean estas apetitivas o aversivas). Cuando un sujeto muestra indefensión aprendida se considera incapaz de evitar otras situaciones desagradables y, en general, dar solución a cualquier situación con la que se tenga que enfrentar.



Omisión
En el entrenamiento de omisión el reforzador (un estímulo apetitivo) se pierde al emitir una respuesta determinada. La respuesta provoca que no se obtenga el reforzador o que desaparezca. También se denomina castigo negativo porque se castiga al sujeto retirándole el estímulo apetitivo. Su objetivo es el mismo que el del castigo: suprimir una conducta y en algunas ocasiones se considera una modalidad de él.
Existen varios tipos de omisión:
• El tiempo fuera: se refiere a la pérdida de la oportunidad de obtener el reforzador apetitivo. Durante el periodo de tiempo fuera el reforzador no está disponible.
• Para que el entrenamiento de omisión sea más eficaz no debe quedarse en la retirada del reforzador ante la conducta que se quiere que desaparezca, sino que a la vez se reforzará apetitivamente otra conducta que sea más adaptativa y, por ello, más deseable. Este fenómeno se denomina contracondicionamiento dado que se potencia, a través del reforzamiento, una conducta antagónica a la inicial a la que se conoce como conducta alternativa competidora.
• Con el reforzamiento diferencial de otras conductas (RDO) se establece el reforzar cualquier otra conducta que no sea aquella que se pretende eliminar.

EXTINCIÓN DE LA RESPUESTA OPERANTE
Por extinción se entiende la situación en la que la ejecución de la respuesta no va seguida del reforzador. En los sucesivos ensayos de extinción tanto la intensidad como la tasa de la respuesta operante decrece, su probabilidad disminuye, hasta que llega a desaparecer. En la vida diaria la extinción puede ser tan adaptativa como la adquisición.
Al iniciarse una fase de extinción en la que ya no hay contingencia respuesta-reforzador aparecen una serie de fenómenos:
• El sujeto al principio incrementa tanto su tasa de respuestas como la magnitud de éstas. Este efecto se denomina de distintas maneras: ráfaga, explosión de respuestas…, etc.
• A su vez aparece una reacción emocional intensa de frustración por la falta del reforzador que en muchos casos produce agresividad.
• Durante la extinción la respuesta deja de emitirse, pero esto no quiere decir que la respuesta haya desaparecido completamente, prueba de ello es la recuperación espontánea.
La recuperación espontánea es un fenómeno consistente en que el sujeto vuelve a emitir la respuesta al inicio de un periodo de extinción en el que ya no se recibía el reforzador. Conforme se repiten los ensayos de extinción, la recuperación espontánea se va produciendo más débilmente hasta que deja de producirse.
• Aunque se dé por finalizada una fase de extinción, porque se haya alcanzado los criterios de respuesta previamente establecidos, la respuesta no está totalmente extinguida. Si nuevamente se iniciase un procedimiento de adquisición de esa misma respuesta, comprobaríamos que esta respuesta se adquiere con mayor facilidad en un tiempo menor que el que se empleo para su adquisición; esto es lo que se denomina recondicionamiento.
Variables que afectan a la extinción
La forma de medir la extinción es comprobando las veces que se emite la respuesta cuando no se presenta el reforzador. Se entiende por resistencia a la extinción al número de ensayos en los que se sigue emitiendo la respuesta operante aunque el reforzador no esté presente. Las variables que afectan a la extinción se miden por los efectos que producen en dicha resistencia. Entre ellas, podemos destacar:
• El programa de refuerzo empleado en la fase de adquisición es determinante de la resistencia a la extinción que manifiesta la conducta.
Con programas de refuerzo parcial la extinción se produce más lentamente que con reforzamiento continuo. El reforzamiento intermitente crea mayor resistencia a la extinción. Esto se denomina efecto de refuerzo parcial.
• Si el aprendizaje se ha efectuado en distintos ambientes la extinción es difícil.
• El efecto de la magnitud de la recompensa depende de la cantidad de entrenamiento, de tal forma que a igual magnitud un entrenamiento largo provoca mayor resistencia a la extinción, mientras que un entrenamiento breve produce menor resistencia.
• La demora del reforzador durante la adquisición provoca mayor resistencia a la extinción cuando se han empleado demoras diferentes durante la fase de adquisición. Si siempre se ha utilizado la misma demora, entonces no afecta a la extinción.
Teorías sobre la extinción
Las teorías sobre la extinción vienen a considerarla como un proceso activo en el que el sujeto debe aprender a no responder porque el reforzador no es contingente con su respuesta. 
• Teoría de la inhibición condicionada: Hull postula que la realización de la respuesta provoca una inhibición reactiva similar a la fatiga que reduce la probabilidad de una nueva emisión.
• Teoría del decremento por generalización: defiende que la extinción se produce porque ha desaparecido un estímulo que estaba presente en la adquisición: el reforzador.
• Teoría de la discriminación: mantiene que la extinción tiene lugar por la discriminación de una situación y otra.
La extinción con el empleo de estímulos aversivos
Para emplear un procedimiento de extinción en el condicionamiento de evitación se emplean diferentes técnicas:
• Se presenta el estímulo aversivo aunque el sujeto haya emitido la conducta de escape, es decir, no se interrumpe el reforzador tras la ejecución de la respuesta. En este caso se emplea un castigo para eliminar la respuesta de escape y el sujeto experimental seguirá respondiendo un tiempo, porque el estímulo aversivo propicia la respuesta.
La fuerza de la respuesta de escape durante la adquisición afecta a su extinción y depende del nivel de entrenamiento, de tal forma que a mayor número de ensayos se provocará una extinción más lenta.
• No se presenta el estímulo aversivo y además se impide al sujeto dar la respuesta bien sea porque se inhabilite el aparato que tiene que usar para dar la respuesta, o porque se sujete al sujeto para que no pueda ejecutarla. Este procedimiento se denomina inundación o inhabilitación de la respuesta. La variable que más afecta a este procedimiento de extinción es la exposición forzada al estímulo discriminativo de tal forma que a mayor exposición, mayor extinción. Con este procedimiento es con el que se consigue que se alcance antes la extinción.

CONTROL DE LOS ESTÍMULOS SOBRE LA CONDUCTA
En un condicionamiento operante intervienen tres elementos que vienen a determinarlo: la respuesta, el estímulo y la situación. De esta forma los estímulos ambientales que están presentes cuando se desencadena la respuesta ejercen un fuerte control sobre la conducta operante.
La situación en la que se produce una conducta juega un importante papel para la adaptación del individuo a su ambiente, por lo que una conducta adecuada en un momento determinado puede no serlo en otro.
Discriminación
Las investigaciones se centran en estudiar qué estímulos de toda la situación ambiental son los que controlan la conducta. Se ha llegado a la conclusión de que si un sujeto responde de una forma ante un estímulo y de otra manera ante otro estímulo se puede afirmar que su respuesta está bajo el control de esos estímulos siempre y cuando se responda de forma diferencial y se presente esa misma situación.
Generalización
La generalización se opone a la discriminación y se entiende que se produce cuando el sujeto no responde de forma diferencial a estímulos distintos o, lo que es lo mismo, el sujeto responde del mismo modo ante estímulos diferentes.
• La generalización del estímulo: para estudiar el nivel de generalización se utiliza un estímulo en una situación experimental que se varía en alguno de sus aspectos y se comprueba si el sujeto responde igualmente ante él.
• El gradiente de generalización: es la representación gráfica de la fuerza de la respuesta producida por distintos estímulos, que varía en cuanto a su grado de semejanza con el estímulo asociado con el entrenamiento. El gradiente de generalización del estímulo nos indica el control de la conducta por el estímulo, ya que facilita información sobre lo sensible que es la respuesta a las variaciones del estímulo.
La adquisición del lenguaje se realiza a través de una combinación de procesos de generalización y discriminación.

TEORÍAS EXPLICATIVAS DEL CONDICIONAMIENTO OPERANTE
El reforzador como un estímulo
Thorndike pensaba que el aprendizaje se produce porque un estímulo agradable es contingente con la emisión de una respuesta por lo que la fortalece y se incrementa su probabilidad de emisión en el futuro.
Placentero es aquello que reduce un estado de pulsión: el sujeto da la respuesta porque ello conlleva el acceso al estímulo reforzante que lo es porque reduce el nivel de pulsión del organismo.
La teoría de la reducción del impulso: Hull mantiene que el aprendizaje se produce porque el sujeto da la respuesta para alcanzar el reforzador, y así equilibrar su nivel de pulsión que se había visto desequilibrado por la deprivación a la que había sido sometido el animal. El impulso se define como un estado del organismo que surge de una necesidad biológica.
Investigaciones posteriores comprueban que la reducción del impulso no es suficiente para explicar el condicionamiento y empiezan a centrarse en el estímulo en sí, y no en sus efectos sobre el organismo. Estas teorías estudian el carácter de incentivo del reforzador y se dedican a estudiar la influencia de diversas variables del reforzador sobre la respuesta (su demora, magnitud, etc.…).
Los estudios de Olds y Milner se centraron en los efectos fisiológicos de los reforzadores y las áreas cerebrales que se activan. Con sus trabajos sobre autoestimulación intracraneala demostraron que existe un sustrato fisiológico común a todos los reforzadores (un ejemplo son los trabajos para trazar mapas de las diversas áreas del cerebro).
El reforzador como una respuesta
Dentro de las teorías del reforzador como respuesta se encuentran aquellas que consideran la respuesta que se emite ante el reforzador. 
La teoría de la respuesta consumatoria postula que el reforzamiento no está en el estímulo sino en el hecho de realizar la respuesta consumatoria propia de la especie ante el reforzador. 
La teoría de la probabilidad condicional de Premack postula que puede actuar como reforzador cualquier actividad cuya probabilidad de ocurrencia sea mayor que la de la conducta exigida y no sólo un estímulo en sí.
El reforzador como regulador conductual
Las teorías que consideran el reforzador como un regulador conductual se centran en las condiciones que regulan la conducta dejando de lado los aspectos internos. El reforzamiento es una forma de seleccionar respuestas concretas del repertorio del sujeto en un momento y lugar determinado. Skinner decía que sólo hay que estudiar los estímulos y las contingencias que producen.
La hipótesis de la privación de respuestas: Timberlake y Allison. Esta hipótesis defiende que los programas de refuerzo son principios que gobiernan la actuación más que el aprendizaje en sí y afectan al reparto que un sujeto hace de sus conductas ya adquiridas. Esto quiere decir que la conducta no es algo que se pueda manipular independientemente de la voluntad del sujeto, sino que, al revés, los seres actúan de forma activa y persiguen su adaptación dentro de los límites que establece el ambiente.
Los principios que explican la economía se han aplicado al análisis del condicionamiento operante para identificar los factores que influyen en la forma en que un programa de refuerzo reasigna la conducta. Este enfoque denominado enfoque económico de la regulación conductual parte de que los cambios en la conducta se producen para maximizar algo; lo importante es identificar qué es lo que los organismos valoran y se afanan por conservar. La conducta operante no se debe estudiar aisladamente sino, por el contrario, el organismo debe entenderse como un sistema por lo que los cambios en una parte del sistema afectan a las otras partes.


viernes, 19 de junio de 2009

Freud, Los actos obsesivos y las prácticas religiosas

LOS ACTOS OBSESIVOS Y LAS PRÁCTICAS RELIGIOSAS
(Zwangshandlungen un Religionsübungen)
1907

No soy seguramente el primero en haber advertido la analogía entre los llamados
actos obsesivos de los neuróticos y las prácticas devotas con las que el creyente
atestigua su piedad. Prueba de ello es el nombre de «ceremoniales» dado a
algunos de tales actos obsesivos. Pero, a mi juicio, tal analogía no es meramente
superficial; y así, basándonos en el conocimiento de la génesis del ceremonial
neurótico, podemos arriesgar algunas conclusiones, por analogía, sobre los
procesos psíquicos de la vida religiosa.
Las personas que realizan actos obsesivos o desarrollan un ceremonial
pertenecen, junto con aquellas que sufren de representaciones o impulsos
obsesivos, a una unidad clínica especial, designada habitualmente con el nombre
de «neurosis obsesiva1». Mas no ha de pretenderse derivar de tal denominación la
peculiaridad de esta dolencia, pues en rigor también otros distintos fenómenos
psicopatológicos presentan el llamado «carácter obsesivo». En lugar de una
definición hemos de ofrecer aún, por ahora, el conocimiento detallado de dichos
estados, ya que no se ha logrado todavía descubrir el carácter distintivo de la
neurosis obsesiva, el cual yace probablemente en estratos muy profundos, aun
cuando su existencia parece evidenciarse en todas las manifestaciones de la
enfermedad.
El ceremonial neurótico consiste en pequeños manejos, adiciones, restricciones y
arreglos puestos en práctica, siempre en la misma forma o con modificaciones
regulares, en la ejecución de determinados actos de la vida cotidiana. Tales
manejos nos producen la impresión de meras «formalidades» y nos parecen faltos
de toda significación. Así, aparecen también a los ojos del enfermo, el cual se
muestra, sin embargo, incapaz de suspender su ejecución, pues toda infracción del
ceremonial es castigada con una angustia intolerable que le obliga en el acto a
rectificar y a desarrollarlo al pie de la letra. Tan nimias como los actos ceremoniales
mismos son las situaciones y las actividades que el ceremonial complica dificulta y
retrasa, por ejemplo, el vestirse y el desnudarse, el acostarse y la satisfacción de
las necesidades somáticas. El desarrollo de un ceremonial puede describirse
exponiendo aquella serie de leyes no escritas a las que se adapta fielmente.
1 Cf. Löwenfeld: Die psychischen Zwangsercheinungen, 1904.
Librodot Los actos obsesivos y las practices religiosas Sigmund Freud
Veamos, por ejemplo, un ceremonial concomitante con el acto de acostarse: el
sujeto ha de colocar la silla en una posición determinada al lado de la cama y ha de
poner encima de ella sus vestidos, doblados en determinada forma y según cierto
orden; tiene que remeter la colcha por la parte de los pies y estirar perfectamente
las sábanas; luego ha de colocar las almohadas en determinada posición y adoptar
él mismo, al echarse, una cierta postura; sólo entonces podrá disponerse a
conciliar el sueño. En los casos leves, el ceremonial parece tan sólo la exageración
de un orden habitual y justificado. Pero la extremada minuciosidad de su ejecución
y la angustia que trae consigo su omisión dan al ceremonial un carácter de «acto
sagrado». Por lo general el sujeto soporta mal cualquier postergación del mismo y
excluye la presencia de otras personas durante su ejecución. Toda actividad
puede convertirse en acto obsesivo, en el más amplio sentido, cuando resulta
complicada por pequeñas adiciones o adquiere un ritmo constante por medio de
pausas y repeticiones. No se esperará hallar una delimitación precisa entre el
«ceremonial» y los «actos obsesivos». En su mayor parte, los actos obsesivos
proceden de un ceremonial. Con ambos forman el contenido de la enfermedad las
prohibiciones y los impedimentos (abulias), que, en realidad, no hacen más que
continuar la obra de los actos obsesivos en cuanto hay cosas que el paciente
encuentra prohibitivo hacer y otras que sólo ateniéndose a un ceremonial prescrito
puede ejecutar.
Es singular que tanto la obsesión como las prohibiciones (tener que hacer lo uno,
no debe hacer lo otro) recaigan tan solo, al principio, sobre las actividades solitarias
del hombre y dejen intacta, a través de muchos años, su conducta social,
circunstancia por la que estos enfermos pueden considerar durante mucho tiempo
su enfermedad como un asunto estrictamente particular y ocultarlo totalmente. Así,
el número de personas que padecen estas formas de neurosis obsesivas es mucho
mayor del que llega a conocimiento de los médicos. La ocultación se hace,
además, más fácil a muchos enfermos, por cuanto son perfectamente capaces de
cumplir sus deberes sociales durante una parte del día, después que han
consagrado, en soledad, un cierto número de horas a sus misteriosos manejos. No
es difícil apreciar en qué consiste la analogía del ceremonial neurótico con los
actos sagrados del rito religioso. Consiste en el temor que surge en la conciencia
en caso de omisión, en la exclusión total de toda otra actividad (prohibición de la
perturbación) y en la concienzuda minuciosidad de la ejecución. Pero también son
evidentes las diferencias, algunas de las cuales resaltan con tal fuerza, que hacen
sacrílega la comparación. Así son en su gran diversidad individual los actos
ceremoniales frente a la estereotipia del rito y el carácter privado de los mismos
frente a la publicidad y la comunidad de las prácticas religiosas. Pero sobre todo el
hecho de que los detalles del ceremonial religioso tienen un sentido y una
significación simbólica la diferencia de los del ceremonial neurótico, que parecen
insensatos y absurdos. La neurosis obsesiva representa en este punto una
caricatura, a medias cómica y triste a medias, de una religión privada. Sin
embargo, precisamente esta diferencia decisiva entre el ceremonial neurótico y el
ceremonial religioso desaparece en cuanto la técnica de investigación
psicoanalítica nos facilita la comprensión de los actos obsesivos. Esta investigación
desvanece por completo la apariencia de que los actos obsesivos son insensatos y
absurdos y nos revela el fundamento de tal apariencia. Averiguamos que los actos
Librodot Los actos obsesivos y las practices religiosas Sigmund Freud
obsesivos entrañan en sí y en todos sus detalles un sentido, se hallan al servicio de
importantes intereses de la personalidad y dan expresión y vivencias cuyo efecto
perdura en la misma y a pensamientos cargados de afectos. Y esto de dos
maneras distintas: como representaciones directas o como representaciones
simbólicas, debiendo, por tanto, ser interpretadas históricamente en el primer caso
y simbólicamente en el segundo. Expondremos algunos ejemplos destinados a
ilustrar esta afirmación. A las personas familiarizadas ya con los resultados de la
investigación psicoanalítica de las psiconeurosis no les sorprenderá leer que lo
representado por medio de los actos obsesivos o el ceremonial se derivan de la
experiencia más íntima del sujeto, sobre todo de su experiencia sexual.
a) Una joven, sometida a observación por mí, padecía la obsesión de dar varias vueltas con
la palangana llena en las manos inmediatamente después de lavarse. La significación de
este acto ceremonial yacía en el proverbio según el cual no se debe tirar el agua sucia
antes de tener otra limpia. El acto tenía por objeto amonestar a una hermana suya y
retenerla de separarse de su marido, poco grato, antes de haber entablado relaciones con
otro hombre mejor.
b) Una mujer que vivía separada de su marido obedecía en sus comidas a la obsesión de
dejar lo mejor. Así, de un pedazo de carne asada tomaba tan sólo los bordes. Esta
renuncia quedó explicada por la fecha de su misma génesis. Había surgido, en efecto, al
día siguiente de haber notificado a su marido la separación de cuerpos; esto es, de haber
renunciado a lo mejor.
c) Esta misma paciente no podía sentarse más que en un sillón determinado y le costaba
mucho trabajo levantarse de él. El sillón era para ella, a causa de ciertos detalles de su
vida conyugal, un símbolo de su marido, al cual se mantenía fiel.
Como explicación de su obsesión halló la frase siguiente:
{¡Es tan difícil separarse de algo (hombre, sillón) en el que ha estado una sentada!}
d) También solía repetir, durante un cierto tiempo, un acto obsesivo, especialmente singular
y absurdo. Iba de un cuarto a otro en cuyo centro había una mesa, disponía de cierto
modo el tapete que la cubría, llamaba a la criada, arreglándoselas de manera que se
acercara a la mesa, y la despedía luego con una orden cualquiera. En sus esfuerzos para
explicar esta obsesión se le ocurrió que el tapete de la mesa tenía una mancha de color
subido, y que ella lo colocaba todas las veces de tal modo, que la criada lo viera
necesariamente. Todo ello era la reproducción de una vivencia de su historia conyugal
que había planteado ulteriormente un problema a su pensamiento. Su marido había
sufrido en la noche de bodas un percance que no es, por cierto, nada raro. Se había
encontrado impotente y «había venido varias veces, en el transcurso de la noche, desde su
cuarto al de ella» para renovar sus tentativas de consumar el matrimonio. Por la mañana
manifestó su temor de que la camarera del hotel sospechara, al hacer las camas, lo que le
había ocurrido, y para evitarlo, cogió un frasquito de tinta roja y vertió parte de su
contenido en la sábana; pero tan torpemente, que la mancha encarnada quedó en un lugar
poco apropiado para su propósito. La paciente jugaba, pues, a la noche de novios con su
acto obsesivo. La mesa y la cama fueron conjuntamente el símbolo del matrimonio.
e) Otra de sus obsesiones, la de apuntar el número de los billetes de Banco antes de
desprenderse de ellos, tenía también una explicación histórica. En la época en que
abrigaba ya el propósito de separarse de su marido si encontraba otro hombre más digno
de su confianza, se dejó hacer la corte, durante su estancia en un balneario, por un señor
Librodot Los actos obsesivos y las practices religiosas Sigmund Freud
que le agradaba, pero del que no sabía con seguridad si estaría dispuesto a casarse con
ella.
Un día, no teniendo dinero suelto, le pidió que le cambiara una moneda de cinco
coronas. Así lo hizo él y manifestó galantemente que no se desprendería ya jamás
de aquella moneda que había pasado por sus bellas manos. En ocasiones
sucesivas se sintió esta señora tentada de pedirle que le enseñara la moneda
como para convencerse de que podía dar crédito a sus galanterías. Pero no lo hizo
pensando razonablemente en la imposibilidad de distinguir entre sí monedas del
mismo valor.
La duda permaneció, pues, en pie y dejó tras de sí la obsesión de apuntar los
números de los billetes de Banco, por los cuales se distingue individualmente cada
billete de los demás de igual valor.
Estos pocos ejemplos, extraídos de la copiosísima colección por mí reunida,
tienden a explicar exclusivamente la tesis de que los actos obsesivos entrañan, en
todos sus detalles, un sentido y son susceptibles de interpretación. Lo mismo
puede afirmarse del ceremonial propiamente dicho, pero la demostración exigía
mayor espacio. No se me oculta en modo alguno hasta qué punto la explicación de
los actos obsesivos parece alejarnos del círculo de ideas de tipo religioso. Entre
las condiciones de la enfermedad figura la de que la persona que obedece a la
obsesión realice los actos correspondientes sin conocer la significación de los
mismos, por lo menos su significación capital. Sólo el tratamiento psicoanalítico
hace surgir en su conciencia el sentido del acto obsesivo y los motivos impulsores.
Decimos, por tanto, que el acto obsesivo sirve de expresión a motivos y
representaciones inconscientes, lo cual parece entrañar una nueva diferencia con
respecto a las prácticas religiosas; pero hemos de pensar que también el individuo
devoto desarrolla generalmente el ceremonial religioso sin preguntar su
significación, en tanto que el sacerdote y el investigador sí conocen, desde luego,
el sentido simbólico del rito. Pero los motivos que impulsan a la práctica religiosa
son desconocidos a todos los creyentes o quedan representados en su conciencia
por motivos secundarios interpuestos.
El análisis de los actos obsesivos nos ha procurado ya un atisbo de la causa de los
mismos y de la concatenación de sus motivos. Puede decirse que el sujeto que
padece obsesiones y prohibiciones se conduce como si se hallara bajo la
soberanía de una conciencia de culpabilidad, de la cual no sabe, desde luego, lo
más mínimo. Trátese, pues, de una conciencia inconsciente de culpa2, por
contradictorios que parecen los términos de semejante expresión. Esta conciencia
de culpabilidad tiene su origen en ciertos acontecimientos psíquicos precoces, pero
encuentra una renovación constante en la tentación reiterada en cada ocasión
reciente y engendra, además, una expectación angustiosa que acecha de continuo
una expectación de acontecimientos desgraciados, enlazada, por el concepto del
castigo, a la percepción interior de la tentación.
Al principio de la formación del ceremonial, el enfermo tiene aún conciencia de que
ha de hacer necesariamente esto o aquello si no quiere que le ocurra una
desgracia, y por lo regular, todavía se hace presente a su conciencia cuál es la
2 Strachey comenta que ésta sería la primera aparición explícita del término ‘consciencia inconsciente de
culpa’.
Librodot Los actos obsesivos y las practices religiosas Sigmund Freud
desgracia temida. La relación, siempre demostrada, entre la ocasión en la que
surge la angustia expectante y el contenido con el cual amenaza, se oculta ya al
enfermo. Así, pues, el ceremonial se inicia como un acto de defensa o de
aseguramiento, como una medida de protección.
A la conciencia de culpabilidad de los neuróticos obsesivos corresponden la
convicción de los hombres piadosos de ser, no obstante la piedad, grandes
pecadores, y las prácticas devotas (rezos, jaculatorias, etc.), con las que inician sus
actividades cotidianas y especialmente toda empresa inhabitual, parece entrañar el
valor de medidas de protección y defensa.
Considerando el hecho primero en que se basa la neurosis obsesiva, logramos una
visión más profunda de sus mecanismos. Tal hecho es siempre la represión de un
impulso instintivo3 (de un componente del instinto sexual) que se hallaba integrado
en la constitución del sujeto; pudo exteriorizarse durante algún tiempo en la vida
infantil del mismo y sucumbió luego a la represión. Ésta crea una vigilancia
especial de la conciencia, orientada hacia los fines de dicho instinto; pero tal
vigilancia, producto psíquico de la reacción al mismo, no se considera segura, sino,
muy al contrario, amenazada de continuo por el instinto que acecha en lo
inconsciente.
La influencia del instinto reprimido es percibida como tentación, y en el curso
mismo del proceso de represión nace la angustia, la cual se apodera del porvenir
bajo la forma de angustia expectante. El proceso de represión que conduce a la
neurosis obsesiva es, por tanto, un proceso imperfectamente cumplido y que
amenaza fracasar cada vez más. Resulta así comparable a un conflicto sin
solución, pues son necesarios de continuo nuevos esfuerzos psíquicos para
equilibrar la presión constante del instinto.
Los actos ceremoniales y obsesivos nacen así, en parte, como defensa contra la
tentación, y en parte, como protección contra la desgracia esperada. Pronto los
actos protectores no parecen ya suficientes contra la tentación, y entonces surgen
las prohibiciones, encaminadas a alejar la situación en que la tentación se produce.
Vemos, pues, que las prohibiciones constituyen a los actos obsesivos, del mismo
modo que una fobia está destinada a evitar al sujeto un ataque histérico. Por otra
parte, el ceremonial representa la suma de las condiciones bajo las cuales resulta
permitido algo distinto, aún no prohibido en absoluto, del mismo modo que la
ceremonia nupcial de la Iglesia significa para el creyente el permiso del placer
sexual, considerado, si no, como pecado. AI carácter de la neurosis obsesiva, así
como al de todas las afecciones análogas, pertenece también el hecho de que sus
manifestaciones (sus síntomas, y entre ellos, también los actos obsesivos) llenan
las condiciones de una transacción entre los poderes anímicos en pugna. Traen así
consigo de nuevo algo de aquel mismo placer que están destinadas a evitar y
sirven al instinto reprimido no menos que las instancias que lo reprimen. E incluso
sucede que al progresar la enfermedad los actos primitivamente encargados de la
defensa van acercándose cada vez más a los actos prohibidos, en los cuales el
instinto pudo manifestarse lícitamente en la época infantil.
3 Triebregung: literalmente (moción pulsional); según Strachey es la primera aparición publicada de este
concepto tan ampliamente empleado por Freud.
Librodot Los actos obsesivos y las practices religiosas Sigmund Freud
De estas circunstancias hallaríamos también en los dominios de la vida religiosa lo
que sigue: La génesis de la religión parece estar basada igualmente en la renuncia
a determinados impulsos instintivos; mas no se trata, como en la neurosis,
exclusivamente de componentes sexuales, sino de instintos egoístas, antisociales,
aunque también éstos entrañen, por lo general, elementos sexuales. La conciencia
de culpabilidad consecutiva a una tentación inextinguible y la angustia expectante
bajo la forma de temor al castigo divino se nos ha dado a conocer mucho antes en
los dominios religiosos que en los de la neurosis. Quizá a causa de los
componentes sexuales entremezclados, o acaso a consecuencia de cualidades
generales de los instintos, también en la vida religiosa resulta insuficiente y nunca
perfecta la represión de los instintos. Las recaídas en el pecado son incluso más
frecuentes en el creyente que en el neurótico y sirven de base a un nuevo orden de
actividades religiosas: a los actos de penitencia, cuyo paralelo encontraremos
también en la neurosis obsesiva.
La neurosis obsesiva presenta un carácter peculiarismo que la despoja de toda
dignidad. Y es el hecho de que el ceremonial se adhiere a los actos más nimios de
la vida cotidiana y se manifiesta en prescripciones insensatas y en restricciones
absurdas de los mismos. Este rasgo singular de la enfermedad se nos hace
comprensible cuando averiguamos que el mecanismo del desplazamiento psíquico,
descubierto por mí en la producción de los sueños4, preside también los procesos
anímicos de la neurosis obsesiva. En los ejemplos de actos obsesivos antes
expuestos se hace ya visible cómo el simbolismo y el detalle de tales actos nacen
por medio de un desplazamiento desde el elemento auténtico e importante a un
sustitutivo nimio; por ejemplo, desde el marido al sillón. Esta tendencia al
desplazamiento es la que modifica cada vez más el cuadro de los fenómenos
patológicos y logra, por fin, convertir lo aparentemente más nimio en lo más
importante y urgente. Es innegable que en el terreno religioso existe también una
tendencia análoga al desplazamiento del valor psíquico, y precisamente en igual
sentido; de suerte que el ceremonial, puramente formal, de las prácticas religiosas
se convierte poco a poco en lo más esencial y da de lado su contenido ideológico.
Por eso las religiones sufren reformas que se esfuerzan en establecer los valores
primitivos.
A primera vista, los actos religiosos no parecen entrañar aquel carácter
transaccional que los actos obsesivos integran como síntomas neuróticos, y, sin
embargo, también acabamos por descubrir en ellos tal carácter cuando recordamos
con cuánta frecuencia son realizados, precisamente en nombre de la religión y en
favor de la misma, todos aquellos actos que la misma prohíbe como
manifestaciones de los instintos por ella reprimidos. Después de señalar estas
coincidencias y analogías podríamos arriesgarnos a considerar la neurosis
obsesiva como la pareja patológica de la religiosidad; la neurosis, como una
religiosidad individual, y la religión, como una neurosis obsesiva universal. La
coincidencia más importante sería la renuncia básica a la actividad de instintos
constitucionalmente dados, y la diferencia decisiva consistiría en la naturaleza de
tales instintos, exclusivamente sexuales en la neurosis y de origen egoísta en la
religión.
4 Cf. La interpretación de los sueños (1900), capítulo VI.
Librodot Los actos obsesivos y las practices religiosas Sigmund Freud
La renuncia progresiva a instintos constitucionales, cuya actividad podría aportar al
yo un placer primario, parece ser uno de los fundamentos del desarrollo de la
civilización humana. Una parte de esta represión de instintos es aportada por las
religiones haciendo que el individuo sacrifique a la divinidad el placer de sus
instintos. «La venganza es mía», dice el Señor. En la evolución de las religiones
antiguas creemos advertir que mucha parte de aquello a lo que el hombre había
renunciado como «pecado» fue cedido a la divinidad y estaba aun permitido en
nombre de ella, siendo así la cesión a la divinidad el camino por el cual el hombre
hubo de liberarse del dominio de los instintos perversos, antisociales. No es quizá,
por tanto, una casualidad que a los dioses antiguos se les reconocieran, sin
limitación alguna, todas las cualidades humanas -con los crímenes a ellas
consecutivos-, ni tampoco una contradicción, el que a pesar de ello no fuera lícito
justificar con el ejemplo divino los crímenes propios.
Viena, febrero 1907