base de conocimiento
CTRL+F para buscar su palabra clave

Sistema de recompensas

El sistema de recompensas es un grupo de estructuras neuronales responsables de la prominencia de incentivos (es decir, motivación y "querer", deseo o ansia de una recompensa), aprendizaje asociativo (principalmente refuerzo positivo y condicionamiento clásico) y emociones positivamente valeradas, particularmente que implican el placer como un componente central (por ejemplo, alegría, euforia y éxtasis). La recompensa es la propiedad atractiva y motivadora de un estímulo que induce un comportamiento apetitivo, también conocido como comportamiento de aproximación y comportamiento consumatorio. En su descripción de un estímulo gratificante (es decir, "una recompensa"), una revisión sobre la neurociencia de recompensa señaló, "cualquier estímulo, objeto, evento, actividad o situación que tenga el potencial de hacernos acercarnos y consumirlo es, por definición, un recompensa." En el condicionamiento operante, los estímulos gratificantes funcionan como reforzadores positivos; sin embargo, la afirmación inversa también es cierta: los reforzadores positivos son gratificantes.

Las recompensas primarias son una clase de estímulos gratificantes que facilitan la supervivencia de uno mismo y de la descendencia, e incluyen recompensas homeostáticas (por ejemplo, alimentos sabrosos) y reproductivas (por ejemplo, contacto sexual e inversión parental). Las recompensas intrínsecas son recompensas incondicionadas que son atractivas y motivan el comportamiento porque son inherentemente placenteras. Las recompensas extrínsecas (por ejemplo, dinero o ver al equipo deportivo favorito de uno ganar un juego) son recompensas condicionadas que son atractivas y motivan el comportamiento, pero no son inherentemente placenteras. Las recompensas extrínsecas derivan su valor motivacional como resultado de una asociación aprendida (es decir, condicionamiento) con recompensas intrínsecas. Las recompensas extrínsecas también pueden provocar placer (por ejemplo, la euforia de ganar mucho dinero en una lotería) después de estar condicionado clásicamente con recompensas intrínsecas.

La supervivencia para la mayoría de las especies animales depende de maximizar el contacto con estímulos beneficiosos y minimizar el contacto con estímulos nocivos. La cognición de recompensa sirve para aumentar la probabilidad de supervivencia y reproducción al provocar un aprendizaje asociativo, provocar un enfoque y un comportamiento consumatorio, y desencadenar emociones con valor positivo. Por lo tanto, la recompensa es un mecanismo que evolucionó para ayudar a aumentar la aptitud adaptativa de los animales.

Definición

En neurociencia, el sistema de recompensa es una colección de estructuras cerebrales y vías neuronales que son responsables de la cognición relacionada con la recompensa, incluido el aprendizaje asociativo (principalmente el condicionamiento clásico y el refuerzo operante), la prominencia de incentivos (es decir, motivación y "querer", deseo o ansia de una recompensa) y emociones positivamente valeradas, particularmente emociones que involucran placer (es decir, "gusto" hedónico).

Los términos que se usan comúnmente para describir el comportamiento relacionado con el componente "querer" o deseo de la recompensa incluyen comportamiento apetitivo, comportamiento de aproximación, comportamiento preparatorio, comportamiento instrumental, comportamiento anticipatorio y búsqueda. Los términos que se usan comúnmente para describir el comportamiento relacionado con el componente "gusto" o placer de la recompensa incluyen el comportamiento consumatorio y el comportamiento de toma.

Las tres funciones principales de las recompensas son su capacidad para:

  1. producir aprendizaje asociativo (es decir, condicionamiento clásico y refuerzo operante);
  2. afectar la toma de decisiones e inducir el comportamiento de aproximación (mediante la asignación de prominencia motivacional a estímulos gratificantes);
  3. provoca emociones positivamente valeradas, particularmente placer.

Anatomía

Las estructuras cerebrales que componen el sistema de recompensa se ubican principalmente dentro del asa cortico-basal ganglio-tálamo-cortical; La porción de los ganglios basales del bucle impulsa la actividad dentro del sistema de recompensa. La mayoría de las vías que conectan las estructuras dentro del sistema de recompensa son las interneuronas glutamatérgicas, las neuronas espinosas medianas GABAérgicas (MSN) y las neuronas de proyección dopaminérgicas, aunque otros tipos de neuronas de proyección contribuyen (por ejemplo, neuronas de proyección orexinérgicas). El sistema de recompensa incluye el área tegmental ventral, el cuerpo estriado ventral (es decir, el núcleo accumbens y el tubérculo olfatorio), el cuerpo estriado dorsal (es decir, el núcleo caudado y el putamen), la sustancia negra (es decir, la parte compacta y la parte reticular), la corteza prefrontal, corteza cingulada anterior, corteza insular, hipocampo, hipotálamo (particularmente, el núcleo orexinérgico en el hipotálamo lateral), tálamo (núcleos múltiples), núcleo subtalámico, globo pálido (tanto externo como interno), pálido ventral, núcleo parabraquial, amígdala y el resto de la amígdala extendida. El núcleo del rafe dorsal y el cerebelo parecen modular algunas formas de cognición relacionada con la recompensa (es decir, aprendizaje asociativo, prominencia motivacional y emociones positivas) y comportamientos también. El núcleo tegmental laterodorsal (LTD), el núcleo pedunculopontino (PPTg) y la habénula lateral (LHb) (tanto directa como indirectamente a través del núcleo tegmental rostromedial) también son capaces de inducir saliencia aversiva y saliente de incentivo a través de sus proyecciones al área tegmental ventral ( VTA). Tanto la LDT como la PPTg envían proyecciones glutaminérgicas al VTA que hacen sinapsis en las neuronas dopaminérgicas, las cuales pueden producir un incentivo destacado. La LHb envía proyecciones glutaminérgicas, la mayoría de las cuales hacen sinapsis en las neuronas GABAergic RMTg que a su vez impulsan la inhibición de las neuronas dopaminérgicas de VTA, aunque algunas proyecciones de LHb terminan en las interneuronas de VTA. Estas proyecciones de LHb se activan tanto por estímulos aversivos como por la ausencia de una recompensa esperada, y la excitación de la LHb puede inducir aversión.

La mayoría de las vías de dopamina (es decir, las neuronas que usan el neurotransmisor dopamina para comunicarse con otras neuronas) que se proyectan fuera del área tegmental ventral son parte del sistema de recompensa; En estas vías, la dopamina actúa sobre receptores tipo D1 o receptores tipo D2 para estimular (tipo D1) o inhibir (tipo D2) la producción de AMPc. Las neuronas espinosas medianas GABAérgicas del cuerpo estriado también son componentes del sistema de recompensa. Los núcleos de proyección glutamatérgicos en el núcleo subtalámico, la corteza prefrontal, el hipocampo, el tálamo y la amígdala se conectan a otras partes del sistema de recompensa a través de las vías de glutamato. El haz del prosencéfalo medial, que es un conjunto de muchas vías neuronales que median la recompensa de estimulación cerebral (es decir, la recompensa derivada de la estimulación electroquímica directa del hipotálamo lateral), también es un componente del sistema de recompensa.

Existen dos teorías con respecto a la actividad del núcleo accumbens y el gusto y el deseo de la generación. La hipótesis de la inhibición (o hiperpolarización) propone que el núcleo accumbens ejerce efectos inhibidores tónicos sobre las estructuras aguas abajo, como el pálido ventral, el hipotálamo o el área tegmental ventral, y que al inhibir los MSN en el núcleo accumbens (NAcc), estas estructuras están excitadas ". liberar "comportamiento relacionado con la recompensa. Mientras que los agonistas del receptor GABA son capaces de provocar reacciones de "me gusta" y "querer" en el núcleo accumbens, los aportes glutaminérgicos de la amígdala basolateral, el hipocampo ventral y la corteza prefrontal medial pueden impulsar la prominencia de incentivos. Además, aunque la mayoría de los estudios encuentran que las neuronas NAcc reducen el disparo en respuesta a la recompensa, varios estudios encuentran la respuesta opuesta. Esto condujo a la propuesta de la hipótesis de la desinhibición (o despolarización), que propone que las neuronas de excitación o NAcc, o al menos ciertos subconjuntos, impulsan el comportamiento relacionado con la recompensa.

Después de casi 50 años de investigación sobre la recompensa de estimulación cerebral, los expertos han certificado que docenas de sitios en el cerebro mantendrán la autoestimulación intracraneal. Las regiones incluyen el hipotálamo lateral y los haces del prosencéfalo medial, que son especialmente efectivos. La estimulación allí activa las fibras que forman las vías ascendentes; Las vías ascendentes incluyen la vía de la dopamina mesolímbica, que se proyecta desde el área tegmental ventral hasta el núcleo accumbens. Hay varias explicaciones de por qué la vía de dopamina mesolímbica es fundamental para los circuitos que median la recompensa. Primero, hay un marcado aumento en la liberación de dopamina de la vía mesolímbica cuando los animales participan en la autoestimulación intracraneal. En segundo lugar, los experimentos indican consistentemente que la recompensa de estimulación cerebral estimula el refuerzo de las vías que normalmente se activan mediante recompensas naturales, y la recompensa por drogas o la autoestimulación intracraneal pueden ejercer una activación más poderosa de los mecanismos de recompensa central porque activan el centro de recompensa directamente en lugar de a través de Los nervios periféricos. Tercero, cuando a los animales se les administran drogas adictivas o participan en comportamientos naturalmente gratificantes, como la alimentación o la actividad sexual, hay una liberación marcada de dopamina dentro del núcleo accumbens. Sin embargo, la dopamina no es el único compuesto de recompensa en el cerebro.

Centros de placer

El placer es un componente de la recompensa, pero no todas las recompensas son placenteras (por ejemplo, el dinero no provoca placer a menos que esta respuesta esté condicionada). Los estímulos que son naturalmente placenteros y, por lo tanto, atractivos, se conocen como recompensas intrínsecas , mientras que los estímulos que son atractivos y motivan el comportamiento de aproximación, pero no son inherentemente placenteros, se denominan recompensas extrínsecas . Las recompensas extrínsecas (por ejemplo, dinero) son gratificantes como resultado de una asociación aprendida con una recompensa intrínseca. En otras palabras, las recompensas extrínsecas funcionan como imanes motivacionales que provocan reacciones de "deseo", pero no de "gusto" una vez que se han adquirido.

El sistema de recompensas contiene centros de placer o puntos calientes hedónicos , es decir, estructuras cerebrales que median el placer o las reacciones de "me gusta" de las recompensas intrínsecas. A partir de octubre de 2017, se han identificado puntos calientes hedónicos en subcompartimientos dentro del núcleo accumbens shell, pálido ventral, núcleo parabraquial, corteza orbitofrontal (OFC) y corteza insular. El punto caliente dentro del núcleo accumbens shell se encuentra en el cuadrante rostrodorsal de la capa medial, mientras que el punto frío hedónico se encuentra en una región más posterior. El pálido ventral posterior también contiene un punto caliente hedónico, mientras que el pálido ventral anterior contiene un punto frío hedónico. Las microinyecciones de opioides, endocannabinoides y orexina son capaces de mejorar el gusto en estos puntos críticos. Se ha demostrado que los puntos calientes hedónicos ubicados en la OFC anterior y la ínsula posterior responden a la orexina y los opioides, al igual que la superposición de resfriado hedónico en la ínsula anterior y la OFC posterior. Por otro lado, el punto de acceso del núcleo parabraquial solo se ha demostrado que responde a los agonistas del receptor de benzodiacepinas.

Los puntos calientes hedónicos están funcionalmente vinculados, ya que la activación de un punto caliente da como resultado el reclutamiento de los otros, como lo indica la expresión inducida de c-Fos, un gen temprano inmediato. Además, la inhibición de un punto de acceso da como resultado la disminución de los efectos de activar otro punto de acceso. Por lo tanto, se cree que la activación simultánea de cada punto de acceso hedónico dentro del sistema de recompensas es necesaria para generar la sensación de una euforia intensa.

Querian, queriendo

La prominencia de incentivos es el atributo "querer" o "deseo", que incluye un componente motivacional, que es asignado a un estímulo gratificante por el núcleo accumbens shell (NAcc shell). El grado de neurotransmisión de dopamina en la cubierta de NAcc desde la vía mesolímbica está altamente correlacionado con la magnitud de la prominencia de incentivos para estímulos gratificantes.

La activación de la región dorsorostral del núcleo accumbens se correlaciona con aumentos en el deseo sin aumentos concurrentes en el gusto. Sin embargo, la neurotransmisión dopaminérgica en el núcleo accumbens shell es responsable no solo de la prominencia motivacional apetitiva (es decir, la prominencia de incentivos) hacia estímulos gratificantes, sino también de la prominencia motivacional aversiva, que dirige el comportamiento lejos de estímulos indeseables. En el estriado dorsal, la activación de MSN que expresan D1 produce prominencia de incentivos apetitivos, mientras que la activación de MSN que expresan D2 produce aversión. En el NAcc, dicha dicotomía no es tan clara, y la activación de ambos MSN D1 y D2 es suficiente para aumentar la motivación, probablemente mediante la desinhibición del VTA mediante la inhibición del pálido ventral.

La teoría de sensibilización de incentivos de Robinson y Berridge de 1993 propuso que la recompensa contiene componentes psicológicos separables: deseo (incentivo) y gusto (placer). Para explicar el contacto creciente con cierto estímulo como el chocolate, hay dos factores independientes en el trabajo: nuestro deseo de tener el chocolate (querer) y el efecto de placer del chocolate (gusto). Según Robinson y Berridge, querer y gustar son dos aspectos del mismo proceso, por lo que las recompensas generalmente se quieren y se quieren en el mismo grado. Sin embargo, el deseo y el gusto también cambian independientemente bajo ciertas circunstancias. Por ejemplo, las ratas que no comen después de recibir dopamina (experimentando una pérdida de deseo de comida) actúan como si aún les gustara la comida. En otro ejemplo, los electrodos de autoestimulación activados en el hipotálamo lateral de las ratas aumentan el apetito, pero también causan más reacciones adversas a sabores como el azúcar y la sal; aparentemente, la estimulación aumenta el deseo pero no el gusto. Tales resultados demuestran que nuestro sistema de recompensas incluye procesos independientes de querer y gustar. Se cree que el componente de deseo está controlado por vías dopaminérgicas, mientras que el componente de gusto está controlado por los sistemas de opiáceos-benzodiacepinas.

Otros animales vs. humanos

Los animales aprenden rápidamente a presionar una barra para obtener una inyección de opiáceos directamente en el tegmentum del cerebro medio o el núcleo accumbens. Los mismos animales no trabajan para obtener los opiáceos si las neuronas dopaminérgicas de la vía mesolímbica están inactivadas. En esta perspectiva, los animales, como los humanos, tienen comportamientos que aumentan la liberación de dopamina.

Kent Berridge, un investigador en neurociencia afectiva, descubrió que los sabores dulces ( me gusta ) y amargos ( disgustados ) producían distintas expresiones orofaciales, y estas expresiones fueron mostradas de manera similar por los recién nacidos humanos, los orangutanes y las ratas. Esto era evidencia de que el placer (específicamente, el gusto ) tiene características objetivas y era esencialmente el mismo en varias especies animales. La mayoría de los estudios de neurociencia han demostrado que cuanto más dopamina libera la recompensa, más efectiva es la recompensa. Esto se llama impacto hedónico, que puede ser cambiado por el esfuerzo por la recompensa y la recompensa misma. Berridge descubrió que el bloqueo de los sistemas de dopamina no parecía cambiar la reacción positiva a algo dulce (medido por la expresión facial). En otras palabras, el impacto hedónico no cambió en función de la cantidad de azúcar. Esto descontó la suposición convencional de que la dopamina media el placer. Incluso con alteraciones de dopamina más intensas, los datos parecían permanecer constantes. Sin embargo, un estudio clínico de enero de 2019 que evaluó el efecto de un precursor de la dopamina (levodopa), un antagonista (risperidona) y un placebo sobre las respuestas de recompensa a la música, incluido el grado de placer experimentado durante los escalofríos musicales, medido por los cambios en la electrodermia. actividad y calificaciones subjetivas: se descubrió que la manipulación de la neurotransmisión de dopamina regula bidireccionalmente la cognición del placer (específicamente, el impacto hedónico de la música) en sujetos humanos. Esta investigación demostró que el aumento de la neurotransmisión de dopamina actúa como una condición sine qua non para reacciones hedónicas placenteras a la música en humanos.

Berridge desarrolló la hipótesis de incentivos relevancia para abordar el aspecto de querer recompensas. Explica el uso compulsivo de drogas por parte de los drogadictos, incluso cuando la droga ya no produce euforia, y los antojos experimentados incluso después de que el individuo ha terminado de retirarse. Algunos adictos responden a ciertos estímulos que involucran cambios neuronales causados ​​por drogas. Esta sensibilización en el cerebro es similar al efecto de la dopamina porque se producen reacciones de deseo y agrado . Los cerebros y comportamientos humanos y animales experimentan cambios similares con respecto a los sistemas de recompensa porque estos sistemas son muy prominentes.

Aprendizaje

Los estímulos gratificantes pueden impulsar el aprendizaje tanto en forma de condicionamiento clásico (condicionamiento pavloviano) como de condicionamiento operante (condicionamiento instrumental). En el condicionamiento clásico, una recompensa puede actuar como un estímulo incondicionado que, cuando se asocia con el estímulo condicionado, hace que el estímulo condicionado provoque tanto el músculo esquelético (en forma de un enfoque simple y comportamientos de evitación) como las respuestas vegetativas. En el condicionamiento operante, una recompensa puede actuar como un refuerzo ya que aumenta o apoya las acciones que conducen a sí misma. Los comportamientos aprendidos pueden o no ser sensibles al valor de los resultados a los que conducen; los comportamientos que son sensibles a la contingencia de un resultado en el desempeño de una acción, así como el valor del resultado, están dirigidos a objetivos, mientras que las acciones que son insensibles a la contingencia o al valor se denominan hábitos. Se cree que esta distinción refleja dos formas de aprendizaje, modelo libre y modelo basado. El modelo de aprendizaje libre implica el almacenamiento en caché simple y la actualización de valores. Por el contrario, el aprendizaje basado en modelos implica el almacenamiento y la construcción de un modelo interno de eventos que permite la inferencia y la predicción flexible. Aunque generalmente se supone que el condicionamiento pavloviano no tiene modelos, la prominencia de incentivos asignada a un estímulo condicionado es flexible con respecto a los cambios en los estados motivacionales internos.

Distintos sistemas neuronales son responsables de aprender asociaciones entre estímulos y resultados, acciones y resultados, y estímulos y respuestas. Aunque el condicionamiento clásico no se limita al sistema de recompensa, la mejora del rendimiento instrumental mediante estímulos (es decir, la transferencia instrumental pavloviana) requiere el núcleo accumbens. El aprendizaje instrumental habitual y dirigido al objetivo depende del estriado lateral y el estriado medial, respectivamente.

Durante el aprendizaje instrumental, se producen cambios opuestos en la proporción de receptores AMPA a NMDA y ERK fosforilado en los MSN de tipo D1 y D2 que constituyen las vías directa e indirecta, respectivamente. Estos cambios en la plasticidad sináptica y el aprendizaje que lo acompaña depende de la activación de los receptores estriados D1 y NMDA. La cascada intracelular activada por los receptores D1 implica el reclutamiento de la proteína quinasa A y, a través de la fosforilación resultante de DARPP-32, la inhibición de las fosfatasas que desactivan ERK. Los receptores NMDA activan ERK a través de una vía Ras-Raf-MEK-ERK diferente pero interrelacionada. La activación de ERK mediada por NMDA sola es autolimitada, ya que la activación de NMDA también inhibe la inhibición mediada por PKA de las fosfatasas desactivadoras de ERK. Sin embargo, cuando las cascadas D1 y NMDA están co-activadas, funcionan sinérgicamente, y la activación resultante de ERK regula la plasticidad sináptica en forma de reestructuración de la columna, transporte de receptores AMPA, regulación de CREB y aumento de la excitabilidad celular mediante la inhibición de Kv4.2

Historia

La primera pista sobre la presencia de un sistema de recompensa en el cerebro llegó con un descubrimiento accidental de James Olds y Peter Milner en 1954. Descubrieron que las ratas realizarían comportamientos como presionar una barra, para administrar una breve explosión de estimulación eléctrica a sitios en sus cerebros. Este fenómeno se llama autoestimulación intracraneal o recompensa de estimulación cerebral. Por lo general, las ratas presionan una palanca cientos o miles de veces por hora para obtener esta estimulación cerebral, deteniéndose solo cuando están agotadas. Al tratar de enseñar a las ratas cómo resolver problemas y correr laberintos, la estimulación de ciertas regiones del cerebro donde se encontró la estimulación parecía dar placer a los animales. Intentaron lo mismo con los humanos y los resultados fueron similares. La explicación de por qué los animales se involucran en un comportamiento que no tiene valor para la supervivencia de ellos mismos o de su especie es que la estimulación cerebral está activando el sistema subyacente a la recompensa.

En un descubrimiento fundamental realizado en 1954, los investigadores James Olds y Peter Milner encontraron que la estimulación eléctrica de bajo voltaje de ciertas regiones del cerebro de la rata actuó como una recompensa al enseñar a los animales a correr laberintos y resolver problemas. Parecía que la estimulación de esas partes del cerebro daba placer a los animales, y en trabajos posteriores los humanos informaron sensaciones placenteras de tal estimulación. Cuando las ratas se probaron en cajas Skinner donde podían estimular el sistema de recompensas presionando una palanca, las ratas presionaron durante horas. La investigación en las próximas dos décadas estableció que la dopamina es uno de los principales químicos que ayudan a la señalización neural en estas regiones, y se sugirió que la dopamina es el "químico de placer" del cerebro.

Ivan Pavlov fue un psicólogo que utilizó el sistema de recompensas para estudiar el condicionamiento clásico. Pavlov utilizó el sistema de recompensas recompensando a los perros con comida después de haber escuchado una campana u otro estímulo. Pavlov estaba premiando a los perros para que los perros asociaran comida, la recompensa, con la campana, el estímulo. Edward L. Thorndike usó el sistema de recompensas para estudiar el condicionamiento operante. Comenzó poniendo gatos en una caja de rompecabezas y colocando comida fuera de la caja para que el gato quisiera escapar. Los gatos trabajaron para salir de la caja del rompecabezas para llegar a la comida. Aunque los gatos comieron la comida después de escapar de la caja, Thorndike se enteró de que los gatos intentaron escapar de la caja sin la recompensa de la comida. Thorndike utilizó las recompensas de la comida y la libertad para estimular el sistema de recompensas de los gatos. Thorndike usó esto para ver cómo los gatos aprendieron a escapar de la caja.

Significación clínica

Adiccion

ΔFosB (DeltaFosB) - un factor de transcripción génica - la sobreexpresión en las neuronas espinosas medianas tipo D1 del núcleo accumbens es el factor común crucial entre prácticamente todas las formas de adicción (es decir, adicciones conductuales y adicciones a las drogas) que induce comportamientos relacionados con la adicción y plasticidad neural En particular, ΔFosB promueve la autoadministración, la sensibilización de recompensa y los efectos de sensibilización cruzada de recompensa entre las drogas y comportamientos adictivos específicos. También se sabe que ciertas modificaciones epigenéticas de las colas de proteínas de histonas (es decir, modificaciones de histonas) en regiones específicas del cerebro desempeñan un papel crucial en la base molecular de las adicciones.

Las drogas y los comportamientos adictivos son gratificantes y de refuerzo (es decir, son adictivos ) debido a sus efectos en la vía de recompensa de la dopamina.

El haz de hipotálamo lateral y prosencéfalo medial ha sido el sitio de recompensa de estimulación cerebral más estudiado, particularmente en estudios sobre los efectos de los medicamentos en la recompensa de estimulación cerebral. El sistema de neurotransmisores que se ha identificado más claramente con las acciones de abuso de drogas que forman el hábito es el sistema de dopamina mesolímbico, con sus objetivos eferentes en el núcleo accumbens y sus aferentes locales GABAérgicos. Las acciones relevantes para la recompensa de la anfetamina y la cocaína se encuentran en las sinapsis dopaminérgicas del núcleo accumbens y quizás en la corteza prefrontal medial. Las ratas también aprenden a presionar con palanca para inyecciones de cocaína en la corteza prefrontal medial, que funciona al aumentar el recambio de dopamina en el núcleo accumbens. La nicotina infundida directamente en el núcleo accumbens también mejora la liberación local de dopamina, presumiblemente por una acción presináptica en los terminales dopaminérgicos de esta región. Los receptores nicotínicos se localizan en los cuerpos celulares dopaminérgicos y las inyecciones locales de nicotina aumentan la activación de las células dopaminérgicas que es crítica para la recompensa nicotínica. Como consecuencia, es probable que algunos fármacos adictivos adicionales disminuyan la producción de neuronas espinosas medianas, a pesar de activar las proyecciones dopaminérgicas. Para los opiáceos, el sitio de umbral más bajo para los efectos de recompensa implica acciones en las neuronas GABAérgicas en el área tegmental ventral, un sitio secundario de acciones que recompensan a los opiáceos en las neuronas de salida espinosa media del núcleo accumbens. Así, lo siguiente forma el núcleo de los circuitos de recompensa de drogas actualmente caracterizados; Aferentes GABAérgicos a las neuronas de dopamina mesolímbicas (sustrato primario de la recompensa de opiáceos), las propias neuronas de dopamina mesolímbicas (sustrato primario de la recompensa estimulante psicomotora) y eferentes GABAérgicos a las neuronas de dopamina mesolímbicas (un sitio secundario de recompensa de opiáceos).

Motivación

La prominencia motivacional disfuncional aparece en una serie de síntomas y trastornos psiquiátricos. La anhedonia, tradicionalmente definida como una capacidad reducida para sentir placer, se ha reexaminado como reflejo de la prominencia de incentivos embotada, ya que la mayoría de las poblaciones anhedónicas exhiben un "gusto" intacto. En el otro extremo del espectro, la mayor prominencia de incentivos que se reduce para estímulos específicos es característica de las adicciones conductuales y de drogas. En el caso de miedo o paranoia, la disfunción puede residir en una elevada aversión prominente.

Los estudios de neuroimagen en los diagnósticos asociados con la anhedonia han reportado una actividad reducida en la OFC y el cuerpo estriado ventral. Un metaanálisis informó que la anhedonia se asoció con una respuesta neural reducida a la anticipación de la recompensa en el núcleo caudado, el putamen, el núcleo accumbens y la corteza prefrontal medial (mPFC).

Trastornos del estado de ánimo

Ciertos tipos de depresión están asociados con una motivación reducida, según lo evaluado por la disposición a gastar esfuerzo en recompensa. Estas anormalidades se han relacionado tentativamente con la reducción de la actividad en áreas del cuerpo estriado, y aunque se supone que las anormalidades dopaminérgicas juegan un papel, la mayoría de los estudios que prueban la función de la dopamina en la depresión han reportado resultados inconsistentes. Aunque los estudios postmortem y de neuroimagen han encontrado anormalidades en numerosas regiones del sistema de recompensa, pocos hallazgos se replican de manera consistente. Algunos estudios han reportado actividad reducida de NAcc, hipocampo, corteza prefrontal medial (mPFC) y corteza orbitofrontal (OFC), así como actividad elevada de la amígdala basolateral y la corteza cingulada subgenual (sgACC) durante tareas relacionadas con la recompensa o estímulos positivos. Estas anormalidades de neuroimagen se complementan con poca investigación post mortem, pero la poca investigación realizada sugiere una reducción de las sinapsis excitadoras en el mPFC. La actividad reducida en el mPFC durante las tareas relacionadas con la recompensa parece estar localizada en regiones más dorsales (es decir, la corteza cingulada pregenual), mientras que el sgACC más ventral es hiperactivo en la depresión.

Los intentos de investigar los circuitos neuronales subyacentes en modelos animales también han arrojado resultados contradictorios. Dos paradigmas se usan comúnmente para simular la depresión, la derrota social crónica (CSDS) y el estrés leve crónico (CMS), aunque existen muchos. CSDS produce una preferencia reducida por la sacarosa, interacciones sociales reducidas y una mayor inmovilidad en la prueba de natación forzada. De manera similar, el CMS reduce la preferencia por la sacarosa y la desesperación conductual según la evaluación de la suspensión de la cola y las pruebas de natación forzada. Los animales susceptibles a CSDS exhiben una mayor activación de VTA fásica, y la inhibición de las proyecciones de VTA-NAcc atenúa los déficits de comportamiento inducidos por CSDS. Sin embargo, la inhibición de las proyecciones de VTA-mPFC exacerba la retirada social. Por otro lado, las reducciones asociadas a CMS en la preferencia e inmovilidad de sacarosa se atenuaron y exacerbaron por la excitación e inhibición de VTA, respectivamente. Aunque estas diferencias pueden ser atribuibles a diferentes protocolos de estimulación o paradigmas de traducción deficientes, los resultados variables también pueden residir en la funcionalidad heterogénea de las regiones relacionadas con la recompensa.

La estimulación optogenética del mPFC en su conjunto produce efectos antidepresivos. Este efecto aparece localizado en el homólogo de roedores del pgACC (la corteza preliminar), ya que la estimulación del homólogo de roedores del sgACC (la corteza infralímbica) no produce efectos conductuales. Además, la estimulación cerebral profunda en la corteza infralímbica, que se cree que tiene un efecto inhibidor, también produce un efecto antidepresivo. Este hallazgo es congruente con la observación de que la inhibición farmacológica de la corteza infralímbica atenúa los comportamientos depresivos.

Esquizofrenia

La esquizofrenia se asocia con déficits en la motivación, comúnmente agrupados bajo otros síntomas negativos, como la reducción del habla espontánea. Con frecuencia se informa que la experiencia de "gusto" está intacta, tanto conductual como neuronal, aunque los resultados pueden ser específicos de ciertos estímulos, como las recompensas monetarias. Además, el aprendizaje implícito y las tareas relacionadas con recompensas simples también están intactas en la esquizofrenia. Más bien, los déficits en el sistema de recompensas presentes durante las tareas relacionadas con recompensas que son cognitivamente complejas. Estos déficits están asociados tanto con la actividad anormal del estriado como con la OFC, así como con anormalidades en regiones asociadas con funciones cognitivas como la corteza prefrontal dorsolateral (dlPFC).