Summary

Operante protocolos para evaluar el análisis de costo-beneficio en decisiones reforzadas por roedores

Published: September 10, 2018
doi:

Summary

Un análisis de costo-beneficio es un enfoque de balanza que el cerebro lleva a cabo durante el curso de la toma de decisiones. Aquí, proponemos un protocolo para entrenar a las ratas en un paradigma de toma de decisiones basado en la operante en ratas elegir recompensas más altas a costa de esperar 15 s para recibirlos.

Abstract

Guiada por el refuerzo de la toma de decisiones es la capacidad de elegir entre cursos de competencia de acción basada en el valor relativo de los beneficios y sus consecuencias. Este proceso es parte integral de la conducta humana normal y se ha demostrado para ser interrumpidas por trastornos neurológicos y psiquiátricos tales como depresión, esquizofrenia y adicción. Roedores han sido utilizados para descubrir la neurobiología de la cognición humana. Para ello, se han desarrollado varias tareas conductuales; sin embargo, la mayoría es no automatizados y mano de obra intensiva. El reciente desarrollo del microcontrolador open source ha permitido a los investigadores automatizar las tareas basado en la operante para evaluar una variedad de tareas cognitivas, estandarizar la presentación de estímulos, mejorar la grabación de datos y por lo tanto, mejorar los resultados de la investigación. Aquí, describimos automatizada basado en la demora guiada por el refuerzo de toma de decisiones tarea, usando un operante T-laberinto controlada por programas de software de medida. Mediante estas tareas de toma de decisiones, mostramos los cambios en las actividades potenciales de campo local en la corteza cingulada anterior de una rata mientras realiza una tarea de toma de decisiones y costo-beneficio basado en la demora.

Introduction

Toma de decisiones es el proceso de reconocer y seleccionar decisiones basadas en los valores y preferencias de las decisiones y las consecuencias de la acción seleccionada1. Aunque la toma de decisiones ha sido extensamente estudiada en diferentes campos (es decir, economía, psicología y neurociencia), mecanismos neuronales subyacentes a tales capacidades cognitivas no se entienden todavía completamente. Dos subcategorías de toma de decisiones son decisiones perceptuales y guiada por el refuerzo de la toma de decisiones. Aunque incorporan conceptos y elementos de superposición considerable, perceptivo de la toma de decisiones se basa en la información sensorial disponible1,2, considerando que la toma de decisiones guiada por refuerzo aborda el valor relativo de acciones durante un plazo específico3. Un aspecto importante del armado de la toma de decisiones es el análisis de costo-beneficio que se realiza de forma intuitiva por el cerebro calculando los beneficios de las opciones dadas y restando los costes de cada alternativa1.

El T-laberinto (o la variante laberinto) es uno de los laberintos más utilizado en experimentos cognitivos con roedores. Animales se colocan en el brazo de arranque (la base de la T) y permite elegir el brazo de objetivo (uno de los brazos laterales). Tareas como una alternancia forzada o discriminación izquierda y derecha se utilizan principalmente con los roedores en la T-laberinto a la prueba de referencia y trabajo memoria4. T-laberintos son también ampliamente utilizados en experimentos de toma de decisiones5,6,7. En el diseño más simple, la recompensa se coloca en el brazo de un único objetivo. La elección es predecible, y animales sin duda prefiere la recompensa más que nada, independientemente del valor de la recompensa. Otra opción es colocar recompensas en ambos brazos del objetivo y dejar que los animales tomar una decisión de qué camino tomar dependiendo de varios parámetros (es decir, la preferencia natural de los animales, la diferencia en el valor de las recompensas y los costos a pagar). En el diseño basado en el valor, la tarea se complica más por tener propiedades de escala de pesaje. De esta manera, un animal recibe recompensas diferentemente valorados por elegir entre dos alternativas, así como los costos de las acciones [es decir, la cantidad de espera (delay-basado) o la cantidad de esfuerzo (esfuerzo-basado) necesario para recibir recompensas], cada uno contribuye a la decisión que se hace de5,6.

Tradicional basada en el retraso T-laberinto toma de decisiones, los animales están capacitados para seleccionar el brazo de la recompensa alta (HRA) y evitar lo contrario brazo baja recompensa (del Señor LRA). Los lados de la HRA y el LRA permanecen sin cambios durante todo el experimento. Aunque la tarea descrita anteriormente ha sido bien documentada en la literatura, sufre de varios inconvenientes procesales. En primer lugar, por tener un brazo de objetivo fijo, el animal sabe que el brazo para elegir desde el comienzo de cada ensayo. En este escenario, los animales pueden seleccionar el brazo objetivo basado en su memoria y no en la toma de decisiones. Por lo tanto, en un paradigma de toma de decisiones basado en la demora, si un animal selecciona la recompensa baja debido a la intervención del estudio, no será claro si esto es debido a una pérdida de memoria o a la intervención del estudio. Puede ser considerada como un grupo de control de memoria para segregar el comportamiento observado por el problema de memoria, pero esto afecta investigadores y animales por igual debido a los trabajos adicionales7. Una segunda preocupación es el momento de la toma de decisiones por el animal: una vez los animales a la zona de decisión (la Unión de los tres brazos), suelen mirar a la izquierda y a la derecha, pesan los costos y beneficios con respecto a cada brazo y entonces tomar su decisión. Sin embargo, después de unos pocos ensayos, realizan tal cómputo antes de llegar a la zona de decisión y ejecuta directamente en el brazo de recompensa. Como resultado, estos dos inconvenientes — un sesgo previo a uno de los brazos y encontrar el momento de la toma de decisiones, ambos altamente interrumpen la interpretación del electrofisiológicos y los datos de neuroimagen.

En el método explicado en este artículo, el brazo preferido (HRA) se localiza por una señal auditiva y puede variar de ensayo a ensayo. Animales inician los ensayos al entrar en la zona de prueba (figura 1) y dispara la señal auditiva pinchándola”nariz-” una puerta infrarrojos que se ha colocado en el cruce de los tres brazos. La señal de audio (20 dB, entre 500 y 1.000 ms) se juega desde un altavoz en el extremo del brazo de meta.

Protocol

Todos los procedimientos explicaron aquí fueron aprobados y realizados conforme a la guía para el cuidado y uso de animales de laboratorio y fueron aprobados por el Comité de ética Animal Florey Institute o el centro de investigación de Neurociencia. 1. vivienda, manejo y restricción de alimentos Utilizar ratas macho adulto (normalmente de 8 semanas de edad) (cualquier cepas) y mantenerlos en la habitación con un ciclo de 12 h luz/oscuridad. Restringir su acceso a lo…

Representative Results

Los datos presentados aquí están la LFP grabada desde la corteza orbitofrontal izquierda (OFC) y la corteza cingulada anterior (ACC) de seis ratas Wistar macho con electrodos bipolares (de acero inoxidable recubierto de PFA). La tabla 1 muestra la longitud de la adquisición de comportamiento para cada etapa de formación. Las coordenadas de los lugares de destino se determinaron a partir de una rata cerebro atlas9 y son las siguientes: para la A…

Discussion

Roedores han sido utilizados en estudios neurocientíficos que tratan diferentes temas, desde las habilidades cognitivas como el aprendizaje y la memoria2,14 y comportamiento reforzado7,15,16 para el control central de órganos17,18 y Neurofarmacología19,20</s…

Declarações

The authors have nothing to disclose.

Acknowledgements

Esta investigación fue apoyada por la Fundación de Neurociencias de RMH, Australia; la Fundación australiana del cerebro; la RACP Thyne Reid beca, Australia; y por un proyecto del Consejo de tecnologías, Irán a Abbas Haghparast y ciencias cognitivas.

Materials

T-maze Self made
Dustless Precision Sugar Pellets TSE Systems Intl. Group F0023 45 mg, Sucrose
Ketamine Hydrochloride Injection, USP Sigma-Aldrich 6740-87-0
Xylazine Sigma-Aldrich 7361-61-7
stereotaxic device Stoelting
Isofluran Santa Cruz Biotechnology sc-363629Rx
PFA-coated stainless-steel wires A-M systems
acrylic cement Vertex, MA, USA
(wooden or PVC (polyvinyl chloride)-made) local suppliers
Mini-Fit Power Connector Molex 15243048
ethannol 70% Local suppliers
buprenorphine diamondback drugs
Arduino UNO Arduino https://www.arduino.cc/
Infrared emitting diode Sharp GL480E00000F http://www.sharp-world.com/
Chronux Toolbox Chronux.org
Arduino codes https://github.com/dechuans/arduino-maze

Referências

  1. Gold, J. I., Shadlen, M. N. The neural basis of decision making. Annual Review of Neuroscience. 30, 535-574 (2007).
  2. Shi, Z., Müller, H. J. Multisensory perception and action: development, decision-making, and neural mechanisms. Frontiers in Integrative Neuroscience. 7, 81 (2013).
  3. Sutton, R. S., Barto, A. G. . Reinforcement Learning: An Introduction. 1, (1998).
  4. Khani, A., Rainer, G. Neural and neurochemical basis of reinforcement-guided decision making. Journal of Neurophysiology. 116, 724-741 (2016).
  5. Fatahi, Z., Haghparast, A., Khani, A., Kermani, M. Functional connectivity between anterior cingulate cortex and orbitofrontal cortex during value-based decision making. Neurobiology of Learning and Memory. 147, 74-78 (2018).
  6. Khani, A., et al. Activation of cannabinoid system in anterior cingulate cortex and orbitofrontal cortex modulates cost-benefit decision making. Psychopharmacology. 232, 2097-2112 (2015).
  7. Rudebeck, P. H., Walton, M. E., Smyth, A. N., Bannerman, D. M., Rushworth, M. F. Separate neural pathways process different decision costs. Nature Neuroscience. 9, 1161-1168 (2006).
  8. Gage, G. J., et al. Surgical implantation of chronic neural electrodes for recording single unit activity and electrocorticographic signals. Journal of Visualized Experiments. (60), e3565 (2012).
  9. Paxinos, G., Watson, C. . The Rat Brain in Stereotaxic Coordinates. , (1998).
  10. Bokil, H., Andrews, P., Kulkarni, J. E., Mehta, S., Mitra, P. P. Chronux: a platform for analyzing neural signals. Journal of Neuroscience Methods. 192, 146-151 (2010).
  11. Cohen, M. X. . Analyzing Neural Time Series Data: Theory and Practice. , (2014).
  12. Luk, C. -. H., Wallis, J. D. Choice coding in frontal cortex during stimulus-guided or action-guided decision-making. Journal of Neuroscience. 33, 1864-1871 (2013).
  13. Rudebeck, P. H., et al. Frontal cortex subregions play distinct roles in choices between actions and stimuli. Journal of Neuroscience. 28, 13775-13785 (2008).
  14. Goshadrou, F., Kermani, M., Ronaghi, A., Sajjadi, S. The effect of ghrelin on MK-801 induced memory impairment in rats. Peptides. 44, 60-65 (2013).
  15. Haghparast, A., et al. Intrahippocampal administration of D2 but not D1 dopamine receptor antagonist suppresses the expression of conditioned place preference induced by morphine in the ventral tegmental area. Neuroscience Letters. 541, 138-143 (2013).
  16. Esmaeili, M. -. H., Kermani, M., Parvishan, A., Haghparast, A. Role of D1/D2 dopamine receptors in the CA1 region of the rat hippocampus in the rewarding effects of morphine administered into the ventral tegmental area. Behavioural Brain Research. 231, 111-115 (2012).
  17. Chaleek, N., Kermani, M., Eliassi, A., Haghparast, A. Effects of orexin and glucose microinjected into the hypothalamic paraventricular nucleus on gastric acid secretion in conscious rats. Neurogastroenterology & Motility. 24, e94-e102 (2012).
  18. Kermani, M., Eliassi, A. Gastric acid secretion induced by paraventricular nucleus microinjection of orexin A is mediated through activation of neuropeptide Yergic system. Neurociência. 226, 81-88 (2012).
  19. Kermani, M., Azizi, P., Haghparast, A. The role of nitric oxide in the effects of cumin (Cuminum Cyminum L.) fruit essential oil on the acquisition of morphine-induced conditioned place preference in adult male mice. Chinese Journal of Integrative Medicine. , 1-6 (2012).
  20. Ahmadi, A., et al. Synthesis and antinociceptive behaviors of new methyl and hydroxyl derivatives of phencyclidine. Current Medicinal Chemistry. 19, 763-769 (2012).

Play Video

Citar este artigo
Kermani, M., Fatahi, Z., Sun, D., Haghparast, A., French, C. Operant Protocols for Assessing the Cost-benefit Analysis During Reinforced Decision Making by Rodents. J. Vis. Exp. (139), e57907, doi:10.3791/57907 (2018).

View Video