Operant Protocols for Assessing the Cost-benefit Analysis During Reinforced Decision Making by Rodents

Mojtaba Kermani; Zahra Fatahi; Dechuan Sun; Abbas Haghparast; Chris French

doi:10.3791/57907

JoVE Journal > Neuroscience

Please note that all translations are automatically generated. Click here for the English version.

Neurociência

Operante protocolos para evaluar el análisis de costo-beneficio en decisiones reforzadas por roedores

Published: September 10, 2018

doi:

10.3791/57907

Mojtaba Kermani*^1,3, Zahra Fatahi*², Dechuan Sun, Abbas Haghparast, Chris French⁴

¹Department of Optometry and Vision Science,The University of Melbourne, ²Neuroscience Research Center,Shahid Beheshti University of Medical Science, ³Department of Medicine,The University of Melbourne, ⁴Royal Melbourne Hospital

Summary

Un análisis de costo-beneficio es un enfoque de balanza que el cerebro lleva a cabo durante el curso de la toma de decisiones. Aquí, proponemos un protocolo para entrenar a las ratas en un paradigma de toma de decisiones basado en la operante en ratas elegir recompensas más altas a costa de esperar 15 s para recibirlos.

Abstract

Guiada por el refuerzo de la toma de decisiones es la capacidad de elegir entre cursos de competencia de acción basada en el valor relativo de los beneficios y sus consecuencias. Este proceso es parte integral de la conducta humana normal y se ha demostrado para ser interrumpidas por trastornos neurológicos y psiquiátricos tales como depresión, esquizofrenia y adicción. Roedores han sido utilizados para descubrir la neurobiología de la cognición humana. Para ello, se han desarrollado varias tareas conductuales; sin embargo, la mayoría es no automatizados y mano de obra intensiva. El reciente desarrollo del microcontrolador open source ha permitido a los investigadores automatizar las tareas basado en la operante para evaluar una variedad de tareas cognitivas, estandarizar la presentación de estímulos, mejorar la grabación de datos y por lo tanto, mejorar los resultados de la investigación. Aquí, describimos automatizada basado en la demora guiada por el refuerzo de toma de decisiones tarea, usando un operante T-laberinto controlada por programas de software de medida. Mediante estas tareas de toma de decisiones, mostramos los cambios en las actividades potenciales de campo local en la corteza cingulada anterior de una rata mientras realiza una tarea de toma de decisiones y costo-beneficio basado en la demora.

Introduction

Toma de decisiones es el proceso de reconocer y seleccionar decisiones basadas en los valores y preferencias de las decisiones y las consecuencias de la acción seleccionada¹. Aunque la toma de decisiones ha sido extensamente estudiada en diferentes campos (es decir, economía, psicología y neurociencia), mecanismos neuronales subyacentes a tales capacidades cognitivas no se entienden todavía completamente. Dos subcategorías de toma de decisiones son decisiones perceptuales y guiada por el refuerzo de la toma de decisiones. Aunque incorporan conceptos y elementos de superposición considerable, perceptivo de la toma de decisiones se basa en la información sensorial disponible¹^,², considerando que la toma de decisiones guiada por refuerzo aborda el valor relativo de acciones durante un plazo específico³. Un aspecto importante del armado de la toma de decisiones es el análisis de costo-beneficio que se realiza de forma intuitiva por el cerebro calculando los beneficios de las opciones dadas y restando los costes de cada alternativa¹.

El T-laberinto (o la variante laberinto) es uno de los laberintos más utilizado en experimentos cognitivos con roedores. Animales se colocan en el brazo de arranque (la base de la T) y permite elegir el brazo de objetivo (uno de los brazos laterales). Tareas como una alternancia forzada o discriminación izquierda y derecha se utilizan principalmente con los roedores en la T-laberinto a la prueba de referencia y trabajo memoria⁴. T-laberintos son también ampliamente utilizados en experimentos de toma de decisiones⁵^,⁶^,⁷. En el diseño más simple, la recompensa se coloca en el brazo de un único objetivo. La elección es predecible, y animales sin duda prefiere la recompensa más que nada, independientemente del valor de la recompensa. Otra opción es colocar recompensas en ambos brazos del objetivo y dejar que los animales tomar una decisión de qué camino tomar dependiendo de varios parámetros (es decir, la preferencia natural de los animales, la diferencia en el valor de las recompensas y los costos a pagar). En el diseño basado en el valor, la tarea se complica más por tener propiedades de escala de pesaje. De esta manera, un animal recibe recompensas diferentemente valorados por elegir entre dos alternativas, así como los costos de las acciones [es decir, la cantidad de espera (delay-basado) o la cantidad de esfuerzo (esfuerzo-basado) necesario para recibir recompensas], cada uno contribuye a la decisión que se hace de⁵^,⁶.

Tradicional basada en el retraso T-laberinto toma de decisiones, los animales están capacitados para seleccionar el brazo de la recompensa alta (HRA) y evitar lo contrario brazo baja recompensa (del Señor LRA). Los lados de la HRA y el LRA permanecen sin cambios durante todo el experimento. Aunque la tarea descrita anteriormente ha sido bien documentada en la literatura, sufre de varios inconvenientes procesales. En primer lugar, por tener un brazo de objetivo fijo, el animal sabe que el brazo para elegir desde el comienzo de cada ensayo. En este escenario, los animales pueden seleccionar el brazo objetivo basado en su memoria y no en la toma de decisiones. Por lo tanto, en un paradigma de toma de decisiones basado en la demora, si un animal selecciona la recompensa baja debido a la intervención del estudio, no será claro si esto es debido a una pérdida de memoria o a la intervención del estudio. Puede ser considerada como un grupo de control de memoria para segregar el comportamiento observado por el problema de memoria, pero esto afecta investigadores y animales por igual debido a los trabajos adicionales⁷. Una segunda preocupación es el momento de la toma de decisiones por el animal: una vez los animales a la zona de decisión (la Unión de los tres brazos), suelen mirar a la izquierda y a la derecha, pesan los costos y beneficios con respecto a cada brazo y entonces tomar su decisión. Sin embargo, después de unos pocos ensayos, realizan tal cómputo antes de llegar a la zona de decisión y ejecuta directamente en el brazo de recompensa. Como resultado, estos dos inconvenientes — un sesgo previo a uno de los brazos y encontrar el momento de la toma de decisiones, ambos altamente interrumpen la interpretación del electrofisiológicos y los datos de neuroimagen.

En el método explicado en este artículo, el brazo preferido (HRA) se localiza por una señal auditiva y puede variar de ensayo a ensayo. Animales inician los ensayos al entrar en la zona de prueba (figura 1) y dispara la señal auditiva pinchándola”nariz-” una puerta infrarrojos que se ha colocado en el cruce de los tres brazos. La señal de audio (20 dB, entre 500 y 1.000 ms) se juega desde un altavoz en el extremo del brazo de meta.

Protocol

Todos los procedimientos explicaron aquí fueron aprobados y realizados conforme a la guía para el cuidado y uso de animales de laboratorio y fueron aprobados por el Comité de ética Animal Florey Institute o el centro de investigación de Neurociencia. 1. vivienda, manejo y restricción de alimentos Utilizar ratas macho adulto (normalmente de 8 semanas de edad) (cualquier cepas) y mantenerlos en la habitación con un ciclo de 12 h luz/oscuridad. Restringir su acceso a lo…

Representative Results

Los datos presentados aquí están la LFP grabada desde la corteza orbitofrontal izquierda (OFC) y la corteza cingulada anterior (ACC) de seis ratas Wistar macho con electrodos bipolares (de acero inoxidable recubierto de PFA). La tabla 1 muestra la longitud de la adquisición de comportamiento para cada etapa de formación. Las coordenadas de los lugares de destino se determinaron a partir de una rata cerebro atlas9 y son las siguientes: para la A…

Discussion

Roedores han sido utilizados en estudios neurocientíficos que tratan diferentes temas, desde las habilidades cognitivas como el aprendizaje y la memoria²^,¹⁴ y comportamiento reforzado⁷^,¹⁵^,¹⁶ para el control central de órganos¹⁷^,¹⁸ y Neurofarmacología¹⁹^,^20</s…

Declarações

The authors have nothing to disclose.

Acknowledgements

Esta investigación fue apoyada por la Fundación de Neurociencias de RMH, Australia; la Fundación australiana del cerebro; la RACP Thyne Reid beca, Australia; y por un proyecto del Consejo de tecnologías, Irán a Abbas Haghparast y ciencias cognitivas.

Materials

T-maze			Self made
Dustless Precision Sugar Pellets	TSE Systems Intl. Group	F0023	45 mg, Sucrose
Ketamine Hydrochloride Injection, USP	Sigma-Aldrich	6740-87-0
Xylazine	Sigma-Aldrich	7361-61-7
stereotaxic device	Stoelting
Isofluran	Santa Cruz Biotechnology	sc-363629Rx
PFA-coated stainless-steel wires	A-M systems
acrylic cement	Vertex, MA, USA
(wooden or PVC (polyvinyl chloride)-made)	local suppliers
Mini-Fit Power Connector	Molex	15243048
ethannol 70%	Local suppliers
buprenorphine	diamondback drugs
Arduino UNO	Arduino		https://www.arduino.cc/
Infrared emitting diode	Sharp	GL480E00000F	http://www.sharp-world.com/
Chronux Toolbox			Chronux.org
Arduino codes			https://github.com/dechuans/arduino-maze

Referências

Gold, J. I., Shadlen, M. N. The neural basis of decision making. Annual Review of Neuroscience. 30, 535-574 (2007).
Shi, Z., Müller, H. J. Multisensory perception and action: development, decision-making, and neural mechanisms. Frontiers in Integrative Neuroscience. 7, 81 (2013).
Sutton, R. S., Barto, A. G. . Reinforcement Learning: An Introduction. 1, (1998).
Khani, A., Rainer, G. Neural and neurochemical basis of reinforcement-guided decision making. Journal of Neurophysiology. 116, 724-741 (2016).
Fatahi, Z., Haghparast, A., Khani, A., Kermani, M. Functional connectivity between anterior cingulate cortex and orbitofrontal cortex during value-based decision making. Neurobiology of Learning and Memory. 147, 74-78 (2018).
Khani, A., et al. Activation of cannabinoid system in anterior cingulate cortex and orbitofrontal cortex modulates cost-benefit decision making. Psychopharmacology. 232, 2097-2112 (2015).
Rudebeck, P. H., Walton, M. E., Smyth, A. N., Bannerman, D. M., Rushworth, M. F. Separate neural pathways process different decision costs. Nature Neuroscience. 9, 1161-1168 (2006).
Gage, G. J., et al. Surgical implantation of chronic neural electrodes for recording single unit activity and electrocorticographic signals. Journal of Visualized Experiments. (60), e3565 (2012).
Paxinos, G., Watson, C. . The Rat Brain in Stereotaxic Coordinates. , (1998).
Bokil, H., Andrews, P., Kulkarni, J. E., Mehta, S., Mitra, P. P. Chronux: a platform for analyzing neural signals. Journal of Neuroscience Methods. 192, 146-151 (2010).
Cohen, M. X. . Analyzing Neural Time Series Data: Theory and Practice. , (2014).
Luk, C. -. H., Wallis, J. D. Choice coding in frontal cortex during stimulus-guided or action-guided decision-making. Journal of Neuroscience. 33, 1864-1871 (2013).
Rudebeck, P. H., et al. Frontal cortex subregions play distinct roles in choices between actions and stimuli. Journal of Neuroscience. 28, 13775-13785 (2008).
Goshadrou, F., Kermani, M., Ronaghi, A., Sajjadi, S. The effect of ghrelin on MK-801 induced memory impairment in rats. Peptides. 44, 60-65 (2013).
Haghparast, A., et al. Intrahippocampal administration of D2 but not D1 dopamine receptor antagonist suppresses the expression of conditioned place preference induced by morphine in the ventral tegmental area. Neuroscience Letters. 541, 138-143 (2013).
Esmaeili, M. -. H., Kermani, M., Parvishan, A., Haghparast, A. Role of D1/D2 dopamine receptors in the CA1 region of the rat hippocampus in the rewarding effects of morphine administered into the ventral tegmental area. Behavioural Brain Research. 231, 111-115 (2012).
Chaleek, N., Kermani, M., Eliassi, A., Haghparast, A. Effects of orexin and glucose microinjected into the hypothalamic paraventricular nucleus on gastric acid secretion in conscious rats. Neurogastroenterology & Motility. 24, e94-e102 (2012).
Kermani, M., Eliassi, A. Gastric acid secretion induced by paraventricular nucleus microinjection of orexin A is mediated through activation of neuropeptide Yergic system. Neurociência. 226, 81-88 (2012).
Kermani, M., Azizi, P., Haghparast, A. The role of nitric oxide in the effects of cumin (Cuminum Cyminum L.) fruit essential oil on the acquisition of morphine-induced conditioned place preference in adult male mice. Chinese Journal of Integrative Medicine. , 1-6 (2012).
Ahmadi, A., et al. Synthesis and antinociceptive behaviors of new methyl and hydroxyl derivatives of phencyclidine. Current Medicinal Chemistry. 19, 763-769 (2012).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citar este artigo

Kermani, M., Fatahi, Z., Sun, D., Haghparast, A., French, C. Operant Protocols for Assessing the Cost-benefit Analysis During Reinforced Decision Making by Rodents. J. Vis. Exp. (139), e57907, doi:10.3791/57907 (2018).

Operante protocolos para evaluar el análisis de costo-beneficio en decisiones reforzadas por roedores

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Declarações

Acknowledgements

Materials

Referências

Tags

Play Video

Citar este artigo

View Video

Operante protocolos para evaluar el análisis de costo-beneficio en decisiones reforzadas por roedores

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Declarações

Acknowledgements

Materials

Referências

Tags

Play Video

Citar este artigo

View Video

✖

To prove you're not a robot, please enter the text in the image below