Summary

Generación de base de datos integral de Oncología Torácica - Herramienta para la Investigación Traslacional

Published: January 22, 2011
doi:

Summary

Una base de datos de oncología torácica fue desarrollado para servir como un repositorio global de datos clínicos y de laboratorio para los fines de la investigación traslacional. La base de datos servirá investigadores traslacional del cáncer dentro del Programa de Oncología Torácica de Investigación. Esta base de datos se adapta a los modelos de otros tipos de cáncer, así como otras enfermedades humanas.

Abstract

El Programa de Oncología Torácica del proyecto de base de datos fue creada para servir como un repositorio global, verificada, y accesible para los especímenes de cáncer de bien anotado y los datos clínicos a disposición de los investigadores dentro del Programa de Oncología Torácica de Investigación. Esta base de datos también captura una gran cantidad de datos genómicos y proteómicos obtenidos de diversos estudios de tejido tumoral. Un equipo de investigadores de las ciencias básicas y clínicas, bioestadísticas, y un experto en bioinformática se ha convocado para el diseño de la base de datos. Variables de interés están claramente definidos y sus descripciones fueron escritas en un manual de operación estándar para asegurar la consistencia de la anotación de datos. El uso de un protocolo para los posibles bancos de tejidos y otro protocolo para la banca en retrospectiva, los tumores y muestras de tejido normal de pacientes con su consentimiento para estos protocolos fueron recogidos. La información clínica como la demografía, la caracterización de cáncer, y los planes de tratamiento para estos pacientes se extrajeron y entraron en una base de datos. Datos proteómicos y genómicos han sido incluidos en la base de datos y se han vinculado a la información clínica de los pacientes descritos en la base de datos. Los datos de cada mesa estaban vinculados con la función de las relaciones en Microsoft Access para permitir que el administrador de base de datos para conectar la información clínica y de laboratorio durante una consulta. Los datos solicitados pueden ser exportados para el análisis estadístico y la generación de hipótesis.

Protocol

1. Clínico Universitario de Protocolos de Investigación: Dos protocolos de la universidad se han desarrollado para los propósitos de esta iniciativa. El primer protocolo permite la adquisición potencial de los tejidos de cáncer de pulmón, cáncer de esófago, tumor carcinoide, timoma, y ​​pacientes con mesotelioma. El protocolo también permite que los fluidos corporales de sangre y otros que se obtuvieron de los pacientes para los estudios de biomarcadores. El protocolo permite a los investigadores para obtener la información clínica del paciente de la fuente de esos especímenes a través de la abstracción gráfica y para almacenar muestras y datos clínicos en una base de datos protegida. El segundo protocolo es similar al primero, salvo que permite a los investigadores para acceder a los tejidos previamente bancos y otras muestras obtenidas durante el curso del diagnóstico de cáncer de un paciente y el tratamiento. Los pacientes que han dado su consentimiento para la cirugía en la Universidad de Chicago y que han firmado este protocolo son elegibles. 2. Datos clínicos Protocolo Colección: Pacientes que atienden en la Universidad de Chicago Medical Center para el tratamiento de los tumores malignos mencionados fueron incluidos en este protocolo. Los pacientes elegibles fueron identificados por el oncólogo tratante y se aceptó por un miembro del equipo clínico entrenado en los dos protocolos. Una vez dado su consentimiento, la información de un paciente la historia clínica se obtuvo a través de la abstracción gráfica y se introdujo en la base de datos por un miembro del equipo de apoyo clínico. 3. Muestra Protocolo de Colección: Las muestras de tejido Tejidos que contienen una enfermedad maligna conocida o sospechada obtenidos durante la atención clínica estándar de un paciente a través de biopsia o cirugía se incluyeron en este protocolo. No tejido adicional, fuera de lo necesario para estudio diagnóstico de un paciente, se obtuvo. Después de la extirpación quirúrgica de la muestra necesario para la preparación de secciones fijas, el tejido residual se colocó en hielo. Un técnico de obtención de tejidos transporta la muestra residual de hielo en el departamento de patología. Resto de los tejidos fueron pesados, medidos, transferido al almacenamiento, etiquetado, y debidamente documentados de acuerdo con el procedimiento operativo estándar. Almacenamiento a largo plazo de las muestras se mantuvo en un congelador de -80 º C en el departamento de patología. Para acceder a muestras de tejido de pacientes que habían sometido a cirugía por un tumor maligno torácico, las listas de pacientes mantenidos por colaborar cirujanos y oncólogos de radiación se hace referencia. De esta manera, los pacientes fueron identificados de interés. Sus muestras de tejido tumoral se pudo recuperar el departamento de patología si se obtuvo el consentimiento. Las muestras de sangre Cuando la sangre se llama clínicamente indicado, el protocolo también permitió un adicional de dos a seis tubos de sangre en un 5 ml tapa verde (heparina) del tubo, un tubo de 10 ml punta morada (EDTA línea germinal del ADN) y un top 10 ml de color rojo (suero) de tubo de la sangre. Hasta seis muestras en diferentes momentos se tomaron, con la fecha de la extracción de sangre anotada. Las muestras de sangre fueron centrifugadas a 2000 rpm durante 10 minutos. Componentes del plasma y suero fueron alícuotas en tubos criovial en porciones de 1 ml. Para la recogida de las células blancas de la sangre, el 2.1 mL superior de la interfaz / fracción de los glóbulos rojos se resuspendió con 1.2 mL de medio de preservación de células (MEM EBS medios de comunicación + 10% de suero fetal de cal + 5% de DMSO). Todas las muestras fueron congelados lentamente en una caja de congelación isopropílico al 70-80 º C durante 16-24 horas luego fue trasladado a un -70 ° C a -80 ° C caja de almacenamiento. Todas las muestras fueron marcadas con un identificador único con código de barras y debidamente documentados en la forma de adquisición de la muestra por un técnico de laboratorio. Otros fluidos corporales: El líquido no se recoge para su uso clínico puede ser recogida y almacenada en este protocolo. Las muestras de esputo fueron recogidas y enviadas a la citología. Las muestras de esputo fueron almacenadas en hielo a 4 º C durante su traslado. Las muestras de esputo fueron transferidos a tubos Falcon de 15 ml y se centrifuga a 1400 rpm durante 10 minutos. El sobrenadante se dividió en alícuotas de 4 ml en porciones cyrovials 6 ml. Cyrovials se colocaron en un congelador, en hielo seco, o en una caja isopropílico congelación para su posterior congelación a un -70 ° C a -80 ° C. Después de 16-24 horas, las muestras fueron trasladados a un -70 ° C a -80 ° C caja de almacenamiento. Todas las muestras fueron marcadas con un identificador único con código de barras y debidamente documentados en la forma de adquisición de la muestra por un técnico de laboratorio. 4. Construcción de la Infraestructura Informática: Después de evaluar una serie de programas de gestión de bases de datos, Microsoft Access fue seleccionado como el programa a la casa de los datos clínicos y de laboratorio para el torácica enPrograma de farmacología de base de datos del proyecto sobre la base de su operatividad y capacidad de vincular conjuntos de datos relacionados. Un equipo de médicos, investigadores de ciencia básica, un experto en bioestadística, y un experto en bioinformática se ha convocado para identificar las variables de interés para la captura en la base de datos. El equipo identificó los elementos de datos relacionados con la demografía de los pacientes, la caracterización del cáncer, los factores epidemiológicos, y la anotación de muestra basado en las necesidades de los investigadores en oncología torácica y en referencia a las normas establecidas en relación con elementos de datos comunes (CDE) por el Instituto Nacional del Cáncer. El equipo desarrolló un esquema de codificación para hacer que los datos analizables con fines de investigación. Cuando sea posible, los datos se codifican utilizando las variables numéricas con el fin de reducir la cantidad de texto libre entrada en la base de datos. Variables de interés fueron divididas en siete mesas diferentes dentro de Microsoft Access para capturar distintos aspectos de la información relacionada. 5. El diseño del contenido de cada tabla: Siete mesas de primaria fueron creados: 1) mesa de los pacientes, 2) muestra la tabla de datos, 3) TMA mesa, 4) Las muestras de ADN de mesa, 5) en el pecho mesa de la Conferencia de Oncología, 6) la tabla de líneas celulares, y el 7) C. elegans mesa. La mesa de los pacientes fue diseñado como la única tabla en la base de datos a la casa de la información clínicamente relevante sobre los pacientes, el cáncer, su evolución clínica, los factores de riesgo, y sus resultados (Fig. 1). La intención de este diseño particular era limitar la redundancia en la base de datos. Los enlaces de datos de ejemplo de mesa muestras patológicas a las fuentes del paciente. Cada muestra tiene un número de muestras de patología y este número está relacionado con el número del paciente expediente médico. Múltiples muestras se puede obtener de cada individuo y por lo que el cuadro también incluye información sobre la fecha en que se obtuvo la muestra y el tipo de muestra recogida: inicial del tumor, un tumor recurrente, o una muestra de la autopsia. La tabla de TMA ha sido utilizado hasta ahora para la captura de datos de expresión de proteínas de 63 proteínas específicas. Un TMA puede ser utilizado para caracterizar la distribución de proteínas expresadas diferencialmente en el tejido tumoral y no tumoral mediante el uso de anticuerpos para localizar proteínas (Fig. 2). Expresión de la proteína está representada por una puntuación de 0, 1, 2 o 3 sobre la base de la impresión del médico forense de la intensidad y el porcentaje de tinción TMA. Cuando se mide la tinción por ciento, una puntuación de 0 indica que no hay manchas, 1 indica menos del 11% de tinción, 2 indica menos de 50% de las manchas, y 3 se indica más del 50% de tinción. Cuando se mide la intensidad, la puntuación se asigna en función de la cantidad relativa de las manchas, también en una escala de 0 a 3. En algunos casos, se desliza IHC también son escaneados en alta resolución y la intensidad de tinción se cuantifica por celular automatizado sistema de imágenes (SIAC), el software de imágenes en paralelo a la puntuación del patólogo. Sin embargo, para las dos técnicas, una mayor puntuación indica una mayor expresión de la proteína. Además, la tabla TMA anota la ubicación de la perforación TMA para referencia futura. Por otra parte, la base de datos incluye el código fuente del tejido (tumor, nodo normal, linfáticos, tejido metastásico), la ubicación dentro de la muestra (centro, borde), la histología del cáncer, y el número de historia clínica para vincular esta información a Los pacientes de la mesa. Las muestras de ADN de la mesa las listas de todo el ADN almacenada en el laboratorio. Muestras de ADN están vinculados a su origen paciente a través del número de los pacientes expediente médico. Información básica acerca de la muestra es capturada para describir el origen de la muestra, incluyendo la localización y la histología del tumor. El propósito de esta tabla es el de describir las alteraciones genéticas que se han caracterizado dentro de la muestra utilizando la reacción en cadena de la polimerasa, secuenciación de ADN estándar, y el análisis mutacional. La tabla también recoge variables como cambios en los aminoácidos, nucleótidos cambios, homocigosis, sinonimia, y el gen en el que la mutación se ha producido. Ejemplos de genes que han sido estudiados incluyen paxillin, CCBL, EGFR, p53, gen KRAS, cMet y EphB4. El investigador que ha caracterizado las mutaciones también aparece. La quinta tabla en la base de datos es la Oncología en el pecho mesa de conferencias. La conferencia de oncología en el pecho es una reunión semanal de los médicos oncólogos, cirujanos torácicos, patólogos, radiólogos, oncólogos de radiación, y otros miembros del equipo de oncología torácica clínicos que se reúnen para desarrollar planes coordinados de tratamiento del paciente. El propósito de esta tabla es una lista de los pacientes que han sido discutidos en la conferencia como parte de su nivel de atención. Información sobre la disponibilidad de muestras patológicas para cada paciente también se refleja en esta tabla. La sexta mesa es la mesa de las líneas celulares. Esta es una tabla de pie libre dentro de la base de datos, ya que no está vinculada a ninguna de las otras mesas. En él se describen las líneas celulares que han sido utilizard en el laboratorio con fines de investigación. La tabla refleja los cambios de aminoácidos, cambios de nucleótidos, la homocigosis y sinonimia de las mutaciones, y la ubicación de las mutaciones en el ADN de líneas celulares. La tabla es el séptimo C. elegans mesa y también es una mesa de pie libre. Esta tabla muestra ortólogos quinasas del receptor de tirosina e incluye la puntuación de la aguja, que es una medida de similitud con las proteínas humanas. 6. Establecer relaciones entre tablas: Cada tabla se le asigna una clave principal, que sirve como un identificador único para cada entrada en la tabla. Por definición, un valor de identificador único no se pueden repetir. Por ejemplo, dentro de la tabla pacientes, la clave principal es el número de historia clínica ya que un MRN sólo puede significar un individuo único. Dentro de la tabla de datos de ejemplo, la clave principal es la muestra de la patología (SP) número. Como el ADN y las muestras TMA tablas no tienen identificadores únicos, un número ficticio se estableció como la clave principal. Las tablas de TMA y el ADN se asoció entonces con las otras tablas con el MRN y los números de SP, respectivamente. Esto asegura que cada golpe TMA y la muestra de ADN están ligados de nuevo a la información específica sobre la muestra y la información clínica del paciente donante. En Microsoft Access, las tablas individuales se vinculan a través de sus claves principales de tal manera que las relaciones lógicas se establecen (Fig. 3). Estas relaciones son necesarias para generar consultas en las que se recopilan los datos de varias tablas. 7. Consulta: La realización de una consulta de conjuntos de datos relacionados es relativamente simple en Microsoft Access. Una consulta puede ser diseñado por la selección de la "opción de diseño de la consulta" en la ficha crear. Tablas como los campos de interés se seleccionan y se muestran. Las variables de las tablas de interés son seleccionados y, si es necesario, se puede filtrar a criterio del investigador de interés (Fig. 4). La consulta se puede ejecutar, lo que resulta en los campos que desee que figuran en forma de hoja de cálculo. 8. Exportación de datos: Una vez que una consulta se ha generado, los datos pueden ser exportados. Aunque la mayoría de los investigadores prefieren los datos para estar en la forma de una hoja de cálculo Microsoft Excel, los datos pueden ser exportados a un número de otros programas mediante el menú de exportación en los "datos externos" ficha. Los datos pueden ser guardados con la extensión de archivo correspondiente. Cuando se exportan los datos a efectos estadísticos, un determinado conjunto de variables se incluyen en la exportación a fin de que un análisis completo se puede hacer para controlar las covariables. 9. Importación de datos: La importación de los datos requiere una combinación perfecta entre el formato de los datos importados y el formato de la tabla en Access. Las variables de interés dentro de la tabla a importar deben tener el mismo nombre que la tabla de Access. La ortografía debe ser exacta y no puede haber espacios donde los espacios no existen en la tabla de Access. Una vez que la simetría entre las dos tablas se alcanza, el usuario tiene la posibilidad de utilizar una consulta de actualización o añadir para importar los datos en Access. Una consulta de datos anexados permitirá al usuario agregar nuevas filas de datos en la base de datos Access. Por ejemplo, si se dispone de información sobre los pacientes que no estaban ya en la base de datos, una consulta de datos anexados se podría utilizar para añadir a los pacientes. Sin embargo, si los nuevos datos se encuentra disponible en los pacientes o muestras que deben ser modificadas, una consulta de actualización se debe realizar en las entradas. 10. Actualización de la Base de Datos: Los miembros del proyecto de base de datos han prescrito los roles para asegurar que la base de datos se mantiene al día. Un empleado de tiempo completo se encarga de regular poblando y la actualización de la base de datos con información clínica sobre la base de los pacientes que han consentido en la clínica. Otro empleado de tiempo completo, en calidad de administrador de datos, se encarga de la obtención de los datos de laboratorio en cuanto esté disponible y la introducción de esta información en la base de datos con una actualización o consulta de datos anexados. Los asistentes de investigación que están capacitados en el protocolo son responsables de realizar una actualización sistemática de la base de datos cada seis meses para obtener los datos más recientes disponibles. Esto es particularmente importante para los campos tales como el estado vital y la fecha del último contacto, ya que estos campos tienen un impacto directo en los análisis de supervivencia realizado sobre los datos. 11. El acceso a la base de datos: La base de datos sólo es accesible a las personas que cumplen con la ley HIPAA y se incluyen en el protocolo del IRB. El acceso se reduce a los individuos entrenados en Microsoft Access y que tienen responsabilidades directas en la actualización o modificación de los datos. Los investigadores que han contribuido a la base de datos puede solicitar información a la base de datos del gestor de datos, pero son ellos mismosno se les permite acceder a los datos directamente. El administrador de datos proporciona información sin identificación a los investigadores solicitar mediante la eliminación de variables como el número de historia clínica y el nombre del paciente cuando se genera una consulta de exportación. 12. Los resultados representativos: Un investigador puede estar interesado en saber el significado clínico de la sobreexpresión de la proteína en paxilina cáncer no microcítico de pulmón de células. Como este investigador ha generado una gran cantidad de datos TMA en la base de datos para paxillin, el administrador de datos aprueba la solicitud del investigador para acceder a la información clínica que se correlaciona con los datos de laboratorio. El administrador de datos se ejecuta una consulta en la que combina la tabla de pacientes y la tabla de TMA. Variables de interés de la mesa de los pacientes incluyen la fecha de nacimiento del paciente, de su raza, la histología del cáncer, la etapa del cáncer, la fecha de su diagnóstico, su estado vital, la fecha de su muerte, y la fecha del último contacto. El uso de estas variables, tales como la edad al momento del diagnóstico y el estadio, los factores de confusión importantes pueden ser contabilizados y controlados. Desde la mesa de TMA, la información importante como el tipo de tumor y la expresión de la proteína puede ser comprobada. Como las dos tablas están vinculadas a través del número de historia clínica, la información del paciente de los individuos cuyos tumores han sido estudiados para la expresión de paxillin se incluyen en la salida. Los resultados se pueden filtrar para que sólo los pacientes con cáncer no microcítico de pulmón de células se muestran. Los resultados pueden ser aún más refinada basada en las necesidades del investigador. Estos resultados se pueden exportar para el análisis de los datos primarios de la bioestadística y los resultados se comparten con el investigador. Página de inicio del Proyecto: plantilla de base de datos Access y procedimiento operativo estándar están disponibles en: http://www.ibridgenetwork.org/uctech/salgia-thoracic-oncology-access-template Licencia: disponible gratuitamente para uso académico y sin fines de lucro. Las restricciones al uso por los no académicos: Los usuarios comerciales necesitan una licencia. Para preguntas relacionadas con los usos comerciales, por favor póngase en contacto con la Universidad de Chicago Oficina de Tecnología y Propiedad Intelectual (UChicagoTech) al (773) 702 a 1.692 o www.tech.uchicago.edu Figura 1. Una captura de pantalla de la base de datos Access que muestra una sección de la tabla de pacientes. Figura 2. Esquemático que representa un microarray tisular (TMA) 2 Figura 3. Imagen que muestra las relaciones establecidas entre las tablas de la base de datos Access. Tablas están vinculadas a través de las claves principales. Figura 4. Ejemplo de consulta para la mutación paxilina, los resultados de TMA, y las variables clínicas.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabajo fue apoyado por subvenciones del NIH 5R01CA100750-07, 5R01CA125541-04, 3R01CA125541-03S1, 5R01CA129501-03, 3R01CA129501-02S1 de RS

Materials

Material Name Company Catalogue Number
Centrifuge Eppendorf
Conical centrifuge tube Falcon 518-PG
Minimum essential medium eagle (MEM) Sigma M4655-500ML
Fetal Calf Serum Cellgro FBS HI MTT35011CV
Dimethyl Sulfoxide (DMSO) American Bioanalytical AB03091
BD Vacutainer Serum Tubes Fischer Scientific 367815

References

  1. Adamski, J., Finnegan, K. New Perspectives on Microsoft Office Access. , (2007).
  2. Giltnane, J., Rimm, D. Technology Insight: Identification of biomarkers with tissue microarray technology. Nat Clin Pract Oncol. 1, 104-111 (2004).

Play Video

Cite This Article
Surati, M., Robinson, M., Nandi, S., Faoro, L., Demchuk, C., Kanteti, R., Ferguson, B., Gangadhar, T., Hensing, T., Hasina, R., Husain, A., Ferguson, M., Karrison, T., Salgia, R. Generation of Comprehensive Thoracic Oncology Database – Tool for Translational Research. J. Vis. Exp. (47), e2414, doi:10.3791/2414 (2011).

View Video