Summary

Generation umfassender Thoracic Oncology Database - Tool für Translational Research

Published: January 22, 2011
doi:

Summary

Eine Brust-Onkologie-Datenbank wurde entwickelt, um als eine umfassende Quelle für klinische Daten und Laborwerte für die Zwecke der translationalen Forschung dienen. Die Datenbank wird translationalen Krebsforschung in der Thoracic Oncology Research Program dienen. Diese Datenbank ist anpassungsfähig zu anderen Krebs-Modelle, sowie andere Erkrankungen des Menschen.

Abstract

Das Thoracic Oncology Program Database Project wurde geschaffen, um ein umfassendes, verifiziert und zugänglich Repository für gut kommentierten Krebs Proben und klinischen Daten zur Verfügung zu stehen Forschern innerhalb der Thoracic Oncology Research Program dienen. Diese Datenbank erfasst auch eine große Menge von Genom-und Proteom-Daten aus verschiedenen Tumorgewebe Studien erhalten. Ein Team von klinischen und wissenschaftlichen Forschern, ein Biostatistiker, und ein Bioinformatik-Experte wurde einberufen, um die Datenbank-Design. Variablen von Interesse waren klar definiert und ihre Beschreibungen wurden in einem Standard-Betriebsanleitung geschrieben, um die Konsistenz der Daten-Annotation zu gewährleisten. Mit einem Protokoll für angehende Gewebe Banking und ein anderes Protokoll für die retrospektive Banking, Tumor-und Normalgewebe von Patienten zugestimmt, diese Protokolle gesammelt wurden. Klinische Daten wie Demographie, Krebs Charakterisierung und Behandlung Pläne für diese Patienten wurden abstrahiert und in eine Access-Datenbank. Proteomik und Genomik Daten in die Datenbank aufgenommen und haben zu klinischen Informationen für Patienten in der Datenbank beschrieben in Verbindung gebracht worden. Die Daten aus den einzelnen Tabellen verknüpft wurden unter Verwendung der Beziehungen Funktion in Microsoft Access, damit die Datenbank-Manager zu klinischen Informationen während einer Abfrage verbinden. Die abgefragten Daten können dann für statistische Analysen und Hypothesen Generation exportiert werden.

Protocol

1. Universität Clinical Research Protokolle: Zwei Uni-Protokolle wurden für die Zwecke dieser Initiative entwickelt. Das erste Protokoll ermöglicht die zukünftige Beschaffung von Geweben an Lungenkrebs, Speiseröhrenkrebs, Karzinoid, Thymom und Mesotheliom-Patienten. Das Protokoll erlaubt auch Blut und anderen Körperflüssigkeiten von Patienten für Biomarker-Studien gesammelt werden. Das Protokoll erlaubt Forschern, klinischen Informationen des Patienten Quelle solcher Exemplare via Diagramm Abstraktion und beide Proben und klinischen Daten in einer geschützten Datenbank gespeichert zu erhalten. Das zweite Protokoll ist ähnlich dem ersten, außer dass sie ermöglicht es den Forschern bisher überhöhten Geweben und anderen Proben im Verlauf eines Patienten Krebsdiagnose und-behandlung erhalten Zugang. Patienten, die eine Operation eingewilligt haben an der Universität von Chicago haben und die dieses Protokoll unterzeichnet, sind förderfähig. 2. Clinical Data Collection-Protokoll: Patienten, die an der University of Chicago Medical Center zur Behandlung der genannten Tumoren gesehen wurden in diesem Protokoll enthalten. Geeignete Patienten wurden von ihrem behandelnden Onkologen identifiziert und wurden von einem Mitglied des klinischen Teams in den beiden Protokollen geschult zugestimmt. Sobald eingewilligt, eine Anamnese Informationen über Grafik Abstraktion gewonnen und wurde in die Datenbank von einem Mitglied der klinischen Support-Team eingegeben. 3. Probenentnahme-Protokoll: Gewebeproben Gewebe mit einer bekannten oder vermuteten Malignität bei einem Patienten der Standard der klinischen Versorgung via Biopsie oder Operation gewonnen wurden in diesem Protokoll enthalten. Keine zusätzlichen Gewebe, außerhalb dessen, was notwendig war für einen Patienten Diagnostik, erhalten. Nach der chirurgischen Entfernung der Probe notwendig für die Herstellung von permanenten Abschnitten wurde das restliche Gewebe auf Eis gelegt. Eine Gewebeentnahme Techniker transportiert die restliche Probe auf Eis, um die Pathologie-Abteilung. Verbleibenden Gewebe wurden gewogen, vermessen, zu einem Speicher transportiert, gekennzeichnet und ordnungsgemäß nach den standard operating procedure dokumentiert. Langfristige Lagerung der Proben wurde in einem -80 ° C Gefrierschrank in der Pathologie gehalten. Um Gewebeproben von Patienten, die bereits Chirurgie für eine Brust-Malignität durchgemacht hatte Zugang, wurden Listen von Patienten durch die Zusammenarbeit Chirurgen und Strahlentherapeuten gepflegt verwiesen. Auf diese Weise Patienten von Interesse identifiziert wurden. Ihre Tumorgewebeproben konnte von der Abteilung für Pathologie abgerufen werden, wenn Einwilligung erteilt wurde. Blutproben Während klinisch indiziert Blutentnahmen, das Protokoll auch für eine zusätzliche zwei Minuten vor sechs Röhrchen Blut in eine 5 ml grüne Spitze (Heparin) Röhre erlaubt, eine 10 ml lila Oberrohr (EDTA Keimbahn DNA) und eine 10 ml red top (Serum) Rohr von Blut. Bis zu sechs Proben zu verschiedenen Zeitpunkten genommen wurden, mit dem Datum der Blutentnahme kommentiert. Blutproben wurden bei 2000 rpm für 10 Minuten zentrifugiert. Plasma und Serum-Komponenten wurden in Kryoröhrchen Rohre in 1 ml Portionen aliquotiert. Für die Sammlung von weißen Blutkörperchen, wurden die oberen 1-2 mL der Schnittstelle / roten Blutkörperchen Fraktion mit 1-2 ml Zellkonservierung Medium (MEM EBS Media + 10% fötalem cal Serum + 5% DMSO) resuspendiert. Alle Proben wurden langsam in eine Isopropylgruppe Gefrierbox bei 70-80 ° C tiefgefroren 16-24 Stunden dann zu einer -70 ° C bis -80 ° C Aufbewahrungsbox übertragen. Alle Proben wurden mit einem Barcode-eindeutige Kennung gekennzeichnet und entsprechend in der Probe Beschaffung Form von einem Labortechniker dokumentiert. Andere Körperflüssigkeiten: Flüssigkeit nicht für den klinischen Einsatz gesammelt könnten gesammelt und im Rahmen dieses Protokolls gespeichert werden. Sputum-Proben wurden gesammelt und für die Zytologie. Sputum-Proben wurden auf Eis bei 4 ° C gelagert, während sie übertragen wird. Sputum-Proben wurden dann auf 15 mL Falcon-Röhrchen überführt und zentrifugiert bei 1400 rpm für 10 Minuten. Der Überstand wurde in 4 ml-Portionen in 6mL cyrovials aliquotiert. Cyrovials wurden in einem Gefrierschrank gelegt, auf Trockeneis oder in eine Isopropylgruppe Gefrierbox, um anschließend zu einer -70 ° C werden zu -80 ° C eingefroren Nach 16-24 Stunden wurden die Proben zu einer -70 ° C bis -80 ° C Aufbewahrungsbox übertragen. Alle Proben wurden mit einem Barcode-eindeutige Kennung gekennzeichnet und entsprechend in der Probe Beschaffung Form von einem Labortechniker dokumentiert. 4. Aufbau der Informatik-Infrastruktur: Nach der Auswertung einer Reihe von Datenbank-Management-Programme, wurde von Microsoft Access als das Programm zu Haus klinischen und Labordaten für die Thoracic ausgewählten Onlogie Program Database Project on seine Funktionsfähigkeit und die Fähigkeit, zusammenhängende Sätze von Datenverbindung basiert. Ein Team von Ärzten, die Grundlagenforschung Forscher, ein Biostatistiker, und ein Bioinformatik-Experte wurde einberufen, um Variablen von Interesse zu identifizieren, um in der Datenbank zu erfassen. Das Team identifizierte Datenelemente im Zusammenhang mit Patientendaten, Krebs Charakterisierung, epidemiologischen Faktoren und Probe Anmerkung auf die Bedürfnisse der Thorax-Onkologie Forscher basieren und unter Bezugnahme auf Standards setzen in Bezug auf Common Data Elements (CDEs) durch das National Cancer Institute. Das Team entwickelte eine Kodierung, um Daten auswertbar zu Forschungszwecken. Wenn möglich, wurden die Daten codiert mit numerischen Variablen, so dass die Menge des freien Text in die Datenbank eingegeben wird. Variablen von Interesse waren unter sieben verschiedenen Tabellen in Microsoft Access unterteilt, um vielfältige Aspekte der Informationen zu erfassen. 5. Designing die Inhalte der einzelnen Tabelle: Sieben primären Tabellen erstellt wurden: 1) Patienten Tisch, 2) Sample Data Tisch, 3) TMA Tisch, 4) DNA Proben Tabelle 5) Chest Oncology Conference Tisch, 6) Cell Line Tisch, und das 7) C. elegans Tisch. Die Patienten Tisch war als einzige Tabelle in der Datenbank zu einer klinisch relevanten Informationen über den Patienten, deren Krebs, ihre klinischen Verlauf, ihre Risikofaktoren und deren Ergebnisse (Abb. 1) Haus entworfen. Die Absicht dieser besonderen Konstruktion wurde auf Redundanz innerhalb der Datenbank zu begrenzen. Das Sample Data Tabelle links pathologische Präparate, ihre Patienten Quellen. Jede Probe ist eine Probe Pathologie Nummer gegeben und diese Zahl ist, die Patientenakte Zahl zusammen. Mehrere Proben können von jedem einzelnen erzielt werden und so die Tabelle enthält auch Informationen über das Datum der Probe gewonnen wurde, und die Art der Probe gesammelt: initial Tumor, Rezidiv oder Autopsie Probe. Die TMA-Tabelle wurde bisher auf die Proteinexpression Daten für 63 einzigartige Proteine ​​erfassen verwendet. Eine TMA können verwendet werden, um die Verteilung von differentiell exprimierten Proteinen in Tumor-und Nicht-Tumorgewebe charakterisieren durch die Verwendung von Antikörpern zu lokalisieren Proteine ​​(Abb. 2). Die Proteinexpression wird durch einen Score von 0, 1, 2 oder 3 auf dem Pathologen Eindruck von der Intensität und der Prozentsatz der TMA-Färbung, vertreten. Als Prozent Färbung gemessen wird, einen Wert von 0 keine Färbung zeigt, bedeutet 1 weniger als 11% Färbung, 2 zeigt weniger als 50% Färbung, und 3 gibt mehr als 50% Färbung. Wenn die Intensität gemessen wird, ist eine Punktzahl basierend auf der relativen Menge der Färbung, auch auf einer Skala von 0 bis 3 zugeordnet. In einigen Fällen sind IHC Folien auch bei hoher Auflösung eingescannt und Intensität der Färbung wird durch automatisierte Cellular Imaging System (ACIS) Imaging-Software parallel zu den Pathologen Scoring quantifiziert. Doch für beide Techniken, deutet auf eine höhere Punktzahl größer Proteinexpression. Darüber hinaus kommentiert die TMA-Tabelle die Position der TMA Punsch für die Zukunft. Darüber hinaus enthält die Datenbank die Quelle des Gewebes (Tumor, normal, Lymphknoten, Metastasen Gewebe), die Lage in der Probe (Mitte, Rand), die Histologie des Krebses, und das medizinische Rekordzahl diese Informationen zurück zur die Patienten Tisch. Die DNA-Proben Tabelle listet alle DNA im Labor gelagert. DNA-Proben werden auf ihre Patienten Quelle über die Patientenakte Nummer verknüpft. Grundlegende Informationen über die Probe wird erfasst, um die Quelle der Probe, einschließlich der Lage und der Histologie des Tumors zu beschreiben. Der Zweck dieser Tabelle ist es, die genetischen Veränderungen, die in der Probe mittels Polymerase-Kettenreaktion, Standard-DNA-Sequenzierung und Mutationsanalysen charakterisiert wurden zu beschreiben. Die Tabelle erfasst auch Variablen wie Aminosäureaustausche, Nukleotidänderungen, Homozygotie, Synonymie, und das Gen, in dem die Mutation aufgetreten ist. Beispiele für Gene, die untersucht worden sind, gehören Paxillin, CCBL, EGFR, p53, KRAS, CMET und EphB4. Die Ermittler, die Mutationen charakterisiert hat, ist ebenfalls aufgeführt. Die fünfte Tabelle innerhalb der Datenbank ist die Chest Oncology Conference Tabelle. Die Brust der Onkologie-Konferenz ist ein wöchentliches Treffen der medizinischen Onkologen, Thoraxchirurgen, Pathologen, Radiologen, Strahlentherapeuten und andere Mitglieder der Brust-Onkologie klinischen Team, das eine koordinierte Behandlung von Patienten Pläne entwickeln zu erfüllen. Der Zweck dieser Tabelle ist es, die Patienten, die auf der Konferenz als Teil ihrer Standard of Care diskutiert wurden-Liste. Informationen über die Verfügbarkeit von pathologischen Präparaten für jeden Patienten ist auch in dieser Tabelle erfasst. Die sechste Tabelle ist die Zelllinien Tisch. Dies ist eine freistehende Tabelle innerhalb der Datenbank, weil es nicht zu einer der anderen Tabellen verknüpft. Es beschreibt die Zelllinien, die zu nutzen sindd im Labor für die Forschung. Die Tabelle erfasst die Aminosäure-Veränderungen, Nukleotid-Veränderungen, die Homozygotie und Synonymie von Mutationen, und die Lage der Mutationen innerhalb Zelllinie DNA. Die siebte Tabelle ist die C. elegans Tisch und es ist auch eine freistehende Tisch. Diese Tabelle listet orthologen Rezeptor-Tyrosin-Kinasen und umfasst die Nadel der Gäste, die ein Maß für die Ähnlichkeit mit menschlichen Proteinen. 6. Aufbau von Beziehungen zwischen Tabellen: Jede Tabelle ist ein Primärschlüssel, die als eindeutige Kennung für jeden Eintrag in der Tabelle dient zugeordnet. Per Definition kann eine eindeutige Kennung Wert nicht wiederholt werden. Zum Beispiel, in der Patienten-Tabelle wird der Primärschlüssel der medizinischen Rekordzahl da eine MRN nur bedeuten, kann man einzigartiges Individuum. Innerhalb der Sample Data Tabelle ist der Primärschlüssel der Probe Pathologie (SP) an. Wie die TMA-und DNA-Proben Tabellen nicht haben eindeutige Kennungen wurde eine Dummy-Nummer als Primärschlüssel festgelegt. Die TMA-und DNA-Tabellen wurden dann zu den anderen Tabellen mit der MRN und die SP-Nummern verknüpft, bzw.. Dadurch wird sichergestellt, dass jeder TMA Punsch und DNA Probe zurück sind, um sowohl spezifische Informationen über die Probe und klinische Informationen aus der Spende von Patienten verbunden. In Microsoft Access werden die einzelnen Tabellen über ihre Primärschlüssel, dass logische Beziehungen aufgebaut werden (Abb. 3) verbunden. Diese Beziehungen sind notwendig, um Anfragen, bei denen Daten aus mehreren Tabellen gesammelten generieren. 7. Abfragen: Das Ausführen einer Abfrage der entsprechenden Datensätze ist relativ einfach in Microsoft Access. Eine Abfrage kann durch Auswahl der "Query Design-Option" unter der Registerkarte Erstellen gestaltet werden. Tabellen mit den Bereichen von Interesse sind, ausgewählt und angezeigt. Variablen aus den Tabellen von Interesse sind, ausgewählt und, falls erforderlich, können auf der Basis des Forschers Kriterien von Interesse (Abb. 4) gefiltert werden. Die Abfrage kann dann ausgeführt werden, was zu der gewünschten Felder in Form von Tabellen aufgelistet. 8. Exportieren von Daten: Sobald eine Abfrage generiert wurde, können die Daten exportiert werden. Während die meisten Forscher die Daten lieber in Form einer Microsoft Excel-Tabelle werden können Daten zu einer Reihe von anderen Programmen über die Export-Menü unter dem "externen Daten"-Reiter exportiert werden. Die Daten können gespeichert unter Verwendung der entsprechenden Dateiendung. Wenn die Daten für statistische Zwecke exportiert wurde, wurden einer vorgeschriebenen Satz von Variablen in den Export eingeschlossen, so dass eine umfassende Analyse kann getan werden, um für die Kovariaten kontrollieren. 9. Importieren von Daten: Importieren der Daten erfordert eine perfekte Übereinstimmung zwischen dem Format der importierten Daten und das Format der Tabelle in Access. Die Variablen von Interesse innerhalb der Tabelle zu importieren müssen den gleichen Namen wie die Access-Tabelle. Die Schreibweise muss exakt sein und es kann keine Räume, in denen Räume nicht in der Access-Tabelle nicht vorhanden sein. Sobald Symmetrie zwischen den beiden Tabellen wird erreicht, hat der Benutzer die Möglichkeit, eine append verwenden oder Update-Abfrage, die Daten in Access importieren. Eine Anfügeabfrage wird dem Benutzer erlauben, neue Datenzeilen in der Access-Datenbank hinzuzufügen. Zum Beispiel, wenn Informationen finden Sie über Patienten, die nicht bereits in der Datenbank, könnte eine Anfügeabfrage verwendet, um diejenigen Patienten hinzugefügt werden. Allerdings, wenn neue Daten verfügbar sind auf Patienten oder Proben, die geändert werden müssen, müssen Sie eine Aktualisierungsabfrage auf die Einträge vorgenommen werden. 10. Aktualisieren der Datenbank: Die Mitglieder des Datenbank-Projekt haben die Rollen bei der Sicherstellung, dass die Datenbank immer aktuell ist vorgeschrieben. Eine Vollzeitkraft ist mit regelmäßig auffüllen und Aktualisierung der Datenbank mit klinischen Daten über Patienten, die in der Klinik gewesen zugestimmt Basis beauftragt. Eine weitere Vollzeitkraft und dient als Daten-Manager, ist mit der Erlangung Labordaten sobald sie verfügbar sind und die Eingabe dieser Informationen in die Datenbank mit einem Update oder Anfügeabfrage berechnet. Wissenschaftliche Mitarbeiter, die in das Protokoll ausgebildet sind verantwortlich für die Durchführung einer systematischen Aktualisierung der Datenbank alle sechs Monate auf die jüngsten verfügbaren Daten zu erhalten. Dies ist besonders wichtig für Bereiche wie wichtig und Datum des letzten Kontaktes, wie diese Felder einen direkten Einfluss auf das Überleben Analysen der Daten durchgeführt haben. 11. Der Zugriff auf die Datenbank: Die Datenbank ist nur für Personen, die HIPAA-konform sind und unter dem IRB-Protokoll enthalten. Der Zugang ist weiter an Privatpersonen in Microsoft Access und die direkte Verantwortung haben für die Aktualisierung oder Änderung der Daten trainiert reduziert. Forscher, die in der Datenbank beigetragen haben Informationen aus der Datenbank aus den Daten-Manager an, aber sie selbst sindnicht gestattet, die Daten direkt zugreifen. Die Daten-Manager bietet de-identifizierte Informationen an den ersuchenden Forscher durch die Beseitigung Variablen wie die Krankenakte Anzahl und den Namen des Patienten bei der Erzeugung einer Exportabfrage. 12. Repräsentative Ergebnisse: Ein Forscher kann daran interessiert zu wissen, die klinische Bedeutung der Überexpression des Proteins Paxillin in nicht-kleinzelligem Lungenkrebs. Da dieser Forscher ein hohes Maß an TMA-Daten in der Datenbank für Paxillin generiert wurde, stimmt der Daten-Manager des Forschers Antrag auf klinische Informationen zugreifen, um mit den Labordaten korreliert. Die Daten-Manager führt eine Abfrage, wo er vereint sowohl die Patienten der Tabelle und der TMA-Tabelle. Variablen von Interesse aus der Patienten-Tabelle sind die Patienten Geburtsdatum, ihrer Rasse, die Histologie der Krebs, der Phase ihrer Krebserkrankung, dem Tag der Diagnose, ihre lebenswichtigen Status, dem Tag des Todes, und deren Datum des letzten Kontaktes. Mit diesen Variablen wie Alter bei der Diagnose und Stadium können wichtige Confounder berücksichtigt und gesteuert werden. Von der TMA-Tabelle können wichtige Informationen wie die Art des Tumors und die Protein-Expression festgestellt werden. Wie die beiden Tabellen über die medizinische Rekordzahl, Patienten Informationen von Einzelpersonen, deren Tumore für Paxillin Ausdruck untersucht worden sind miteinander verbunden sind in der Ausgabe enthalten. Die Ergebnisse können gefiltert werden, so dass nur Patienten mit nicht-kleinzelligem Lungenkarzinom angezeigt werden. Die Ergebnisse können weiter auf die Bedürfnisse der Forscher verfeinert werden. Diese Ergebnisse können für die primäre Datenanalyse durch die Biostatistiker exportiert werden und die Ergebnisse werden dann mit dem Forscher teilten. Die Homepage des Projektes: Access-Datenbank-Vorlage und Standard Operating Procedure sind verfügbar unter: http://www.ibridgenetwork.org/uctech/salgia-thoracic-oncology-access-template Lizenz: Frei verfügbar für akademische und nicht-gewerblichen Gebrauch. Einschränkungen durch Nicht-Akademiker zu verwenden: Kommerzielle Nutzer müssen eine Lizenz erwerben. Bei Fragen zu kommerziellen Einsatz, kontaktieren Sie bitte die University of Chicago Office of Technology und Intellectual Property (UChicagoTech) unter (773) 702-1692 oder www.tech.uchicago.edu Abbildung 1. Ein Screenshot der Access-Datenbank Darstellung einen Abschnitt der Patienten Tabelle. Abbildung 2. Schematische Darstellung einer Gewebe-Mikroarray (TMA) 2 Abbildung 3. Screenshot der Darstellung Beziehungen zwischen Tabellen in der Access-Datenbank eingerichtet. Tabellen werden über Primärschlüssel verknüpft. Abbildung 4. Beispielabfrage für Paxillin Mutation, TMA Ergebnisse und klinische Variablen.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wurde vom NIH gewährt 5R01CA100750-07, 5R01CA125541-04, 3R01CA125541-03S1, 5R01CA129501-03, 3R01CA129501-02S1 zu RS unterstützt

Materials

Material Name Company Catalogue Number
Centrifuge Eppendorf
Conical centrifuge tube Falcon 518-PG
Minimum essential medium eagle (MEM) Sigma M4655-500ML
Fetal Calf Serum Cellgro FBS HI MTT35011CV
Dimethyl Sulfoxide (DMSO) American Bioanalytical AB03091
BD Vacutainer Serum Tubes Fischer Scientific 367815

References

  1. Adamski, J., Finnegan, K. New Perspectives on Microsoft Office Access. , (2007).
  2. Giltnane, J., Rimm, D. Technology Insight: Identification of biomarkers with tissue microarray technology. Nat Clin Pract Oncol. 1, 104-111 (2004).

Play Video

Cite This Article
Surati, M., Robinson, M., Nandi, S., Faoro, L., Demchuk, C., Kanteti, R., Ferguson, B., Gangadhar, T., Hensing, T., Hasina, R., Husain, A., Ferguson, M., Karrison, T., Salgia, R. Generation of Comprehensive Thoracic Oncology Database – Tool for Translational Research. J. Vis. Exp. (47), e2414, doi:10.3791/2414 (2011).

View Video