Summary

Generazione di Comprehensive Database Oncologia Toracica - Strumento per la ricerca traslazionale

Published: January 22, 2011
doi:

Summary

Un database di oncologia toracica è stato sviluppato per servire come un repository completo di dati clinici e di laboratorio ai fini della ricerca traslazionale. La banca dati servirà ricercatori traslazionale sul cancro nell'ambito del Programma di Ricerca Oncologia Toracica. Questo database è adattabile ad altri modelli di cancro, così come altre malattie umane.

Abstract

Il Progetto di Oncologia Toracica Programma di database è stato creato per servire come un approccio globale, repository verificato, e accessibile per ben annotato esemplari cancro e dati clinici di essere a disposizione dei ricercatori nell'ambito del Programma di Ricerca Oncologia Toracica. Questo database cattura anche un grande volume di dati genomici e proteomici ottenuti da diversi studi tessuto tumorale. Un team di ricercatori di scienze cliniche e di base, un biostatistico, e un esperto di bioinformatica è stato convocato per la progettazione del database. Variabili di interesse sono stati chiaramente definiti e le loro descrizioni sono state scritte all'interno di un manuale operativo standard per garantire la coerenza di annotazione dei dati. Utilizzando un protocollo per le banche dei tessuti potenziali e un altro protocollo per il settore bancario retrospettiva, tumori e campioni di tessuto normale di pazienti acconsentito a questi protocolli sono stati raccolti. Informazioni cliniche come la demografia, la caratterizzazione del cancro, e piani di trattamento per questi pazienti sono stati estratti ed è entrato in un database di Access. Dati di proteomica e genomica sono stati inseriti nel database e sono stati collegati alle informazioni cliniche dei pazienti descritti all'interno del database. I dati da ogni tabella sono stati collegati con la funzione di relazioni in Microsoft Access per consentire al gestore di database per collegare le informazioni cliniche e di laboratorio nel corso di una query. I dati richiesti possono essere esportati per analisi statistiche e la generazione di ipotesi.

Protocol

1. Università Ricerca Clinica protocolli: Due protocolli universitari sono stati sviluppati per gli scopi di questa iniziativa. Il primo protocollo consente per l'approvvigionamento di tessuti di cancro al polmone, cancro esofageo, tumore carcinoide, timoma, e pazienti affetti da mesotelioma. Il protocollo consente inoltre di sangue e altri fluidi corporei devono essere raccolti da pazienti per lo studio dei biomarcatori. Il protocollo permette ai ricercatori di ottenere informazioni cliniche del paziente fonte di tali campioni attraverso l'astrazione grafico e per memorizzare i campioni ei dati clinici in un database protetto. Il secondo protocollo è simile al primo, tranne che permette ai ricercatori di accedere tessuti precedentemente sopraelevate e altri campioni ottenuti durante il corso di diagnosi di cancro di un paziente e il trattamento. I pazienti che hanno acconsentito alla chirurgia presso l'Università di Chicago e che hanno firmato questo protocollo sono ammissibili. 2. Raccolta dati clinici protocollo: I pazienti in vista della University of Chicago Medical Center per il trattamento delle neoplasie di cui sopra sono stati inclusi in questo protocollo. I pazienti eleggibili sono stati identificati dal loro oncologo trattamento e sono stati consentita da un membro del team clinico addestrato nei due protocolli. Una volta acconsentito, informazioni sulla storia medica di un paziente è stato ottenuto attraverso l'astrazione chart ed è stato inserito nel database, da un membro del team di supporto clinico. 3. Raccolta Protocollo: Campioni di tessuto I tessuti contenenti una nota o sospetta neoplasia ottenuti durante la terapia standard clinici di un paziente tramite una biopsia o un intervento chirurgico sono stati inclusi in questo protocollo. Nessun tessuto supplementare, al di fuori di ciò che era necessario per iter diagnostico di un paziente, è stato ottenuto. Dopo la rimozione chirurgica del campione necessario per la preparazione di sezioni permanenti, il tessuto residuo è stato immesso sul ghiaccio. Un tecnico approvvigionamento dei tessuti trasportato il campione residuo sul ghiaccio al reparto di patologia. Tessuti residui sono stati pesati, misurati, trasferiti allo stoccaggio, etichettati, e adeguatamente documentate secondo la procedura operativa standard. Conservazione a lungo termine dei campioni è stata mantenuta in un congelatore ° -80 C nel reparto di patologia. Per poter accedere a campioni di tessuto da pazienti che avevano già subito un intervento chirurgico per una neoplasia toracica, le liste dei pazienti ha mantenuto, collaborando chirurghi e oncologi di radiazione sono state utilizzate. In questo modo i pazienti di interesse sono stati identificati. Loro campioni di tessuto tumorale è stato possibile recuperare dal reparto di patologia se il consenso è stato ottenuto. Campioni di sangue Durante sangue clinicamente indicato disegna, il protocollo ha permesso anche per un ulteriore 2-6 tubi di sangue in 5 ml verde in alto (eparina) tubo, una viola da 10 ml tubo orizzontale (EDTA germinale del DNA) e una top 10 ml rosso (siero) Tubo di sangue. Fino a sei campioni in diversi momenti sono state prese, con la data del sangue disegnare annotato. I campioni di sangue sono stati centrifugati a 2000 rpm per 10 minuti. Componenti del plasma e siero sono stati aliquotare tubi provetta Microbank ™ in 1 ml. Per la raccolta di globuli bianchi, il 1-2 di ml superiore dell'interfaccia / rosso frazione di cellule del sangue sono stati risospesi con 1-2 ml di media conservazione delle cellule (MEM EBS i media + 10% siero fetale cal + 5% DMSO). Tutti i campioni sono stati congelati lentamente in una scatola isopropilico congelamento a 70-80 ° C per 16-24 ore poi trasferito in un -70 ° C a -80 ° C di stoccaggio scatola. Tutti i campioni sono stati etichettati con un codice a barre identificativo univoco e opportunamente documentato nella forma di appalto campione da un tecnico di laboratorio. Altri fluidi corporei: Fluido non sono raccolte per uso clinico potrebbe essere raccolti e conservati ai sensi del presente protocollo. Campioni di escreato sono stati raccolti e inviati per esame citologico. Campioni di escreato sono stati conservati in ghiaccio a 4 ° C durante il trasferimento. Campioni di escreato sono stati poi trasferiti a tubi Falcon da 15 ml e centrifugato a 1400 rpm per 10 minuti. Il supernatante è stato aliquotato in 4 ml di cyrovials 6 ml. Cyrovials sono stati collocati in un congelatore, in ghiaccio secco o in una scatola isopropilico congelamento possa essere successivamente congelati a -70 ° C a -80 ° C. Dopo 16-24 ore, i campioni sono stati trasferiti ad un -70 ° C a -80 ° C di stoccaggio scatola. Tutti i campioni sono stati etichettati con un codice a barre identificativo univoco e opportunamente documentato nella forma di appalto campione da un tecnico di laboratorio. 4. Costruire l'infrastruttura informatica: Dopo aver valutato una serie di programmi di gestione di database, Microsoft Access è stato selezionato come il programma a casa dati clinici e di laboratorio per la Toracica Oncology banca dati del progetto di programma sulla base della sua operatività e capacità di collegare gruppi di dati correlati. Un team di medici, ricercatori di scienze di base, un biostatistico, e un esperto di bioinformatica è stato convocato per identificare le variabili di interesse per catturare all'interno del database. Il team ha identificato gli elementi dati relativi ai dati anagrafici del paziente, la caratterizzazione del cancro, fattori epidemiologici, e annotazione del campione in base alle esigenze dei ricercatori di oncologia toracica e facendo riferimento alle norme stabilite per quanto riguarda elementi di dati comuni (CDES) dal National Cancer Institute. Il team ha sviluppato uno schema di codifica per rendere i dati analizzabili per scopi di ricerca. Quando possibile, i dati sono stati codificati usando le variabili numeriche in modo da ridurre la quantità di testo libero inseriti nel database. Variabili di interesse sono stati suddivisi tra sette differenti tabelle all'interno di Microsoft Access a catturare vari aspetti delle informazioni correlate. 5. Progettare il contenuto di ogni tabella: Sette tabelle primarie sono state create: 1) tavolo pazienti, 2) Esempio di tabella dei dati, 3) TMA tavolo, 4) del DNA tavolo campioni, 5) Busto tavolo Oncologia Conferenza, 6) Linea tavolo Cell, e il 7) C. elegans tavolo. La tabella di pazienti è stato progettato come il tavolo unico all'interno del database per ospitare informazioni di rilevanza clinica sui pazienti, il loro cancro, il loro decorso clinico, i loro fattori di rischio, e il loro esito (Fig. 1). L'intento di questo disegno particolare è stato quello di limitare la ridondanza all'interno del database. I collegamenti dati tabella campione campioni patologici alle loro fonti paziente. Ogni campione viene assegnato un numero campione di patologia e questo numero è legato al numero di cartella clinica del paziente. I campioni multipli possono essere ottenute da ogni individuo e quindi la tabella comprende anche informazioni riguardo la data è stato ottenuto il campione e il tipo di campione raccolto: tumore iniziale, tumore recidivante, o campione autopsia. La tabella TMA è stato utilizzato finora per l'acquisizione dei dati di espressione proteica per 63 specifiche proteine. Un TMA può essere utilizzato per caratterizzare la distribuzione delle proteine ​​differenzialmente espresse nei tessuti tumorali e non tumorali, utilizzando anticorpi per localizzare le proteine ​​(Fig. 2). Espressione della proteina è rappresentato da un punteggio di 0, 1, 2 o 3 sulla base delle impressioni del patologo l'intensità e la percentuale di colorazione TMA. Quando colorazione per cento è misurato, un punteggio pari a 0 indica nessuna colorazione, 1 indica che meno del 11% colorazione, 2 indica che meno del 50% colorazione, e 3 indica superiore al 50% colorazione. Quando l'intensità è misurata, un punteggio viene assegnato in base alla quantità relativa di colorazione, anche su una scala da 0 a 3. In alcuni casi, diapositive IHC sono scansionati in alta risoluzione e l'intensità di colorazione viene quantificato automatico di sistema Cellular Imaging (ACIS), software di imaging in parallelo al gol del patologo. Tuttavia, per entrambe le tecniche, un punteggio più elevato indica una maggiore espressione della proteina. Inoltre, la tabella TMA annota la posizione del punzone TMA per riferimento futuro. Inoltre, il database comprende l'origine del tessuto (tumore, normale, linfonodi, il tessuto metastatico), la posizione all'interno del campione (centro, bordo), l'istologia del tumore, e il numero di cartella clinica di collegare questa informazione ai I pazienti del tavolo. La tabella elenca tutti i campioni di DNA il DNA memorizzati all'interno del laboratorio. Campioni di DNA sono legati alla loro origine paziente attraverso il numero di cartella clinica del paziente. Informazioni di base sul campione viene catturato per descrivere l'origine del campione, tra cui la posizione e l'istologia del tumore. Lo scopo di questa tabella è quello di descrivere le alterazioni genetiche che sono stati caratterizzati all'interno del campione usando la reazione a catena della polimerasi, standard di sequenziamento del DNA e analisi mutazionale. La tabella che cattura anche le variabili come i cambiamenti di aminoacidi, variazioni nucleotidiche, omozigosi, sinonimia, e il gene in cui la mutazione si è verificata. Esempi di geni che sono stati studiati comprendono paxillin, CCBL, EGFR, p53, gene KRAS, CMET e EphB4. L'investigatore che ha caratterizzato le mutazioni è anche elencato. La tabella quinta all'interno del database è la tabella di Oncologia Busto Conferenza. La conferenza di oncologia toracica è un incontro settimanale di oncologi medici, chirurghi toracici, patologi, radiologi, oncologi di radiazione, e gli altri membri del team di oncologia toracica clinici che si incontrano per sviluppare piani di trattamento coordinato dei pazienti. Lo scopo di questa tabella è quello di elencare i pazienti che sono stati discussi durante la conferenza come parte del loro standard di cura. Informazioni riguardanti la disponibilità di campioni patologici per ogni paziente è catturato in questa tabella. La tabella sesta è la tabella linee cellulari. Si tratta di un tavolo permanente gratuito all'interno del database, perché non è legata a nessuna delle altre tabelle. Esso descrive le linee cellulari che sono state utilizzared in laboratorio a scopo di ricerca. La tabella che cattura i cambiamenti di aminoacidi, variazioni nucleotidiche, la omozigosi e sinonimia delle mutazioni, e la posizione di mutazioni nel DNA delle cellule di linea. La tabella settimo è la C. elegans tavolo ed è anche un tavolo free standing. Questa tabella elenca ortologhi tirosin-chinasi del recettore e comprende il punteggio ago, che è una misura di somiglianza con le proteine ​​umane. 6. Stabilire relazioni tra le tabelle: Ogni tabella è assegnata una chiave primaria, che funge da identificativo univoco per ogni voce all'interno della tabella. Per definizione, un valore identificatore univoco, non può essere ripetuto. Per esempio, all'interno della tabella I pazienti, la chiave primaria è il numero di cartella clinica dal momento che un MRN può solo significare un individuo unico. All'interno della tabella dati di esempio, la chiave primaria è il campione di patologia (SP) il numero. Come le tabelle campioni TMA e il DNA non ha avuto identificatori univoci, un numero fittizio è stato stabilito come la chiave primaria. Le tabelle TMA e del DNA sono stati poi collegati alle altre tabelle utilizzando il MRN e il numero SP, rispettivamente. Questo assicura che ogni pugno TMA e campioni di DNA sono legati a entrambe le informazioni specifiche sul campione e informazioni cliniche del paziente donare. In Microsoft Access, singole tabelle sono collegate tramite i loro chiavi primarie in modo che le relazioni logiche sono stabiliti (Fig. 3). Queste relazioni sono necessari per generare query in cui sono raccolti i dati da più tabelle. 7. Interrogazione: Esecuzione di una query di set di dati relativi è relativamente semplice in Microsoft Access. Una query può essere progettato selezionando l'opzione "ricerca di design" nella scheda creare. Le tabelle contenenti i campi di interesse sono selezionati e visualizzati. Variabili dalle tabelle di interesse vengono selezionati e, se necessario, possono essere filtrati in base a criteri del ricercatore di interesse (Fig. 4). La query può quindi essere eseguito, con conseguente i campi desiderati elencati in forma di foglio elettronico. 8. Esportazione dei dati: Una volta che una query è stato generato, i dati possono essere esportati. Mentre la maggior parte ricercatori che preferiscono che i dati siano sotto forma di un foglio di calcolo Microsoft Excel, i dati possono essere esportati in un certo numero di altri programmi utilizzando il menu di esportazione alle "dati esterni" tab. I dati possono essere salvati utilizzando l'estensione di file appropriato. Quando i dati vengono esportati a fini statistici, una serie prestabilita di variabili sono inclusi nell'esportazione in modo che una analisi esaustiva si può fare per il controllo per le covariate. 9. Importazione di dati: L'importazione dei dati richiede una perfetta corrispondenza tra il formato dei dati importati e il formato della tabella di Access. Le variabili di interesse all'interno della tabella da importare devono avere gli stessi nomi della tabella di Access. L'ortografia devono essere precisi e non ci possono essere spazi dove gli spazi non esistono nella tabella di Access. Una volta che la simmetria tra le due tabelle è raggiunto, l'utente ha la possibilità di utilizzare un aggiungere o aggiornare query per importare i dati in Access. Una query di accodamento consente all'utente di aggiungere nuove righe di dati nel database di Access. Per esempio, se sono disponibili informazioni su pazienti che non erano già presenti nel database, una query di accodamento potrebbe essere utilizzato per aggiungere questi pazienti. Tuttavia, se sono disponibili nuovi dati sui pazienti o di campioni che devono essere modificati, una query di aggiornamento deve essere eseguita su tali voci. 10. Aggiornamento del database: I membri del progetto di database hanno prescritto i ruoli in modo che il database è costantemente aggiornato. Un dipendente a tempo pieno il compito di regolare popolamento e aggiornamento del database con le informazioni cliniche basate su pazienti che hanno acconsentito in clinica. Un altro dipendente a tempo pieno, nella sua funzione di responsabile dei dati, ha il compito di ottenere i dati di laboratorio non appena disponibili e inserendo queste informazioni nel database con un aggiornamento o una query di accodamento. Assistenti di ricerca che sono addestrati nel protocollo sono responsabili per l'esecuzione di un aggiornamento sistematico del database ogni sei mesi per ottenere i dati più recenti disponibili. Ciò è particolarmente importante per i campi, come lo stato vitale e la data dell'ultimo contatto, in quanto questi campi hanno un impatto diretto sulla sopravvivenza analisi effettuate sui dati. 11. L'accesso al database: Il database è accessibile solo alle persone che sono conformi HIPAA e sono inclusi nel quadro del protocollo IRB. L'accesso è ulteriormente ridotto di individui addestrati in Microsoft Access e che hanno responsabilità dirette per l'aggiornamento o modifica dei dati. I ricercatori che hanno contribuito al database può chiedere informazioni dal database dal gestore dei dati, ma essi stessi sononon è consentito di accedere ai dati direttamente. Il gestore dei dati fornisce informazioni de-identificato i ricercatori richiesta eliminando le variabili quali il numero e il nome della cartella clinica del paziente, quando si genera una query di esportazione. 12. Rappresentante dei risultati: Un ricercatore può essere interessato a conoscere il significato clinico di sovra-espressione della proteina paxillina nel carcinoma non a piccole cellule del polmone. Come questo ricercatore ha generato una grande quantità di dati TMA nel database per paxillin, il gestore dei dati approva richiesta del ricercatore di accedere alle informazioni cliniche correlati con i dati di laboratorio. Il gestore dei dati esegue una query in cui combina la tabella Pazienti e la Tavola TMA. Variabili di interesse dalla tabella I pazienti includono data di nascita del paziente, la loro razza, l'istologia del loro cancro, lo stadio del loro cancro, la data della diagnosi, il loro stato vitale, la data di morte, e la loro data dell'ultimo contatto. Utilizzando queste variabili, quali l'età alla diagnosi e stadio, importanti fattori di confondimento può essere spiegato e controllato. Dalla tabella TMA, informazioni importanti come il tipo di tumore e l'espressione della proteina può essere accertata. Mentre i due tabelle sono collegate tramite il numero di cartella clinica, le informazioni sui pazienti da persone il cui tumori sono stati studiati per l'espressione paxillina sono inclusi nell'output. I risultati possono essere filtrati in modo che solo i pazienti con tumore non a piccole cellule del polmone vengono visualizzati. I risultati possono essere ulteriormente raffinata in base alle esigenze del ricercatore. Questi risultati possono essere esportati per primario l'analisi dei dati dal biostatistico ed i risultati sono poi condivisi con il ricercatore. Home page del progetto: Database modello di accesso e Procedure Operative Standard sono disponibili all'indirizzo: http://www.ibridgenetwork.org/uctech/salgia-thoracic-oncology-access-template Licenza: Disponibile gratuitamente per uso accademico e non-profit. Restringere l'uso da parte di non-accademici: gli utenti richiedono una licenza commerciale. Per domande riguardanti l'uso commerciale, si prega di contattare l'Università di Office of Technology di Chicago e di proprietà intellettuale (UChicagoTech) al numero (773) 702-1692 o www.tech.uchicago.edu Figura 1. Uno screenshot del database di Access che rappresenta una sezione della tabella Pazienti. Figura 2. Schematica raffigurante un microarray tissutale (TMA) 2 Figura 3. Screenshot raffiguranti rapporti stabiliti tra le tabelle all'interno del database di Access. Tabelle sono collegate tramite le chiavi primarie. Figura 4. Query di esempio di mutazione paxillin, risultati TMA, e le variabili cliniche.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Questo lavoro è stato sostenuto da NIH 5R01CA100750-07, 5R01CA125541-04, 3R01CA125541-03S1, 5R01CA129501-03, 3R01CA129501-02S1 a RS

Materials

Material Name Company Catalogue Number
Centrifuge Eppendorf
Conical centrifuge tube Falcon 518-PG
Minimum essential medium eagle (MEM) Sigma M4655-500ML
Fetal Calf Serum Cellgro FBS HI MTT35011CV
Dimethyl Sulfoxide (DMSO) American Bioanalytical AB03091
BD Vacutainer Serum Tubes Fischer Scientific 367815

References

  1. Adamski, J., Finnegan, K. New Perspectives on Microsoft Office Access. , (2007).
  2. Giltnane, J., Rimm, D. Technology Insight: Identification of biomarkers with tissue microarray technology. Nat Clin Pract Oncol. 1, 104-111 (2004).

Play Video

Cite This Article
Surati, M., Robinson, M., Nandi, S., Faoro, L., Demchuk, C., Kanteti, R., Ferguson, B., Gangadhar, T., Hensing, T., Hasina, R., Husain, A., Ferguson, M., Karrison, T., Salgia, R. Generation of Comprehensive Thoracic Oncology Database – Tool for Translational Research. J. Vis. Exp. (47), e2414, doi:10.3791/2414 (2011).

View Video