Summary

Generatie van Integrale Thoracale Oncologie Database - Tool voor Translationeel Onderzoek

Published: January 22, 2011
doi:

Summary

Een thoracale oncologie databank werd ontwikkeld om te dienen als een algemene bewaarplaats voor klinische en laboratorium gegevens ten behoeve van translationeel onderzoek. De database zal dienen translationeel kankeronderzoek onderzoekers binnen de Thoracic Oncology Research Program. Deze database is aan te passen aan andere kanker modellen, evenals andere ziekten bij de mens.

Abstract

De thoracale oncologie Program Database Project werd opgericht om te dienen als een uitgebreide, geverifieerd, en toegankelijke repository voor goed geannoteerde kanker specimens en klinische gegevens beschikbaar voor onderzoekers binnen de Thoracic Oncology Research Program. Deze databank vangt ook een groot volume van genomics en proteomics data verkregen uit verschillende studies tumorweefsel. Een team van klinische en fundamentele wetenschap onderzoekers, een biostatisticus, en een bio-informatica expert was bijeengeroepen om het database-ontwerp. Variabelen belang zijn duidelijk omschreven en hun beschrijvingen werden geschreven in een standaard handleiding om de consistentie van de gegevens annotatie te verzekeren. Met behulp van een protocol voor aspirant-weefsel bank-en een ander protocol voor retrospectieve bank-, tumor-en normaal weefsel monsters van patiënten ingestemd met deze protocollen werden verzameld. Klinische informatie, zoals demografie, kanker karakterisering, en de behandeling plannen voor deze patiënten werden geabstraheerd en ingevoerd in een Access-database. Proteomics en genomische gegevens zijn opgenomen in de database en zijn gekoppeld aan klinische informatie voor patiënten beschreven in de database. De gegevens van elke tabel zijn gekoppeld met behulp van de relaties functie in Microsoft Access, zodat de database manager voor klinische en laboratorium gegevens verbinden met een query. De opgevraagde gegevens kunnen vervolgens worden geëxporteerd voor statistische analyse en hypothese generatie.

Protocol

1. University Clinical Research protocollen: Twee universitaire protocollen zijn ontwikkeld voor de doeleinden van dit initiatief. Het eerste protocol zorgt voor de toekomstige aanschaf van weefsels van longkanker, slokdarmkanker, carcinoïd tumor, thymoom, en mesothelioom patiënten. Het protocol maakt het ook mogelijk bloed en andere lichaamsvloeistoffen worden verzameld van patiënten voor biomarker studies. Het protocol maakt onderzoekers om klinische informatie te verkrijgen van de patiënt de bron van die specimens via grafiek abstractie en zowel monster en klinische gegevens in een beveiligde database op te slaan. Het tweede protocol is vergelijkbaar met de eerste, behalve dat hij stelt onderzoekers in staat om toegang te krijgen eerder opgespaarde weefsels en andere monsters verkregen tijdens het verloop van kanker van de patiënt de diagnose en behandeling. Patiënten die een operatie ingestemd aan de universiteit van Chicago en die hun handtekening onder dit protocol komen in aanmerking. 2. Clinical Data Collection-protocol: Patiënten die gezien op de Universiteit van Chicago Medical Center voor de behandeling van de bovengenoemde maligniteiten werden opgenomen in dit protocol. In aanmerking komende patiënten werden geïdentificeerd door hun behandelende oncoloog en werden ingestemd door een lid van de klinische team dat getraind is in de twee protocollen. Eenmaal ingestemd, een patiënt medische geschiedenis informatie werd verkregen via kaart abstractie en werd ingevoerd in de database door een lid van de klinische support team. 3. Specimen Collection Protocol: Weefselmonsters Weefsels die een bekende of verdenking op maligniteit die tijdens standaard een patiënt klinische zorg via biopsie of een operatie werden opgenomen in dit protocol. Geen extra weefsel, buiten wat nodig was voor diagnostische een patiënt workup, werd verkregen. Na operatieve verwijdering van de steekproef nodig zijn voor de voorbereiding van de permanente afdelingen, werd de residuele weefsel op ijs geplaatst. Een technicus van de verkrijging van weefsels vervoerd de resterende monster op het ijs aan de afdeling pathologie. Resterende weefsels werden gewogen, gemeten, overgebracht naar de opslag, geëtiketteerd, en goed gedocumenteerd volgens de standaard werkwijze. Langdurige opslag van de monsters werd gehouden in een temperatuur van -80 ° C vriezer in de afdeling pathologie. Met het oog op weefselmonsters toegang van patiënten die al een operatie ondergaan voor een thoracale maligniteit, werden lijsten van patiënten onderhouden door samen te werken chirurgen en stralingsoncologen verwezen. Op deze manier patiënten van belang zijn geïdentificeerd. Hun tumor weefsel kon worden opgehaald uit de afdeling pathologie, indien toestemming werd verkregen. Bloedmonsters Tijdens klinisch geïndiceerd bloed trekt, het protocol ook toegestaan ​​voor een nog twee tot zes tubes van bloed in een 5 ml groene top (Heparine) buis, een 10 ml paars bovenbuis (EDTA kiembaan DNA) en een 10 ml rode top (Serum) buis van het bloed. Tot zes monsters op verschillende tijdstippen werden genomen, met de datum van het bloed te trekken geannoteerde. Bloedmonsters werden gecentrifugeerd bij 2000 rpm gedurende 10 minuten. Plasma en serum componenten werden hoeveelheden verdeeld in cryovial buisjes in 1 ml porties. Voor het inzamelen van witte bloedcellen, werden de bovenste 1-2 ml van de interface / rode bloedcel fractie opnieuw gesuspendeerd met 1-2 ml cel behoud medium (MEM EBS media + 10% foetaal serum cal + 5% DMSO). Alle monsters werden langzaam bevroren in een isopropyl vriesbox bij 70-80 ° C gedurende 16-24 uur daarna overgebracht naar een -70 ° C tot -80 ° C opbergdoos. Alle monsters werden gemerkt met een barcode unieke identificatiecode en een adequate manier gedocumenteerd in het monster aanbesteding formulier door een laborant. Andere lichaamsvloeistoffen: Fluid niet verzameld voor klinisch gebruik kan worden verzameld en opgeslagen onder dit protocol. Sputum monsters werden verzameld en verstuurd voor cytologie. Sputum monsters werden opgeslagen op ijs bij 4 ° C, terwijl wordt overgedragen. Sputum monsters werden vervolgens overgebracht naar 15 ml Falcon buizen en gecentrifugeerd bij 1400 rpm gedurende 10 minuten. Het supernatant werd gealiquoteerd in 4 mL porties in 6ML cyrovials. Cyrovials werden geplaatst in een vriezer, op droog ijs, of in een isopropyl vriesbox om vervolgens te worden bevroren tot een -70 ° C tot -80 ° C. Na 16-24 uur, werden monsters overgebracht naar een -70 ° C tot -80 ° C opbergdoos. Alle monsters werden gemerkt met een barcode unieke identificatiecode en een adequate manier gedocumenteerd in het monster aanbesteding formulier door een laborant. 4. Bouwen aan de Informatica Infrastructuur: Na evaluatie van een aantal database management programma's, was Microsoft Access geselecteerd als het programma naar het huis van klinische en laboratorium gegevens voor de thoracale Oncology Programma Database Project gebaseerd op zijn bruikbaarheid en de mogelijkheid om gerelateerde sets van data link. Een team van artsen, fundamentele wetenschap onderzoekers, een biostatisticus, en een bio-informatica expert was bijeengeroepen om variabelen van belang te identificeren te vangen binnen de database. Het team geïdentificeerde data-elementen met betrekking tot demografie van de patiënten, kanker karakterisering, epidemiologische factoren, en het monster annotatie gebaseerd op de behoeften van de thoracale oncologie onderzoekers en verwijzing naar normen vast te stellen met betrekking tot gemeenschappelijke gegevens (CDES) door het National Cancer Institute. Het team ontwikkelde een codeerschema om de gegevens analyseerbaar voor onderzoeksdoeleinden. Indien mogelijk, werden de gegevens gecodeerd met behulp van numerieke variabelen om zo de hoeveelheid vrije tekst ingevoerd in de database te beperken. Variabelen belang zijn verdeeld over zeven verschillende tabellen in Microsoft Access naar uiteenlopende aspecten van aanverwante informatie vast te leggen. 5. Het ontwerpen van de inhoud van elke tabel: Zeven primaire tabellen werden gemaakt: 1) Patiënten tafel, 2) Sample Data tabel, 3) TMA tafel, 4) DNA-monsters tabel, 5) Borst Oncologie conferentie tafel, 6) cellijn tafel, en de 7) C. elegans tafel. De patiënten tafel is ontworpen als de enige tabel in de database om klinisch relevante informatie over de patiënten, hun kanker, hun beloop, de risicofactoren, en het resultaat daarvan (Fig 1) huis. De bedoeling van dit bijzondere ontwerp was om redundantie te beperken in de database. De Sample Data tabel koppelingen pathologische monsters van hun patiënt bronnen. Elk monster wordt verkregen met een sample pathologie nummer en dit nummer is in verband met medische dossier van de patiënt nummer. Meerdere exemplaren kunnen worden verkregen van elk individu en dus de tabel ook informatie over de datum waarop het monster is verkregen en de aard van het specimen verzameld: de eerste tumor, terugkerende tumor, of autopsie exemplaar. De TMA tabel is tot nu toe gebruikt om de eiwitexpressie gegevens voor 63 unieke eiwitten vast te leggen. Een TMA kan worden gebruikt om de distributie van differentieel tot expressie gebrachte eiwitten te karakteriseren in tumor en niet-tumor weefsel met behulp van antilichamen tegen lokaliseren eiwitten (afb. 2). Eiwitexpressie wordt vertegenwoordigd door een score van 0, 1, 2 of 3 op basis van de patholoog indruk van de intensiteit en het percentage van de TMA vlekken. Wanneer procent kleuring is gemeten, een score van 0 Geen kleuring geeft aan, 1 geeft aan minder dan 11% kleuring, 2 geeft minder dan 50% kleuring, en 3 geeft aan meer dan 50% vlekken. Wanneer de intensiteit wordt gemeten, is een score toegewezen op basis van de relatieve hoeveelheid van de vlekken, ook op een schaal van 0 tot 3. In sommige gevallen worden IHC dia's ook gescand met een hoge resolutie en kleuringsintensiteit wordt gekwantificeerd door Automated Cellular Imaging System (ACIS) imaging software parallel aan het scoren van de patholoog's. Echter, voor beide technieken, een hogere score betekent een grotere eiwitexpressie. Daarnaast is de TMA tafel annoteert de locatie van de TMA punch voor toekomstig gebruik. Bovendien is de database bevat de bron van het weefsel (tumor, normaal, lymfeklieren, metastatische weefsel), de locatie binnen de steekproef (centrum, rand), de histologie van de kanker, en het medisch dossier nummer om deze informatie terug te koppelen aan De patiënten tafel. De DNA-monsters tabel geeft een overzicht van alle DNA opgeslagen in het laboratorium. DNA-monsters zijn gekoppeld aan de patiënt de bron via medische dossier van de patiënt nummer. Basisinformatie over het monster wordt vastgelegd om de bron van het monster, inclusief de locatie en de histologie van de tumor te beschrijven. Het doel van deze tabel is het beschrijven van de genetische veranderingen die zijn gekenmerkt in het monster met behulp van polymerase chain reaction, standaard DNA-sequencing, en mutatie-analyses. De tabel vangt ook variabelen zoals het aminozuur veranderingen, nucleotide veranderingen, homozygotie, synonimiteit, en het gen waar de mutatie zich heeft voorgedaan. Voorbeelden van genen die zijn bestudeerd zijn onder Paxillin, cCbl, EGFR, p53, KRAS, cMet, en EphB4. De onderzoeker die kenmerkend was voor de mutaties wordt ook vermeld. De vijfde tabel in de database is de Borst Oncology conferentie tafel. De borst oncologie congres is een wekelijkse vergadering van medisch oncologen, thoracale chirurgen, pathologen, radiologen, radiotherapeuten, en andere leden van de thoracale oncologie klinische team die voldoen aan een gecoördineerde behandeling van de patiënt plannen te ontwikkelen. Het doel van deze tabel is om een ​​lijst van de patiënten die zijn besproken op de conferentie als onderdeel van hun standaard van zorg. Informatie over de beschikbaarheid van pathologische monsters voor iedere patiënt is ook vastgelegd in deze tabel. De zesde tabel is de cellijnen tafel. Dit is een vrijstaande tabel in de database, omdat het niet gekoppeld aan een van de andere tafels. Het beschrijft de cellijnen die zijn te gebruikend in het laboratorium voor onderzoeksdoeleinden. De tabel legt het aminozuur verandert, nucleotide veranderingen, de homozygotie en synonimiteit van mutaties, en de locatie van mutaties binnen cellijn-DNA. De zevende tabel is de C. elegans tafel en het is ook een gratis statafel. Deze tabel geeft orthologe receptor tyrosine kinases en omvat de naald score, die een maat is van de gelijkenis met menselijke eiwitten. 6. Tot vaststelling van relaties tussen de tabellen: Elke tafel krijgt een primaire sleutel, die dienst doet als een unieke identificatie voor elk item in de tabel. Per definitie kan een unieke id-waarde niet worden herhaald. Bijvoorbeeld, binnen het Patiënten tafel, de primaire sleutel is het medisch dossier aantal sinds een MRN kan slechts betekenen een uniek individu. Binnen de Sample data tafel, de primaire sleutel wordt het monster pathologie (SP) nummer. Als de TMA-en DNA-monsters tabellen geen unieke id hebben, was een dummy vastgestelde aantal als de primaire sleutel. De TMA-en DNA-tabellen werden vervolgens gekoppeld aan de andere tabellen met behulp van het MRN en de SP nummers, respectievelijk. Dit zorgt ervoor dat elke TMA punch en DNA-monster terug zijn gekoppeld aan zowel de specifieke informatie over het monster en klinische gegevens van de patiënt te doneren. In Microsoft Access, zijn afzonderlijke tabellen gekoppeld via hun primaire sleutels zodanig dat logische relaties worden gelegd (Figuur 3). Deze relaties zijn nodig om queries waar data wordt verzameld uit meerdere tabellen te genereren. 7. Bevragen: Het uitvoeren van een query van gerelateerde sets van de gegevens is relatief eenvoudig in Microsoft Access. Een query kan worden ontworpen door het selecteren van de "query ontwerp optie" onder het tabblad Maken. Tabellen met het gebied van belang zijn geselecteerd en getoond. Variabelen uit de tabellen van belang zijn geselecteerd en, indien nodig, kan worden gefilterd op basis van de onderzoeker criteria van belang (figuur 4). De query kan dan worden uitgevoerd, wat resulteert in de gewenste velden in spreadsheet vorm. 8. Gegevens exporteren: Zodra een vraag is gegenereerd, kunnen de gegevens worden geëxporteerd. Terwijl de meeste onderzoekers geven de voorkeur aan gegevens worden in de vorm van een Microsoft Excel spreadsheet, kunnen gegevens worden geëxporteerd naar een aantal andere programma's met de export menu onder de "externe data" tabblad. De gegevens kunnen worden opgeslagen met de juiste bestandsextensie. Wanneer de gegevens worden geëxporteerd voor statistische doeleinden, zijn een voorgeschreven set van variabelen opgenomen in de export, zodat een uitvoerige analyse gedaan kan worden om controle voor covariaten. 9. Gegevens importeren: Importeren van de gegevens vraagt ​​om een ​​perfecte match tussen het formaat van de ingevoerde gegevens en het formaat van de tabel in Access. De variabelen van belang in de tabel te importeren moeten dezelfde namen als de Access-tabel. De spelling moeten nauwkeurige en kan er geen ruimtes waar ruimte bestaan ​​niet in de Access-tabel. Zodra symmetrie tussen de twee tabellen is bereikt, heeft de gebruiker de mogelijkheid om een ​​append gebruiken of bijwerkquery om de gegevens te importeren in Access. Een toevoegquery zal de gebruiker toestaan ​​om nieuwe rijen met gegevens toe te voegen in de Access-database. Bijvoorbeeld, als informatie beschikbaar over patiënten die niet werden al in de database, kan een toevoegquery gebruikt worden om deze patiënten toe te voegen. Echter, indien er nieuwe gegevens beschikbaar over patiënten of monsters die moeten worden gewijzigd, moet een bijwerkquery worden uitgevoerd op de inzendingen. 10. Het bijwerken van de database: Leden van de database-project hebben voorgeschreven rol om ervoor te zorgen dat de database actueel is gehouden. Een full-time medewerker is belast met regelmatig vullen en bijwerken van de database met klinische gegevens gebaseerd zijn op patiënten die zijn toestemming in de kliniek. Nog een full time medewerker, die als data manager, is belast met het verkrijgen van laboratorium-gegevens zodra deze beschikbaar is en het invoeren van deze informatie in de database met een update of toevoegquery. Assistenten die getraind zijn in het protocol zijn verantwoordelijk voor het uitvoeren van een systematische update van de database om de zes maanden om de meest recente gegevens te verkrijgen. Dit is vooral belangrijk voor gebieden zoals vitale status en de datum van laatste contact, omdat deze velden een directe invloed op de overleving analyses uitgevoerd op de gegevens. 11. Toegang tot de database: De database is alleen toegankelijk voor personen die zijn HIPAA compliant en zijn opgenomen in het IRB-protocol. Toegang wordt verder gereduceerd tot personen die speciaal opgeleid in Microsoft Access en die directe verantwoordelijkheid hebben voor het bijwerken of wijzigen van de gegevens. Onderzoekers die hebben bijgedragen aan de database kan informatie opvragen uit de database van de data manager, maar ze zelfniet toegestaan ​​om rechtstreeks toegang tot de gegevens. De gegevens Manager biedt de-geïdentificeerde informatie aan de vragende onderzoekers door het verwijderen van variabelen, zoals het medisch dossier-nummer en de naam van de patiënt bij het genereren van een export query. 12. Representatieve resultaten: Een onderzoeker kan geïnteresseerd zijn in het kennen van de klinische betekenis van de over-expressie van het eiwit Paxillin bij niet-kleincellige longkanker. Omdat deze onderzoeker heeft geleid tot een groot deel van de TMA gegevens in de database voor Paxillin, de data manager keurt de onderzoeker het verzoek van de klinische informatie te correleren met het laboratorium gegevens. De data manager loopt een query, waar hij combineert zowel de patiënten Tafel en de TMA tabel. Variabelen belangstelling van de patiënten tafel onder meer de patiënt geboortedatum, hun ras, de histologie van hun kanker, het stadium van hun kanker, hun datum van de diagnose, hun vitale status, de datum van overlijden, en de datum van het laatste contact. Met behulp van deze variabelen, zoals leeftijd bij diagnose en stadium, kunnen belangrijke confounders worden verantwoord en gecontroleerd. Van de TMA tafel, kan belangrijke informatie, zoals het type tumor en het eiwit expressie worden vastgesteld. Omdat de twee tabellen zijn gekoppeld via het medisch dossier nummer, patiënt informatie van individuen bij wie de tumoren zijn onderzocht op Paxillin expressie zijn opgenomen in de output. De resultaten kunnen worden gefilterd zodat alleen patiënten met niet-kleincellige longkanker worden weergegeven. De resultaten kunnen verder worden verfijnd op basis van de behoeften van de onderzoeker. Deze resultaten kunnen worden geëxporteerd voor primaire data-analyse door de biostatisticus en de resultaten worden vervolgens gedeeld met de onderzoeker. Project home page: Access Database template en Standard Operating Procedure zijn beschikbaar op: http://www.ibridgenetwork.org/uctech/salgia-thoracic-oncology-access-template Licentie: gratis beschikbaar voor academische en niet-commercieel gebruik. Beperkingen op het gebruik door niet-academici: Commerciële gebruikers een licentie vereist. Voor vragen over commercieel gebruik, neem dan contact op met de Universiteit van Chicago Bureau van technologie en intellectuele eigendom (UChicagoTech) op (773) 702 tot 1,692 of www.tech.uchicago.edu Figuur 1. Een screenshot van de Access-database afbeelding van een deel van de patiënten tabel. Figuur 2. Schematische afbeelding van een tissue microarray (TMA) 2 Figuur 3. Screenshot beeltenis van relaties die tussen tabellen in de Access-database. Tafels zijn verbonden via primaire sleutels. Figuur 4. Voorbeeld zoeken naar Paxillin mutatie, TMA resultaten en klinische variabelen.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dit werk werd ondersteund door NIH subsidie ​​5R01CA100750-07, 5R01CA125541-04, 3R01CA125541-03S1, 5R01CA129501-03, 3R01CA129501-02S1 naar RS

Materials

Material Name Company Catalogue Number
Centrifuge Eppendorf
Conical centrifuge tube Falcon 518-PG
Minimum essential medium eagle (MEM) Sigma M4655-500ML
Fetal Calf Serum Cellgro FBS HI MTT35011CV
Dimethyl Sulfoxide (DMSO) American Bioanalytical AB03091
BD Vacutainer Serum Tubes Fischer Scientific 367815

References

  1. Adamski, J., Finnegan, K. New Perspectives on Microsoft Office Access. , (2007).
  2. Giltnane, J., Rimm, D. Technology Insight: Identification of biomarkers with tissue microarray technology. Nat Clin Pract Oncol. 1, 104-111 (2004).

Play Video

Cite This Article
Surati, M., Robinson, M., Nandi, S., Faoro, L., Demchuk, C., Kanteti, R., Ferguson, B., Gangadhar, T., Hensing, T., Hasina, R., Husain, A., Ferguson, M., Karrison, T., Salgia, R. Generation of Comprehensive Thoracic Oncology Database – Tool for Translational Research. J. Vis. Exp. (47), e2414, doi:10.3791/2414 (2011).

View Video