Un protocollo è descritto che utilizza saggi di Illumina Infinium effettuare genotipizzazione su larga scala. Questi test possono genotipo affidabile milioni di SNPs su centinaia di singoli campioni di DNA in tre giorni. Una volta generata, questi genotipi possono essere usate per controllare le associazioni con una varietà di malattie o fenotipi differenti.
Varianti di genotipizzazione del genoma umano ha dimostrato di essere un metodo efficace per identificare associazioni genetiche con fenotipi. La distribuzione delle varianti all'interno delle famiglie o delle popolazioni può facilitare l'identificazione dei fattori genetici della malattia. Pannello di Illumina di BeadChips genotipizzazione consente agli investigatori di genotipo migliaia o milioni di polimorfismi a singolo nucleotide (SNP) o per analizzare altre varianti genomiche, come numero di copie, attraverso un gran numero di campioni di DNA. Questi SNPs possono essere diffuse in tutto il genoma o mirati in regioni specifiche al fine di massimizzare il potenziale di scoperta. Il dosaggio Infinium è stato ottimizzato per produrre alta qualità, risultati precisi rapidamente. Con opportuna configurazione, un singolo tecnico può elaborare da poche centinaia a oltre mille campioni di DNA alla settimana, a seconda del tipo di matrice. Questo saggio guida gli utenti attraverso ogni passo, partendo con il DNA genomico e termina con la scansione della matrice. Utilizzo di correttezza Reagenti, i campioni sono amplificati, frammentato, precipitato, risospese, ibridata al chip, prorogato di un unico basamento, macchiato, e scansionata né su di un sistema di imaging ottico ad alta risoluzione iScan o Hi Scan. Un passo durante la notte è necessaria per amplificare il DNA. Il DNA è denaturato e isotermicamente amplificata da tutto il genoma di amplificazione, pertanto, non è richiesta alcuna PCR. I campioni sono ibridate agli array durante una seconda fase durante la notte. Entro il terzo giorno, i campioni sono pronti per essere analizzati e analizzati. DNA amplificato può essere stoccato in grandi quantità, consentendo matrici tallone da trasformare ogni giorno della settimana, in modo da massimizzare il throughput.
Digitando polimorfismi a singolo nucleotide (SNP) è un metodo fondamentale per identificare varianti di rischio connessi con la malattia. Storicamente, l'ambito di esperimenti di genotipizzazione è stata limitata dalla tecnologia disponibile. Metodi di genotipizzazione basati su elettroforesi su gel sono limitati in-campione e SNP-capacità [1]. Lo sviluppo di questi saggi, spesso può essere alta intensità di lavoro, basandosi sulla composizione e la struttura della regione circostante la variante per l'ottimizzazione [1]. Saggi TaqMan genotipizzazione, sviluppati da Life Technologies, possono eseguire un gran numero di campioni in modo rapido e con minimo coinvolgimento tecnico [2], ma restrizioni SNP multiplexing continuano a limitare il numero totale di genotipi di ben inferiore a un milione al giorno [3,4 ]. Piattaforma IPLEX di Sequenom può anche eseguire molti campioni in una sola volta, ma, come meno di un centinaio di SNPs possono essere multiplexati insieme, il throughput è relativamente basso nel complesso [5]. La tecnologia streaming SNP di Beckman Coulterpotrebbe teoricamente produrre oltre tre milioni di genotipi al giorno, ma questo intervallo progetto limiti tecnologici, fino ad un massimo di soli quarantotto SNPs per reazione [4,6]. Mentre il test GoldenGate in grado di elaborare quasi duecento campioni di DNA ogni giorno centinaia o migliaia di SNPs per campione, il prezzo per genotipo non è competitivo con tecniche ultra-high-throughput avanzate durante la digitazione di oltre tremila SNPs in una sola volta [4,7 ]. Al fine di elaborare diversi milioni di genotipi al giorno, la scala necessaria per i grandi studi di associazione genome-wide, saggi di array-ibridazione sono diventati l'opzione più conveniente sul mercato.
La linea di Affymetrix di array di ibridazione e la linea di Illumina di array-based Infinium consentono potenzialmente centinaia di campioni da digitate su centinaia di migliaia o milioni di SNPs in parallelo [4,8]. Questi SNPs possono essere sparsi su tutto il genoma, localizzata nelle regioni di interesse, come la exOMES, o personalizzato per preferenze dell'utente. Queste matrici hanno il vantaggio non solo di essere in grado di genotipo con precisione un milione di SNPs per ogni campione in una volta, ma anche per misurare il numero di copie di variazione, anomalie cromosomiche potenzialmente svelare. Infinium-allineati array OMNI BeadChip attualmente hanno la capacità di genotipo fino a quasi cinque milioni di marcatori per campione, tra cui mezzo milione loci personalizzato, su un massimo di quasi un centinaio di campioni di ogni giorno.
Poiché la maggior parte delle malattie hanno una componente genetica, questi esperimenti su larga scala possono essere cruciali nella ricerca di geni associati con la malattia. High-throughput genotipizzazione consente per la generazione di genotipo efficiente esempio imposta abbastanza grande per rilevare in maniera convincente associazione genetica a basse frequenze alleliche minori. Progetti di genotipizzazione intero genoma possono essere utilizzati per individuare le regioni con statisticamente significativa frequenza dell'allele caso-controllo o le differenze del numero di copie [9,10,11]. Secondo il National Ge umanoNome Research Institute, studi di associazione genome-wide che hanno portato a 1.490 pubblicazioni separate tra 25 novembre 2008 e 25 gennaio 2013, derivanti dalla scoperta di 8.283 SNP con un p-value inferiore a 1 x 10 -5 (vedi http:// www.genome.gov/gwastudies/). Questi studi, che le condizioni che vanno da un'altezza di cancro ai testicoli, ha beneficiato l'approccio generale offerta da una analisi genome-wide ricercato. In casi come questi, intere regioni di interesse potrebbero essere sfuggito aveva lo scopo di battitura stato troppo restrittiva. Così, per le analisi di associazione su larga scala, una tecnica di genotipizzazione genoma di ampiezza è la tecnica di scelta.
Esistono diverse versioni del saggio Infinium, ciascuno destinato all'uso con specifici tipi di matrici. Il saggio InfiniumUltra, discusso in profondità sotto, è appropriato per molti 12 – o 24-chip matrice del campione. Questi spesso genotipo oltre un centinaio di migliaia di SNPs per ogni campione di DNA e concentrarsi su tregioni argeted, come ad esempio su pannelli exome o personalizzati. Altre versioni di saggio possono essere richieste per altri tipi di chip, come le matrici di genotipizzazione intero genoma. Tuttavia, come tutti i saggi Infinium condividono una base comune e differiscono principalmente solo dai nomi dei reagenti, i volumi di reagente, o l'esatta procedura di reagente di colorazione, tecniche perfezionate su una versione test possono spesso essere universalmente applicata. Altri array, come array di metilazione, potrebbe utilizzare un protocollo pressoché identiche, pure. Bisogna fare attenzione a utilizzare solo la versione di dosaggio richiesto per il tipo di chip in uso. Alcuni tipi, come ad esempio quelli che misurano il livello di espressione genica, potrebbero richiedere l'uso di un protocollo nonInfinium.
I campioni devono essere elaborati in batch. Ad esempio, con il dosaggio InfiniumUltra, tubi dei reagenti prehybridization contengono un volume sufficiente per eseguire 96 campioni, ed i tubi non possono essere ricongelati. Pertanto, i campioni devono essere eseguiti in lotti di 96 campioni alla volta. I campioni saranno amplificati sui abetit giorno. Dopo circa 1 ora di benchwork, i campioni devono essere riscaldati in forno ventilato per 20-24 ore. Il giorno seguente, quasi 4 ore sarà speso la frammentazione, la precipitazione, e risospendere i campioni, al punto che i campioni possono sia essere congelati per un uso futuro o ibridati al chip. Caricamento chip prende quasi 2 ore, dopo di che i campioni saranno ibridati notte per 16-24 ore. Il terzo giorno, la fase di colorazione e l'estensione prende ~ 4 ore. Un ulteriore ora saranno spesi lavaggio, verniciatura e l'essiccazione le patatine. Infine, le matrici vengono analizzati, che può richiedere 15-60 min / chiave, a seconda del tipo utilizzato.
Si applicano le misure di sicurezza di laboratorio e di pulizia standard. Sebbene non si basa PCR-amplificazione, sono necessarie postazioni separate per la pre-e postamplification procedure per ridurre al minimo la probabilità di contaminazione. Il numero di identificazione di ogni reagente kit fornito in uso deve essere registrato su un foglio di tracking. Reagenti Scongelare immediatamente prima dell'uso e invertiti diverse volte prima erogazione. Il DNA deve essere digitato deve essere DNA genomico di alta qualità (260/280 Rapporto di assorbanza di 1,6-2,0, 260/230 il rapporto di assorbanza di sotto di 3,0), isolati con metodi standard e quantificati con un fluorimetro. Degradazione del DNA è spesso un fattore che contribuisce a risultati del saggio di bassa qualità. Tipicamente, è richiesta 200 ng di DNA, se questa quantità può variare per alcuni tipi di chip. A Tecan-liquido gestione robot è in grado di automatizzare molte fasi del protocollo e ridurre al minimo l'errore umano come fattore.
Sono state utilizzate applicazioni di genotipizzazione su larga scala per comprendere meglio il meccanismo genetico alla base di molte malattie umane. La scoperta di una variante significativa attraverso un'analisi di associazione genome-wide in grado di contrassegnare una regione candidato per ulteriori studi. Inoltre, i dati genotipo è un buon strumento per il controllo di qualità su progetti di sequenziamento.
Per ottimizzare la velocità di campionamento, più lastre di esempio possono essere amplificati e conservati nei loro frammentati, stati risospeso. Otto piastre possono essere amplificati in un solo giorno, combinando la prima 24 ore di protocollo per più lotti e di fornire materiale sufficiente per ~ 2-8 giorni di chip di elaborazione. Se le piastre amplificati sono stoccate in anticipo, e se i nuovi campioni sono ibridate al chip subito dopo la scansione comincia in fuga precedente, trasformazione possono funzionare in continuo senza la necessità di una pausa per la preparazione del campione aggiuntivo. Pertanto, anche se i campioni avranno tre giorni per sottoporsi alla completasaggio, i dati possono essere generati giornalmente. Chip Assuming24 sono trattati ogni giorno, una settimana lavorativa di cinque giorni consente da oltre 1.000 campioni di DNA da eseguire su un chip tallone 12 campioni. Se un passaggio o reagente è venuto meno, tuttavia, più batch potrebbero essere a rischio per scarso rendimento prima di qualsiasi correzione può essere applicata. Gli errori possono sfuggire avviso fino a quando gli array sono scansionati o analizzati, pertanto, se la velocità è massimizzata, centinaia di campioni in varie fasi del protocollo potrebbero essere già ricevuto lo stesso trattamento difettoso al momento della scoperta. Come reagenti e dati persi non possono essere recuperati, l'utente deve soppesare i rischi contro la necessità di un flusso di lavoro accelerato.
Il software di analisi GenomeStudio è la prima occasione per misurare realmente il successo del processo di genotipizzazione. Se la norma-R vs Norm-Theta trame intensità siano correttamente raggruppati, il tasso medio di chiamata (per cento del totale SNPs digitato correttamente) dei campioni dovrebbe avvicinarsi al 99%, anche se questo valore varia slightly a seconda del tipo di matrice. I dati da qualsiasi campione con un tasso di chiamata inferiore al 85-90% non è affidabile e devono essere eliminati. Ai fini del controllo di qualità, i risultati devono essere confrontati con eventuali genotipi quando possibile già noti. Se non esistono tali dati, intenzionale duplicazione del campione è uno strumento utile per la verifica della targa o matrice posizionamenti. Queste coppie duplicati dovrebbero essere immessi sul chip separati, piatti, lotti, o progetti, i loro genotipi controllati dopo generazione. Mentre specifici vincoli QC variano a seconda della preferenza del ricercatore, i vincoli comuni SNP sono basati sul successo chiamata di esempio, Hardy-Weinberg, o dati mancanti tra casi e controlli, mentre i vincoli del campione comuni si basano sui tassi di chiamata, incoerenze mendeliana o riferimenti incrociati del cromosoma X eterozigosi ai dati clinici di genere [13].
Se qualunque problema si pone, Dashboard Controls, che si trova nella suite di analisi, può essere presentata alazienda al fine di determinare la causa. Questi controlli possono spesso restringere la questione alla fase più probabile o il fallimento del reagente. Se qualche SNPs di interesse possono essere individuate attraverso un esperimento di genotipizzazione Infinium, le loro trame intensità dovrebbero essere controllate in GenomeStudio per errori di clustering prima di un ulteriore ricerca è condotta.
Un esperimento di genotipizzazione Infinium fallito è probabilmente dovuto a un errore umano o di trasformazione del DNA di ingresso di scarsa qualità. Esempio di quantificazione deve essere accurata e precisa. Per ottenere i migliori risultati, eventuali reagenti aggiunti a qualsiasi campione o chip devono essere dispensati al volume stabilito dal protocollo. Le pipette devono essere opportunamente tarati. I reagenti non devono essere eseguiti dopo la scadenza e non devono essere ricongelati una volta scongelati, tranne che per il reagente RA1. Al fine di minimizzare i possibili errori di colorazione e di estensione, la miscela formammide / EDTA deve essere preparato fresco ogni mese. Tutti i -20 ° C i reagenti devono essere conservati solo in congelatori manuale sbrinamento. Tutte le attrezzature utilizzate nel stAining, ampliamento e lavaggio parti del protocollo devono essere risciacquati abbondantemente con acqua e detergente neutro immediatamente dopo disuso. I serbatoi umidificazione nella camera hyb dovrebbero essere abbattuti con un pennello provetta e un detergente delicato. I vetrini devono essere lavati con candeggina al 10%, come indicato dal loro manuali d'uso, una volta a settimana.
The authors have nothing to disclose.
Il finanziamento per questo lavoro è stato fornito dal NIH P20 GM103456, NIH RC2 AR058959, e NIH R56 AI063274
Consumable or Equipment | Manufacturer | Part Number | Minimum Required for 96 Samples |
0.8 ml Deep Well Plate | Thermo Scientific | AB-0765 | 1 |
Plate Mats | Thermo Scientific | AB-0674 | 2 |
Reagent Basin | Fisher Scientific | 13-681-502 | 9 |
Heat-seal Sheets | Thermo Scientific | AB-0559 | 1 |
Flow-through Spacer | Fisher Scientific | NC9563984 | 6 |
Pipette tips – 200 μl | Rainin | GP-L200F | 192 |
Pipette tips – 10 μl | Rainin | GP-L10F | 16 |
Pipette tips – 1,000 μl | Rainin | GP-L1000F | 16 |
DNA Suspension Buffer | Teknova | T0220 | 0.5 ml |
0.1 N NaOH | Fisher Scientific | AC12419-0010 | 0.5 ml |
Isopropanol (HPLC grade) | Fisher Scientific | A451 | 15 ml |
Ethanol (200-proof) | Sigma-Aldrich | 459836 | 330 ml |
Formamide (100%) | Thomas Scientific | C001K38 | 15 ml |
EDTA (0.5 M) | Amresco | E177 | 0.2 ml |
10 μl 8-channel Pipette | Rainin | L8-10XLS | 1 |
200 μl 8-channel Pipette | Rainin | L8-200XLS | 2 |
1,000 μl Single-channel Pipette | Rainin | L-1000XLS | 1 |
Microplate Shaker | VWR | 13500-890 | 1 |
Refrigerated Microplate Centrifuge | VWR | BK369434 | 1 |
Hybridization Oven | Illumina | SE-901-1001 | 1 |
Hybex Microsample Incubator | SciGene | 1057-30-0 | 1 |
Hybex MIDI Heat Block Insert | Illumina | BD-60-601 | 1 |
Heat Sealer | Thermo Scientific | AB-0384 | 1 |
Hyb Chamber w/ Insert and Mat | Illumina | BD-60-402 | 2 |
Surgical Scissors | Fisher Scientific | 13-804-20 | 1 |
Flow Through Assembly Parts | Illumina | WG-10-202 | 8 |
Wash Rack and Dish | Illumina | BD-60-450 | 1 |
Genepaint Chamber Rack | Tecan | 760-800 | 1 |
Temperature Probe | Illumina | A1-99-109 | 1 |
Staining Rack and Dish | Illumina | WG-10-207 | 1 |
Self-Closing Tweezers | Ted Pella, Inc | 5374-NM | 1 |
Vacuum Manifold | Ted Pella, Inc | 2240 | 1 |
iScan or HiScan | Illumina | – | 1 |