Summary

Seltenes Ereigniserkennung mit Fehler korrigiert DNA und RNA Sequenzierung

Published: August 03, 2018
doi:

Summary

Next Generation Sequencing (NGS) ist ein leistungsfähiges Werkzeug für die genomische Charakterisierung, die durch die hohe Fehlerquote der Plattform (~0.5–2.0%) begrenzt ist. Wir beschreiben unsere Methoden zur Sequenzierung Fehler korrigiert, mit denen wir umgehen die NGS Fehlerquote und erkennen Mutationen bei Variante Allel Brüche so selten wie 0,0001.

Abstract

Techniken der konventionellen Next Generation Sequencing (NGS) haben immense genomische Charakterisierung für mehr als zehn Jahren ermöglicht. Insbesondere wurde NGS verwendet, das Spektrum der klonalen Mutationen in Bösartigkeit zu analysieren. Obwohl wesentlich effizienter als herkömmliche Sanger, NGS Kämpfe mit der Identifizierung von seltenen klonaler und subclonal Mutationen aufgrund seiner hohen Fehlerquote von ~0.5–2.0 %. So standard NGS hat ein Limit von Erkennung für Mutationen, die > 0,02 Variante Allel Bruchteil (VAF). Während die klinische Signifikanz für Mutationen dieser selten bei Patienten ohne bekannte Krankheit unklar für Leukämie behandelte Patienten haben sich deutlich verbessert Ergebnisse wenn Resterkrankung ist < 0,0001 durch Durchflusszytometrie. Um diese artifizielle Hintergrund der NGS zu mildern, wurden zahlreiche Methoden entwickelt. Hier beschreiben wir eine Methode für Fehler korrigiert DNA und RNA Sequenzierung (ECS), die Kennzeichnung einzelner Moleküle mit einem 16 bp zufällige Index für Fehlerkorrektur und 8 bp patientenspezifische Index für multiplexing beinhaltet. Unsere Methode erkennt und klonale Mutationen bei Variante Allel Brüche (VAFs) zwei Größenordnungen niedriger als die Nachweisgrenze von NGS und so selten wie 0,0001 VAF zu verfolgen.

Introduction

Wie wir Alter, Belastung durch Mutagene und stochastische Fehler während der Zellteilung führen zu die Ansammlung von somatischen Aberrationen in das Genom, und dies zugrunde liegt die grundlegende Pathogenese der malignen Transformation, Neuro-developmental Krankheiten, pädiatrische Störungen und normalem Altern1,2. Somatische Mutationen mit Krankheit fahren Potenzial sind wichtige diagnostische und prognostische Biomarker zur Früherkennung und Risiko Management3,4,5. Um physiologische Clonogenesis besser zu verstehen, ist die klinische informieren und Entscheidungen, die genaue Quantifizierung Charakterisierung dieser Mutationen und von vorrangiger Bedeutung. Next Generation Sequencing (NGS) wird derzeit zur klonale Mutationen in heterogenen DNA-Proben zu studieren; NGS ist jedoch begrenzt zur Identifizierung von Mutationen bei > 0,02 Variante Allel Bruchteil (VAF) – aufgrund der inhärenten Fehler-Rate von 0,5-2,0 % der Sequenzierung Plattformen6,7,8. Infolgedessen tracking diagnostisch und prognostisch bedeutende somatische Varianten am unteren VAF gelingt nicht mit standard NGS.

Vor kurzem wurden verschiedene Methoden entwickelt, um die Fehlerquote von NGS8,9,10,11zu umgehen. Diese Methoden nutzen Molekulare Kennzeichnung, wodurch Fehlerkorrektur nach Sequenzierung. Jedes Molekül oder genomische Fragment in der Sequenzierung Bibliothek ist mit einer zufälligen einzigartige molekulare Bezeichner (UMI) markiert, die spezifisch für dieses Molekül ist. Die UMIs sind von Permutationen einer Reihe von randomisierten Nukleotiden (8 – 16 N) gebaut. Ein zweite Probe-spezifischen Barcode ist auch in den Workflow integriert, die es ermöglicht, Multiplexen mehrerer Proben in der gleichen NGS-Sequenzierung ausgeführt. PCR-Amplifikation erfolgt auf der Molekular tagged Bibliothek, und anschließend wird die Bibliothek für die Sequenzierung gesendet. Während der Vorbereitung der Bibliothek wird erwartet, dass Fehler nach dem Zufallsprinzip auf die genomische Fragment während der PCR-Amplifikation und Sequenzierung8eingeführt werden. Um zufällige Abfolge Fehler zu entfernen, sind rohe Sequenzierung liest nach UMI gruppiert. Artefakte aus Sequenzierung sollen nicht in alle Lesevorgänge mit der gleichen UMI an derselben genomische Position durch die stochastische Natur der Einführung, vorhanden sein, während eine wahre Variante wird originalgetreu verstärkt und sequenziert in alle Lesevorgänge, die die gleichen UMI teilen. Die Artefakte sind Bioinformatically entfernt. Hier beschreiben wir drei Methoden der Fehler korrigiert Sequenzierung (ECS) optimiert, im Labor für DNA, Einzel-Nukleotid-Varianten (SNVs) und kleinen einfügen-Löschungen (Indels) zu identifizieren, und RNA zur Quantifizierung der Genexpression unten erleichtern die NGS Fehlerschwellenwert.

Die erste Methode beschreibt eine Möglichkeit, somatische selten mit Gen spezifische Primer entwickelt von Forschern zu suchen. Vor der Bibliothek Vorbereitung sollten Forscher Primer an die Fragmente von Interesse gezielt gestalten. Wir haben die Web-app-Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/). Amplifikate von 200 – 250 bp sind ideal für Polymerase-Kettenreaktion (PCR), da diese werden sobald UMIs eingeflossen sind, erzeugen, überlappende gepaart Ende liest mit 150 bp gepaart Ende liest. Die optimale Grundierung Gestaltung Bedingungen verwendet werden: Grundierung Mindestgröße = 19; Optimale Grundierung Größe = 25; Maximale Grundierung Größe = 30; Minimale Tm = 64 ° C; Optimale Tm = 70 ° C; Maximale Tm = 74 ° C; Maximale Differenz Tm = 5 ° C; Minimale GC-Gehalt = 45; Maximale GC-Gehalt = 80; Anzahl zurück = 20; Maximal 3′ Ende Stabilität = 100.

In Methode 2 beschreiben wir eine Methode kombiniert die ECS-DNA-Protokoll mit Illumina Chemie für klonale SNVs und so selten wie 0,0001 VAF mit handelsüblichen gen-Paneele, die Hunderte von Amplifikate enthalten kleine Indels vermessen. Wir haben die TruSight myeloische Sequenzierung Panel (Illumina) für unser Experiment verwendet und entwickelt eine erweiterte Gruppe um zusätzliche Gene von Interesse für pädiatrische myeloische Erkrankungen gehören. Diese Platten haben nicht eindeutige molekularen Kennungen (UMIs) angeboten, die Fehlerkorrektur, erleichtern würde, so dass wir unsere eigene Adapter Strategie diese Platten hinzugefügt haben. ECS sollte funktionieren ebenso gut mit allen anderen Panels entwickelt, um nach Genen verbunden mit verschiedenen Krankheiten zu bereichern. Nach DNA-Isolierung und anschließende Quantifizierung von Gewebe oder Probe von Interesse, es wird empfohlen, mindestens 500 ng des Bestandes DNA pro Probe. Wir machen regelmäßig eine einzelne Sequenzierung Bibliothek mit 250 ng DNA um flussabwärts als viel einzigartige genomische Fragment wie möglich erfassen liest Deduplizierung und VAF-Berechnung. Eine optionale replizieren Sequenzierung Bibliothek vorgenommen werden, mit dem restlichen 250 ng DNA. Wir machen immer zwei replizieren Bibliotheken pro Probe, und wir betrachten nur die Ereignisse, die unabhängig voneinander in beide Replikate als richtig positive Ergebnisse festgestellt. Wir implementierten auch eine genomische Position-spezifischen binomische Fehlermodell zur Erhöhung der Genauigkeit der Variante4,13aufrufen.

Schließlich beschreiben wir eine Methode, die Kopplung von ECS an RNA Sequenzierung für Transkript Quantifizierung mit handelsüblichen QIAseq gezielt RNA-Paneele (Qiagen). Die UMIs erforderlich für Deduplizierung können und Fehlerkorrektur in den Kits aufgenommen wurden, und Forscher Bibliotheken nach Empfehlungen des Herstellers. Bioinformatically, können Forscher folgen die Pipeline für ECS-DNA, die im Detail im Abschnitt Protokoll erklärt werden skizziert.

Protocol

1. gezielte Fehler korrigiert Sequenzierung für DNA PCR-Amplifikation genomischer Fragmente von Interesse. Verwenden Sie ein High-Fidelity-DNA-Polymerase der Amplifikate (Materialtabelle, POS. 1) verstärken. Verstärken die PCR-Reaktion mit den folgenden Bedingungen in einem Thermocycler: 30 s bei 98 ° C; 18 – 40 Zyklen von 10 s bei 98 ° C, 30 s bei 66 ° C und 30 s bei 72 ° C; 2 min bei 72 ° C; bei 4 ° c zu halten Reinigen Sie die PCR-Produkte mit paramagnetischen Perlen (Materialtabelle, Punkt 2). Fügen Sie die PCR-Reaktion auf die Perlen in einem Verhältnis von 1: 1,8 (PCR Reaktionsvolumen: Volumen bead) laut Protokoll des Herstellers. Eluieren Sie mit 20 µL DdH2O. Quantifizieren Sie die Konzentration von DNA (Materialtabelle, POS. 3) Endkonzentration von DNA zu bestimmen. Führen Sie ein Aliquot der DNA auf einem 2 %-Agarose-Gel (Materialtabelle, POS. 4) um die Größe der Amplifikate zu bestätigen.Hinweis: Alternativ können Forscher entscheiden, einem Bioanalyzer Analysen auf die PCR-Produkte, die Größe der genomischen amplifizierten Fragmente sowie die Konzentration der Produkte zu bestimmen. Sequenzierung Adapter glühen I7-Adapter (Materialtabelle, Punkt 5) erhalten. Verwenden Sie sie, wie sie für die nachfolgenden Schritte bereitgestellt werden. Kaufen 16N i5 Adapter im Handel mit der folgenden Oligo-Sequenz (Materialien Tabelle Punkt 6): AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCTHinweis: Die 16N i5 Adapter ersetzen die standard i5-Adapter und sie sind Adapter mit einer Reihe von 16 zufällige-Nukleotid ECS zu erleichtern. Machen 16N i5 Adapter Arbeitslösung: 40 µL 100 µM 16N i5 Adapter Lager, 10 µL TE-Puffer und 10 µL 500 µM NaCl-Lösung. Aliquoten 7,5 µL der i5 Arbeitslösung in Schritt 1.2.3 in separaten PCR Vertiefungen vorbereitet. Fügen Sie 5 µL der Probe-spezifische i7 Adapter in entsprechenden Vertiefungen. Bei 95 ° C für 5 min inkubieren, dann kühlen um 1 ° C alle 30 s bis 4 ° C in einem Thermocycler. Bei 4 ° c zu halten Ende-Reparatur & dA-Tailing von BibliothekenHinweis: Parallel Adapter glühen kann eine Ende Reparatur und dA-Tailing auf der PCR-Amplifikate aus Schritt 1.1 ausführen. Nach Abschluss dieser Schritte wird die Ligatur der geglühten Adapter von Schritt 1.2 auf Ende repariert und dA-tailed PCR Amplifikate durchgeführt. Im Anschluss Adapter Ligatur ist die ECS Bibliotheksbau abgeschlossen. Beginnen Sie mit höchstens 1 µg DNA zu beginnen (mindestens ca. 200 ng) Führen Sie Ende-Reparatur und dA-Tail auf Amplifikate (Materialtabelle, Punkt 7). Fügen Sie 3.0 µL Ende Prep Enzym-Mix und 6,5 µL Ende Reparatur Puffer. Die Mischung für 30 min bei 20 ° C, dann 30 min bei 65 ° C inkubieren und bei 4 ° c zu halten Unterbindung der geglühten Adapter (Materialtabelle, Punkt 8) führen. 2.5 µL der geglühten Adapter aus Schritt2, 15 µL Mastermix Blunt/TA-Ligase und 1 µL Ligation Enhancer hinzufügen. Inkubieren Sie die Mischung für 15 min bei 20 ° C, dann für 15 min bei 37 ° c Räumen Sie Bibliotheken mit magnetischen Beads (Materialien Tabelle Artikel 2): hinzufügen die PCR-Reaktion zu Perlen in einem modifizierten 1: 0,75-Verhältnis (PCR Reaktionsvolumen: Magnetischer Wulst Volumen): Pipette 62,6 µL magnetischer Wulst-Lösung in den 83,5 µL des PCR-Produkte von Schritt 1.2.7. Übertragen Sie die Mischung zu einem Schlauch 1,5 mL niedriger Bindung. Mischen Sie durch pipettieren oben und unten mindestens 10 mal gründlich. Lassen Sie den Teig 5 Minuten bei Raumtemperatur stehen. Legen Sie das Rohr auf eine Magnethalterung. 2 Minuten bei Raumtemperatur oder bis überstand inkubieren ist klar. Entfernen Sie überstand. Waschen Sie die Perlen mit 200 µL 70 % Ethanol. 30 S. entfernen Ethanol inkubieren. Wiederholen Sie Ethanol Waschschritt einmal. Trocknen Sie die Perlen an der Luft. Eluieren Sie mit 20 µL DdH2O.Hinweis: Diese Änderung im PCR-Reaktion magnetischer Wulst-Verhältnis wird bevorzugt entfernen DNA-Fragmente, die kleiner als 200 bp. Quantifizierung durch Tröpfchen digitale PCRHinweis: Genaue Mutation Quantifizierung erfordert strikten Einhaltung der Anzahl der Moleküle für jede Bibliothek, die auf den Sequenzer geladen sind. Um dies zu erreichen, die Anzahl der Moleküle für einzelne Bibliotheken pro Volumeneinheit Quantifizierung erfolgt mittels QX200 Tröpfchen PCR (DdPCR) digitalplattform — quantitative PCR ist eine Alternative. Nach DdPCR Analyse wird das Auslesen die Anzahl der Moleküle pro Mikroliter pro Bibliothek angeben. Verdünnen Sie ECS Bibliotheken 1:1,000 durch schrittweise Verdünnung um den Faktor 10 im PCR-Streifen-Röhren. DdPCR in 1,5 mL-Tube die folgenden Mastermix vorbereiten: 10 µL des PCR-Mixes (Materialtabelle, Ziffer 9), 0,2 µL P5 Primer, 0,2 µL P7 Grundierung, 5 µL des ECS bereinigt Produkt aus Schritt 1.4.1., und 4,5 µL DdH2O. Aliquoten 20 µL Mastermix in jeder Probe gut dafür, dass es ein Vielfaches von 8. Aliquoten 70 µL Tröpfchen Generation Öl (Materialtabelle, Ziffer 10) in jedes Öl gut. Decken Sie die Kassette mit einer Gummidichtung. Tröpfchen mit dem Tropfen-Generator (Materialtabelle, Punkt 11) zu machen. Mit einer Mehrkanal-Pipette, laden Sie die Tröpfchen erzeugt in Schritt 1.4.4 in einen PCR Platte gewährleistet, die das Pipettieren der Probe langsam über einen Zeitraum von 5 Sekunden, um zu vermeiden, Scheren der DNS erfolgt. Verstärken das Signal in den Tröpfchen für 40 Zyklen in einem Thermocycler mit den folgenden Bedingungen: 5 min bei 95 ° C; 40 Zyklen von 30 s bei 95 ° C, 1 min bei 63 ° C; 5 min bei 4 ° C, 5 min bei 90 ° C; und halten Sie dann bei 4 ° C. DdPCR Vorlage Tröpfchen Leser Maschine (Materialtabelle, Punkt 11) vorbereiten. Spezifikation für die Parameter für die Absolute Quantifizierung und Nutzung zu gewährleisten die QX200 DdPCR Eva Green Supermix. Sobald DdPCR Analyse abgeschlossen ist, stellen Sie sicher, den gleichen trennenden Schwellenwert über alle Proben. Mit Hilfe der Konzentration Auslesen aus dem QX200 Tropfen Leser, aliquoten das entsprechende Volume, die gewünschte Anzahl von Molekülen in Folgeschritt einzuführen. PCR-Amplifikation der Bibliotheken für die Sequenzierung Bereiten die folgenden Mastermix für die gewünschte Anzahl von Molekülen aus Schritt 1.4.9: 25 µL der Q5 Mastermix (Materialtabelle, POS. 1), 2,5 µL P5 Primer (10 µM), 2,5 µL P7 Primer (10 µM), X µL von DNA, 20 X µL DdH2O. Verstärken die Bibliotheken aus Schritt 1.5.1 in einem Thermocycler mit den folgenden Bedingungen: 30 s bei 98 ° C; 20 Zyklen von 10 s bei 98 ° C, 30 s bei 63 ° C, 30 s bei 72 ° C; 2 min bei 72 ° C; und halten Sie dann bei 4 ° C. Bereinigen von Bibliotheken mit magnetischen Beads (Materialtabelle, Punkt 2): hinzufügen die PCR-Reaktion auf magnetische Perlen in einem modifizierten 1: 0,75 Verhältnis (PCR Reaktionsvolumen: Magnetischer Wulst Volumen). Pipette 37,5 µL magnetischer Wulst-Lösung in 50 µL-PCR-Produkte von Schritt 1.5.2. Übertragen Sie die Mischung zu einem Schlauch 1,5 mL niedriger Bindung. Mischen Sie durch pipettieren oben und unten mindestens 10 mal gründlich. Lassen Sie den Teig 5 min bei Raumtemperatur stehengelassen. Legen Sie das Rohr auf eine Magnethalterung. 2 Minuten bei Raumtemperatur oder bis überstand inkubieren ist klar. Entfernen Sie überstand. Waschen Sie die Perlen mit 200 µL 70 % Ethanol. 30 S. entfernen Ethanol inkubieren. Wiederholen Sie Ethanol Waschschritt einmal. Trocknen Sie die Perlen an der Luft. Eluieren Sie mit 20 µL DdH2O. Führen Sie ein Aliquot der DNA auf einem 2 % Agarosegel auf die Größe der Amplifikate zu bestätigen. Konzentration der DNA (Materialtabelle, POS. 3) Konzentration der separaten ECS Bibliotheken bestimmt zu quantifizieren. Bündeln Sie die Bibliotheken in äquimolaren Mengen.Hinweis: zum Beispiel können Forscher bündeln acht Bibliotheken in einer äquimolaren Gruppe4 mit 4 Millionen Moleküle für die Sequenzierung mit eine Sequenzierung-Plattform, die bis zu 400 Millionen mal gelesen-Ausgänge ab. Konservativ, empfiehlt es sich, durchschnittlich zehn rohe liest für die Fehlerkorrektur pro Moleküle zu verwenden. Dies dauerte bis 360 Millionen mal gelesen (4 Millionen Moleküle * 8 Bibliotheken * 10 liest für die Fehlerkorrektur). Mit 4 Millionen einzigartige Moleküle pro Bibliothek erwarten die Forscher einen theoretische mittlere Konsens Berichterstattung über 7042 X pro Amplifikate (4 Millionen/568 Amplifikate aus dem Bedienfeld “gen”) zu lesen bekommen. Konzentration der DNA (Materialtabelle, POS. 3) Konzentration der gepoolten ECS Bibliothek bestimmt zu quantifizieren. Einreichen die gepoolte ECS-Bibliothek bei etwa 4 nM. Bieten die folgenden Einstellungen der Sequenzierung, Illumina Sequenzierung Plattformen (MiSeq, Leseweite oder NextSeq): 2 x 144 gepaart-Ende liest, 8 Zyklen Index 1 und 16 Zyklen Index 2. (2) Gen Tafeln mit Fehler korrigiert Sequenzierung der DNA Hybridisierung von Oligos von Gen-panelsHinweis: In diesem Schritt konstruieren eine Sequenzierung Bibliotheken mit einem modifizierten Illumina TruSight oder TruSeq Protokoll, um UMIs (Materialtabelle, Artikel 17) zu integrieren. Hybridisieren Sie Oligos auf genomische Fragment nach Protokoll des Herstellers. Einsatz 250 ng DNA (oder jede gewünschte Menge an Ausgangsmaterial). Ungebundene Oligos nach Hersteller Protokoll zu entfernen. Ausführen der Erweiterung-Ligatur nach Protokoll des Herstellers.Hinweis: Änderungen des Herstellers Protokoll beginnen unten. Einbeziehung der i5 und i7-Adapter über PCR Bereiten Sie die PCR Mastermix durch pipettieren der folgenden Reagenzien in ein Rohr der entsprechenden Volume-Größe: 37,5 µL des Q5 Mastermix (Materialtabelle, POS. 1), 6 µL 10 µM 16N i5 Adapter (detaillierte in Methode 1, Schritt 1.2.2), 6 µL der i7-Adapter (Verwendung verschiedener i7 Adapter für separate Proben für multiplexing), und 22 µL Erweiterung-Ligatur-Lösung mit Perlen aus Schritt 2.1.3.Hinweis: Der Q5 Mastermix ersetzt die Polymerase Mastermix von Illumina zur Verfügung gestellt. Der Q5-Polymerase verstärkt die genomische Fragment mit höheren Treue und weniger Fehler eingeführt. PCR-Programm auf einem Thermocycler mit den folgenden Parametern ausführen: 30 s bei 98 ° C, 4 – 6 Zyklen von 10 s bei 98 ° C, 30 s bei 66 ° C, 30 s bei 72 ° C; 2 min bei 72 ° C und dann Halt bei 4 ° C.Hinweis: Die Anzahl der Zyklen hängt die Größe des Bildschirms. Aus unserer Erfahrung ist eine 4-Takt-PCR ausreichend, wenn die Gen-Panel verfügt über ca. 1.500 verschiedene Paare von Gen spezifische Oligos, eine Panel mit 500 – 600 Paare von Oligos 6 Zyklen der PCR erfordert. Bereinigen Sie PCR-Reaktionen mit magnetischen Beads (Materialtabelle, Punkt 2): hinzufügen die PCR-Reaktion auf magnetischen Kügelchen in einer modifizierten 1 PCR-Reaktion: 0,75 magnetischer Wulst-Verhältnis: Pipette 56,25 µL magnetischer Wulst-Lösung in die 75 µL des PCR-Produkte von Schritt 2.2.2. Übertragen Sie die Mischung zu einem Schlauch 1,5 mL niedriger Bindung. Mischen Sie durch pipettieren oben und unten mindestens 10 mal gründlich. Lassen Sie den Teig 5 min bei Raumtemperatur stehengelassen. Legen Sie das Rohr auf eine Magnethalterung. 2 min bei Raumtemperatur oder bis überstand inkubieren ist klar. Entfernen Sie überstand. Waschen Sie die Perlen mit 200 µL 70 % Ethanol. 30 S. entfernen Ethanol inkubieren. Wiederholen Sie Ethanol Waschschritt einmal. Trocknen Sie die Perlen an der Luft. Eluieren Sie mit 20 µL DdH2O. Bibliotheken mit QX200-DdPCR-Plattform zu quantifizieren. Folgen Sie Schritt 1.4 in Methode 1.Hinweis: 4 Millionen Moleküle wurden pro Probe Bibliothek4 in das repräsentative Ergebnis (Abbildung 2) normalisiert werden, um einen theoretischen Mittelwert von 7.042 eindeutig indizierte Moleküle (4 Millionen geteilt durch 568 Gen-spezifischen Oligos) zu erhalten. Verstärken und Bibliotheken für die Sequenzierung zu normalisieren. Verstärken Sie die gewünschte Anzahl der Moleküle unter Verwendung der folgenden Mastermix für die endgültige PCR in Höhe von 50 µL: 25 µL der Q5 Mastermix, 2 µL P5 Primer (1 µM), 2 µL P7 Primer (1 µM), und 21 µL DNA-Moleküle. PCR-Programm auf einem Thermocycler mit dem folgenden Parameter ausgeführt: 30 s bei 98 ° C; 16 Zyklen von 10 s bei 98 ° C, 30 s bei 66 ° C, 30 s bei 72 ° C; 2 min bei 72 ° C; und halten Sie dann bei 4 ° C. Aufräumen Sequenzierung Bibliotheken mit magnetischen Beads (Materialtabelle, Punkt 2): hinzufügen die PCR-Reaktion auf magnetischen Kügelchen in einer modifizierten 1 PCR-Reaktion: 0,75 magnetischer Wulst-Verhältnis: Pipette 37,5 µL magnetischer Wulst-Lösung in 50 µL-PCR-Produkte von Schritt 2.4.2. Übertragen Sie die Mischung zu einem Schlauch 1,5 mL niedriger Bindung. Mischen Sie durch pipettieren oben und unten mindestens 10 mal gründlich. Lassen Sie den Teig 5 min bei Raumtemperatur stehengelassen. Legen Sie das Rohr auf eine Magnethalterung. 2 min bei Raumtemperatur oder bis überstand inkubieren ist klar. Entfernen Sie überstand. Waschen Sie die Perlen mit 200 µL 70 % Ethanol. 30 S. entfernen Ethanol inkubieren. Wiederholen Sie Ethanol Waschschritt einmal. Trocknen Sie die Perlen an der Luft. Eluieren Sie mit 20 µL DdH2O. Führen Sie eine Aliquote eluierten DNA (~ 3 µL) auf einem 2 % Agarosegel auf die Größe der Amplifikate zu bestätigen. Konzentration der DNA (Materialtabelle, POS. 3) Konzentration der separaten ECS Bibliotheken bestimmt zu quantifizieren. Bündeln Sie die Bibliotheken in äquimolaren Mengen. Sie finden Sie unter Methode 1 Schritt 1.5.6. und auch die Diskussion für weitere Details zu bündeln. Einreichen die gepoolte ECS-Bibliothek bei etwa 4 nM. Bieten die folgenden Einstellungen der Sequenzierung, Illumina Sequenzierung Plattformen (MiSeq, Leseweite oder NextSeq): 2 x 144 gepaart-Ende liest, 8 Zyklen Index 1 und 16 Zyklen Index 2. ECS Bioinformatic Verarbeitung und Analyse Erhalten Sie die Probe demultiplexed liest aus der Sequencer oder führen Sie Demultiplexen des rohen Sequenz lautet in verschiedenen Proben mit i7 Adapter Sequenzen Bioinformatically mit einem benutzerdefinierten Skript aus. Schneiden Sie die ersten 30 Nukleotide jedes demultiplexed lesen, Oligo-Sequenzen aus dem Gen-Panel zu entfernen. Richten Sie liest, die die gleichen UMIs zueinander zu lesen Sie Familien teilen.Hinweis: Forscher UMI-fähige Software wie MAGERI13 können lesen Sie Familien extrahieren. Keine hamming Abstand durfte innerhalb der UMI-Sequenz in diesem Experiment die Spezifität der Methode zu erhöhen. Durchführen Sie Deduplizierung und Fehlerkorrektur mit den folgenden empfohlenen Parameter. Verwendung ≥5 gelesen, dass Paare in der gleichen Familie gelesen. Ein Minimum von drei lesen Sie Paaren wird empfohlen. Vergleichen Sie Nukleotid an jeder Position über alle Lesevorgänge in der gleichen lesen Sie Familie und erzeugen ein Konsens-Nukleotid besteht zu mindestens 90 % Konkordanz unter der liest für bestimmte Nukleotid. Rufen Sie eine N wenn es weniger als 90 % Zustimmung für die Nukleotid-Position. Entsorgen Sie Konsens lautet, die > 10 % der Gesamtzahl von Konsens Nukleotiden als N. Richten Sie alle einbehaltenen Konsens lautet lokal, hg19 oder hg38 menschlichen Bezug Genom mit Hilfe des Forschers bevorzugte Aligner(s) wie Bowtie2 und BWA. Prozess liest mit Mpileup mit Parametern ausgerichtet – BQ0 – d 10,000,000,000,000, Abdeckung Schwellenwerte um eine ordnungsgemäße Pile-Up Ausgabe unabhängig von VAF gewährleisten zu entfernen. Herausfiltern von Positionen mit weniger als 1000 X Konsens Berichterstattung zu lesen.Hinweis: Die Forscher die Mindestdeckung für jedes Nukleotid-Position willkürlich bestimmt, es empfiehlt sich, mindestens 500 X Konsens Abdeckung für nachgelagerte Analyse gelesen haben. Verwenden Sie Binomialverteilung um Einzel-Nukleotid-Varianten (SNPs) anzurufen, in aufbewahrten Daten aus Schritt 2.5.7 mit den folgenden Parametern. Die binomial-Statistik wird auf eine genomische Position-spezifische Fehlermodell beruhen. Jede genomische Position wird unabhängig modelliert nach summieren sich die Fehlerquoten aller Proben für diese besondere Position. Nach dem Beispiel:Wahrscheinlichkeit von Nukleotid-Profil an einer bestimmten genomische Position, p∑ Variante RF2 ∑ Total RFs= 26/255505= 0.000101759Binomischen Wahrscheinlichkeit 24 Variante RFs aus 35911 total RFs, P(X ≥ X) in Probe K= 1 – binomial(24, 35911, 0.000101759)= 2.26485E-13Hinweis: Für jede genomische Position abgefragt, es gäbe drei mögliche Mutationen Veränderungen (d. h.A > T, A > C, A > G), und von denen jeder als Hintergrund Artefakt vertreten wäre. Somatische Ereignisse, die sich deutlich vom Hintergrund nach Bonferroni Korrektur unterscheiden werden beibehalten. Im Beispiel in Tabelle 1dargestellt, die Anzahl der durchgeführten Tests war 11, daher eine Bonferroni korrigiert p-Wert ≤0.00454545 (0,05/11) war erforderlich, um ein Ereignis als statistisch signifikante nennen. Somatische Veranstaltungen sind erforderlich, um in beiden Wiederholungen aus der gleichen Probe vorhanden sein; Andernfalls sehen sie als Fehlalarme. Tabelle 1: Beispiel demonstriert die Möglichkeit, eine Position-spezifischen binomische Fehlermodell zu konstruieren. 3. Fehler korrigiert Sequenzierung von RNA Neben der Bewertung für Mutationen in der DNA-Ebene integrieren Sie ECS mit verschiedenen gezielten RNA Sequenzierung Tafeln, seltene oder niedrigen Fülle Abschrift auf RNA-Ebene zu erkennen. Durch die Kombination von ECS mit den handelsüblichen Qiagen RNA Sequenzierung Paneelen, haben wir digitale Quantifizierung der Genexpression für Protokolle mit so wenig wie zehn Kopien ohne Notwendigkeit einer Normalisierung gegen ein Zimmermädchen-gen gezeigt. Die UMIs für Fehlerkorrektur benötigt wurden in das Panel integriert. Führen Sie insgesamt RNA-Extraktion (Materialtabelle, Artikel 20). ECS-RNA Bibliothek Zubereitung nach Hersteller Protokoll (Materialtabelle, Punkt 19) durchführen. Durchführen Sie Bioinformatik-Pipeline nach Schritt 2.5.1–2.5.6. Methode 2 im vorherigen Abschnitt beschrieben. Nach Schritt 2.5.6 steht für die Anzahl der ausgerichteten Konsens lautet pro gen die Expression des Gens ohne gen Länge Normalisierung.

Representative Results

Mit Targeted Error-Corrected für die DNA-Sequenzierung haben wir einen Nachweis der Prinzip Experiment verdünnen mutierten Patienten DNA in kommerziellen genomischer DNA durchgeführt. Der Patient hatte eine Mutation im GATA1 (ChrX:48650264, C > G) mit original VAF von 0,19. In Abbildung 1 zeigen wir, dass ECS quantitative auf ein Niveau von 1: 10.000 für Einzel-Nukleotid-Variante ist. Abbildung 1: Verdünnungsreihen GATA1 SNV nachzuweisen, dass ECS quantitative auf das Niveau von 1: 10.000 ist. Bitte klicken Sie hier für eine größere Version dieser Figur. Wir zeigen auch, dass die ECS-DNA zuverlässig seltene klonale Mutationen in Genen wiederkehrend in Erwachsenen akute myeloische Leukämie (AML) bei gesunden älteren Personen4 erkennt. Wir erhalten buffy Coat Proben von 20 gesunde Individuen in der Nurse Health Study überhöht etwa ~ 10 Jahre auseinander. An diesen Proben haben wir das ECS-DNA-Panel-Protokoll angewendet. Für dieses Experiment wir die Illumina TruSight myeloische Sequenzierung Panel, das besteht aus 568 Amplifikate (Weitere Informationen auf Gen-Liste auf https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html) angepasst und sequenziert 80 Bibliotheken ab 20 Personen (2 Sammlungen zu verschiedenen Zeitpunkten, 2 Wiederholungen pro Person pro Zeit Punkt) mit Illumina NextSeq Plattform, die einen Durchschnitt von 47,7 Millionen gepaart Ende liest und einen Durchschnitt von 3,4 Millionen Fehler korrigiert generiert Konsensus-Sequenzen pro Bibliothek4. Die mittlere Nukleotid-Abdeckung pro Bibliothek war etwa 6.000 x (3,4 Millionen geteilt durch 568). Für jede Probe errichteten wir ein Position-spezifische Fehler Profil sequenzierte Bibliotheken, die nicht aus derselben Probe verwenden. Wir fanden 109 klonale somatische Mutationen, die in beiden Wiederholungen mindestens eine Sammelstelle Zeit vorhanden waren. Diese Mutationen haben VAF von 0,0003 – 0.1451. Wir wählten 21 Mutationen mit bekannten kosmischen Darstellungen und überprüft alle 21 Mutationen in ein oder zwei Sammlung Zeit Punkt(e) mit DdPCR (n = 34, Abbildung 2, adaptiert von jungen Et Al. 20164). Abbildung 2: Mutationen von ECS identifiziert wurden über DdPCR mit höchst konkordante VAFs verifiziert. (n = 34, modifiziert von jung Et Al. 20164). Bitte klicken Sie hier für eine größere Version dieser Figur. In Bezug auf Fehler korrigiert Ausdruck mit ECS-RNA-Protokoll wir ein Gen Panel mit QIAseq-Chemie, die besteht aus 416 Gene bekannt, verbunden mit verschiedenen Krebsarten (adaptiert von QIAseq menschlichen Krebs Transkriptom-Panel), und wir werden angepasst die am häufigsten geäußerten Exon eines bestimmten Gens (Gen Liste in ergänzenden Material 1) verstärkt. Wir sequenziert die Bibliotheken mit Illumina MiSeq Plattform in gepaart-End-Format, die durchschnittlich 8,3 Millionen Lesevorgänge pro Bibliothek gegeben hat, und uns gelungen, einen Durchschnitt von 0,417 Millionen Fehler korrigiert Konsensus-Sequenzen einzufangen. Wir zeigten, dass die Expression von niedrigen Fülle Transkript (< 1.000 Transkript Graf in 50 ng von Gesamt-RNS) ist sehr reproduzierbar auf Wiederholungen (Datenpunkt n = 300, Abbildung 3). Validierung von DdPCR (sechs ausgewählter Gene von unterschiedlichem Ausmaß des Ausdrucks) gezeigt, dass die Expression von Genen durch das ECS-Protokoll ohne die Notwendigkeit einer Normalisierung korrekt eingenommen worden war. Abbildung 3: Top, Korrelation der Mitschrift zählt von ECS-RNA auf Wiederholungen der gleichen Probe (n = 300). Unten, Abschrift, die Grafen von ECS identifiziert wurden durch DdPCR überprüft (n = 6). Bitte klicken Sie hier für eine größere Version dieser Figur.

Discussion

Hier zeigen wir eine Reihe von Fehler korrigiert Sequenzierung Protokolle, die leicht umsetzbar sind, um Mutationen mit niedrigen VAFs bei verschiedenen Krankheiten zu studieren. Der wichtigste Faktor ist die Einarbeitung von UMIs mit jedem Molekül vor der Sequenzierung, da sie Fehlerkorrektur des rohen lautet ermöglichen. Die hier beschriebenen Methoden erlauben Forschern, maßgeschneiderte UMIs zu handelsüblichen gen Panels und selbst entworfenen Gen-spezifischen Oligos zu integrieren.

Standardprotokoll NGS schließt den Nachweis von Mutationen mit VAF unter 2 % aufgrund der Sequenzierung Fehlerquote, und dies schränkt die Anwendung der NGS in Studien, in denen der Nachweis von seltenen Varianten entscheidend ist. Unter Umgehung den Normalsatz der NGS-Fehler, ermöglicht ECS empfindliche Detektion dieser rohen Varianten. Nachweis von pathogenen Mutationen, wenn diese Mutationen erst entstehen (also mit niedrigen VAF) unbedingt zum Beispiel Frühförderung der Krankheit14,15zu informieren. In der Leukämie-Forschung, die Erkennung von minimal Residual Krankheit (residual leukämischen Zellen nach der Behandlung) informiert risikostratifizierung und Behandlungsmöglichkeiten in einer Art und Weise zu informieren, die binäre Fluss durchflusszytometrischen Bewertungen können nicht genutzt werden. Darüber hinaus gilt ECS zirkulierenden Tumor Nukleinsäure erkennen und bewerten metastasiertem Potenzial bei soliden Tumorpatienten durch die Bewertung für die Anwesenheit/Abwesenheit sowie die Variante Belastung durch bestimmte Mutationen, die Merkmale des primären Tumor-16.

Wie in Tabelle 1gezeigt hat, hängt die Macht der Verwendung Binomialverteilung-basierte Position-spezifischen Fehlermodell Varianten nennen die Anzahl der sequenzierten Bibliotheken sowie die Tiefe der Sequenzierung verwendet, um das Fehlermodell zu bauen. Die Robustheit des Modells Fehler steigt mit höheren Anzahl von Proben und Sequenzierung eingehender. Es wird empfohlen, mindestens 10 sequenzierte Proben mit einem Durchschnitt von Fehler-Korrektur lesen Sie Abdeckung von 3000 X pro Probe verwenden, um für jede Probe ein Fehler-Profil zu erstellen. Die Position-spezifischen Ansatz ist ähnlich wie MAGERI, sondern anstelle einer aggregierten Fehlerquote für alle sechs unterschiedliche Substitution (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)13, modellieren wir jede Ersetzung unabhängig voneinander in jeder Position. Zum Beispiel eine Fehlerrate von C > T an einer bestimmten genomische Position unterscheidet sich von einer anderen Position. Unser Ansatz berücksichtigt auch eine Sequencing Batch Wirkung, wie die Basis Substitution Rate beobachtet in einem Sequenzierung Lauf laufen unterschiedlich sein könnte. Daher ist es wichtig, jede Position für alle Arten der Substitution zu modellieren, vor allem, wenn Proben aus verschiedenen Sequenzierung läuft für die Modellerstellung zusammengefasst sind.

Ein wichtiger Aspekt bei der Gestaltung ein ECS-Experiment ist der gewünschte Nachweisgrenze. Die Schönheit der NGS Studien ist, dass sie in Bezug auf die Gene/Ziele von Interesse, Nachweisgrenze (diktiert von der Tiefe der Sequenzierung) und Anzahl der Personen abgefragt leicht skaliert werden können. Zum Beispiel, wenn die Forscher interessiert, seltene Mutationen in zwei Amplifikate mit einer Nachweisgrenze von 0,0001 zu finden sind, können sie maximal 75 Proben in einem einzigen Sequenzierung mit MiSeq V2-Chemie, die bis zu 15 Millionen mal gelesen Ausgänge ausgeführt bündeln (2 Amplifikate * 10.000 Moleküle * 10 liest für Fehlerkorrektur * 75 Proben = 15 Millionen Sequenzierung liest). Forscher können die Anzahl der Moleküle ins Sequenzierung oder die Anzahl der gepoolten Proben in einer einzigen Sequenzierung ausgeführt, um die Nachweisgrenze anpassen variieren. In unseren Studien sollen wir Mutationen mit einer Nachweisgrenze von 0,0001 VAF (01:10, 000) mit dem Illumina-gen-Panel. Wir verwenden routinemäßig 250 ng DNA, um sicherzustellen, dass genügend Moleküle erfasst werden, zur Erreichung die oben genannten Nachweisgrenze zu starten. Forscher können um mit geringeren Menge an DNA zu beginnen (50 ng empfohlen) Wenn die gewünschte Nachweisgrenze liegt > 0,001 VAF.

Da die UMIs auf die i5-Indizes angehängt sind, verfügen über Sequenzierung Einstellungen entsprechend geändert werden. Zum Beispiel wir 16 N UMIs verwendet, und die Sequenzierung Einstellungen waren 2 x 144 gekoppelten Ende liest, 8 Zyklen der Index 1 und 16 Zyklen von Index 2 im Gegensatz zu den üblichen 8 Zyklen der Index 2. Der Index 2 Takt ist durch einen Rückgang der Gesamtzahl der Zyklen zugeteilt, der liest ausgeglichen. Wenn Forscher 12N UMIs10,17verwenden entscheiden, sollten die Einstellungen 12 Zyklen der Index 2 geändert werden.

Diese UMI-basierte Sequenzierung Methode ist optimiert, um für Sequenzierung Fehler zu korrigieren. Es bleibt suboptimale im Umgang mit PCR-Jackpotting, das ist ein Thema für alle Verstärkung basierende Methode. Wir Runden von Post-Sequenzierung und Post-Bioinformatik-Validierung mit DdPCR durchgeführt, und wir kaum erkennen Fehlalarme durch PCR Jackpotting. Dennoch empfiehlt es sich, dass Forscher die Experimente mit High Fidelity Polymerase um zu niedrige Verstärkung Fehler zu gewährleisten.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wir danken die Teilnehmern in der Kinder-Onkologie-Gruppe AAML1531-Studie und der Nurses’ Health Studie für ihre Beiträge in Form von Patientenproben. Diese Arbeit wurde von der National Institutes of Health (UM1 CA186107, RO1 CA49449 und RO1 CA149445), der Kinderuni Discovery Institute of Washington St. Louis Children Hospital (MC-II-2015-461) und Eli Seth Matthews Leukämie Stiftung finanziert.

Materials

Q5 High Fidelity Hot Start Master Mix New England BioLabs M0492S
Agencourt AMPure XP Beckman Coulter A63880
Qubit dsDNA HS Assay Kit Thermo Fisher Scientific Q32854
SYBR Safe DNA Gel Stain Thermo Fisher Scientific S33102
Truseq Custom Amplicon Index Kit Illumina FC-130-1003
UMI i5 adapter sequences Integrated DNA Technologies
NEBNext Ultra End Repair/dA-Tailing Module New England BioLabs E7442S
NEBNext Ultra II Ligation Module New England BioLabs E7595S
QX200 ddPCR EvaGreen Supermix Bio-Rad 1864034
QX200 Droplet Generation Oil for EvaGreen Bio-Rad 1864005
QX200 Droplet Digital PCR System Bio-Rad 1864001
ddPCR 96-Well Plates Bio-Rad 12001925
DG8 Cartridges for QX200/QX100 Droplet Generator Bio-Rad 1864008
DG8 Gaskets for QX200/QX100 Droplet Generator Bio-Rad 1863009
Bioanalyzer Agilent Genomics G2939BA
TapeStation Agilent Genomics G2991AA
TruSight Myeloid Sequencing Panel Illumina FC-130-1010
Bowtie 2 Johns Hopkins University
Customized QIAseq Targeted RNA Panel Qiagen
Rneasy Plus Mini Kit (50) Qiagen 74134

References

  1. Hoang, M. L., et al. Genome-wide quantification of rare somatic mutations in normal tissues using massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 113, 9846-9851 (2016).
  2. O’Roak, B. J., et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature. 485, 246-250 (2012).
  3. Young, A. L., et al. Quantifying ultra-rare pre-leukemic clones via targeted error-corrected sequencing. Leukemia. 29 (7), 1608-1611 (2015).
  4. Young, A. L., Challen, G. A., Birmann, B. M., Druley, T. E. Clonal hematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. NatureCommunications. 7, 12484 (2016).
  5. Patel, J. P., et al. Prognostic relevance of integrated genetic profiling in acute myeloid leukemia. New England Journal of Medicine. 366, 1079-1089 (2012).
  6. Shendure, J., Ji, H. Next-generation DNA sequencing. Nature Biotechnology. 26 (10), 1135-1145 (2008).
  7. Kohlmann, A., et al. Monitoring of residual disease by next-generation deep-sequencing of RUNX1 mutations can identify acute myeloid leukemia patients with resistant disease. Leukemia. 28, 129-137 (2014).
  8. Luthra, R., et al. Next-generation sequencing-based multigene mutational screening for acute myeloid leukemia using MiSeq: applicability for diagnostics and disease monitoring. Haematologica. 99, 465-473 (2014).
  9. Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W., Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 108 (23), 9530-9535 (2011).
  10. Schmitt, M., et al. Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences USA. 109 (36), 14508-14513 (2012).
  11. Vander Heiden, J. A., et al. pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. Bioinformatics. 30 (13), 1930-1932 (2014).
  12. Newman, A. M., et al. Integrated digital error suppression for improved detection of circulating tumor DNA. NatureBiotechnology. 34, 547-555 (2016).
  13. Shugay, M., et al. MAGERI: Computational pipeline for molecular-barcoded targeted resequencing. PLOSComputationalBiology. 13 (5), e1005480 (2017).
  14. Wong, T. N., et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 518, 552-555 (2014).
  15. Krimmel, J. D., et al. Ultra-deep sequencing detects ovarian cancer cells in peritoneal fluid and reveals somatic TP53 mutations in noncancerous tissues. Proceedings of the National Academy of Sciences USA. 113 (21), 6005-6010 (2016).
  16. Phallen, J., et al. Direct detection of early-stage cancers using circulating tumor DNA. ScienceTranslationalMedicine. 9, eaan2415 (2017).
  17. Egorov, E. S., et al. Quantitative profiling of immune repertoires for minor lymphocyte counts using unique molecular identifiers. The Journal of Immunology. 194 (12), 6155-6163 (2015).

Play Video

Cite This Article
Wong, W. H., Tong, R. S., Young, A. L., Druley, T. E. Rare Event Detection Using Error-corrected DNA and RNA Sequencing. J. Vis. Exp. (138), e57509, doi:10.3791/57509 (2018).

View Video