Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
cartographie du réseau de méthylation de l'ADN est fortement étudié dans les tissus normaux et malades. Une variété de procédés ont été mis en place pour interroger les schémas de méthylation de cytosine dans des cellules. Représentation réduite du séquençage du génome de bisulfite ensemble a été conçu pour détecter des modèles de résolution de méthylation de cytosine quantitatives de paires de bases à des loci génomiques riche en GC. Ceci est réalisé en combinant l'utilisation d'une enzyme de restriction suivie de la conversion au bisulfite. Représentation accrue réduit Bisulfite Sequencing (ERRBS) augmente le locus génomique d'intérêt biologique couvert et a été utilisé pour profiler méthylation de cytosine dans l'ADN d'humain, de souris et d'autres organismes. ERRBS amorce avec une enzyme de restriction digestion de l'ADN pour générer des fragments de bas poids moléculaire pour une utilisation dans la préparation bibliothèque. Ces fragments sont soumis à la construction de la bibliothèque standard pour le séquençage de prochaine génération. Conversion au bisulfite de cytosines non méthylés avant la finale amplificatià l'étape permet la résolution de base quantitative des niveaux de méthylation cytosine dans des loci génomiques couverte. Le protocole peut être effectuée dans les quatre jours. Malgré une faible complexité dans les trois premières bases séquencées, bibliothèques ERRBS fournissent des données de haute qualité en utilisant une voie de commande de séquencement désigné. analyse de la cartographie et de la bio-informatique est alors effectuée et fournit des données qui peut être facilement intégré avec une variété de plates-formes de l'ensemble du génome. ERRBS peut utiliser de petites quantités de matières entrantes qui rend possible de traiter des échantillons cliniques humains et applicable dans une gamme d'applications de recherche. La vidéo produite démontre étapes critiques du protocole de ERRBS.
Méthylation de l'ADN à la cytosine (5-méthylcytosine) est une marque épigénétique critique dans les cellules de mammifères pour une variété de processus biologiques, y compris mais non limité à l'empreinte, l'inactivation du chromosome X, le développement, et la régulation de l'expression génique 1-8. L'étude des modèles de méthylation d'ADN dans les troubles malignes et d'autres a déterminé les habitudes spécifiques de maladies et contribué à la compréhension de la pathogenèse de la maladie et de découvertes de biomarqueurs potentiels 9-17. Il existe de nombreux protocoles qui interrogent l'épigénome de statut de méthylation d'ADN. Ceux-ci peuvent être divisées en base d'affinité, sur la base-enzyme de restriction, et des essais à base de conversion-bisulfite qui utilisent des puces à ADN ou les plates-formes en aval séquençage. En outre, il ya quelques protocoles qui comblent ces catégories générales, y compris, mais sans s'y limiter, l'analyse combinée de restriction bisulfite 18 et réduit Représentation bisulfite séquençage (ORR 19). </p>
RRBS a été initialement décrit par Meissner et al. 19,20. Le protocole introduit une étape d'enrichir régions génomiques riches en GC suivie par séquençage bisulfite, qui a abouti à des données quantitatives de la résolution paires de bases qui est rentable 21,22. Les régions riches en GC sont ciblés par le MspI (C ^ CGG) enzyme de restriction, et la cytosine méthylation est résolu par conversion au bisulfite de cytosines (désamination des cytosines non modifiés à l'uracile), suivie de la réaction en chaîne par polymérase (PCR). RRBS couvert la majorité des promoteurs de gènes et îlots CpG dans une fraction du séquençage requis pour un génome entier; cependant RRBS avaient une couverture limitée des rives de CpG et d'autres régions intergéniques de pertinence biologique. Plusieurs groupes ont publié des mises à jour des protocoles ORR depuis le rapport original améliorer la méthodologie et la couverture résultante de ces régions génomiques 23-25. Représentation accrue réduit bisulfite Sequdes diffi- (ERRBS) comprend des modifications de préparation bibliothèque et un alignement des données alternatif approche 26 par rapport à RRBS. ERRBS a entraîné une augmentation du nombre de CpG représentées dans les données générées et augmentation de la couverture de toutes les régions génomiques interrogé 26. Cette méthode a été utilisée pour résoudre des modèles de méthylation d'ADN dans patient humain et d'autres spécimens d'animaux de 26 à 30.
Le protocole de ERRBS décrit offre des détails sur toutes les mesures nécessaires pour l'achèvement et des données a été généré en utilisant l'ADN humain représentant (échantillons ont été obtenus à partir signalés précédemment, dépersonnalisées échantillons de patients 31 et CD34 + os échantillon de moelle d'un donneur humain normal). Le protocole comprend un processus de sélection du format automatisé, ce qui réduit le temps de traitement par l'échantillon et permet une précision accrue dans la sélection de la taille de bibliothèque. Le protocole combine une série de techniques de biologie moléculaire établies. ADN de haut poids moléculaire est digéré avecvec une enzyme de restriction de méthylation insensible (MspI) suivi d'ici la fin de réparation, A-tailing, et la ligature d'adaptateurs méthylés. Choix de la taille des fragments riches en GC est suivie par conversion au bisulfite et d'amplification par PCR avant le séquençage. Conversion au bisulfite a été décrit précédemment 32 et un examen détaillé de l'analyse des données et des applications est au-delà de la portée de ce document, cependant recommandations et des références sont inclus pour l'utilisation des lecteurs. Le protocole peut être effectuée sur quatre jours et se prête à la petite entrée (50 ng ou moins) des montants significatifs. Le protocole fournit des données décrits à forte couverture par site CpG non seulement suffisante pour site de méthylation et la région déterminations différentielles mais également pour la détection du polymorphisme épigénétique comme décrit par Landan, et al. 33.
Les données de résolution rendements paires de bases protocole présenté de méthylation de la cytosine à des régions génomiques biologiquement pertinents. Le protocole comme écrit est optimisé pour 50 ng de produit de départ, cependant, il peut être adapté pour traiter une gamme de matériel d'entrée (5 ng ou plus) 26. Cela nécessitera des ajustements de certaines des étapes de protocole comme on le voit dans le tableau 6. Les bibliothèques de ERRBS se prêtent à un séquençage d'extrémité et couplé en outre une couverture génomique peut également être réalisé par séquençage lectures plus de 51 cycles. Séquençage multiplexé offrira un protocole à moindre coût par échantillon, cependant, cela se traduira par une couverture réduite par site CpG représenté dans les données (Figure 5 et le Tableau 8), et ne cédera pas une profondeur suffisante de la couverture d'effectuer des analyses qui nécessitent une couverture élevée par CpG place (par exemple comme décrit par Landan et al. 33). Enfin, ce protocole (ou tout Protoco base bisulfite-l) ne peut pas distinguer entre méthyl-cytosine et hydroxyméthyle-cytosine 46,47. Toutefois, les données générées peuvent être intégrés à d'autres résultats protocole 48,49 pour délimiter les différentes modifications, et d'autres modifications de cytosine récemment rapporté 50, devraient-ils être d'intérêt.
Bibliothèques de haute qualité apparaîtra comme le montre la figure 3A-C, et une fois mis en commun pour le séquençage donne une trace comme le montre la figure 3G (trace rouge) représentant contributions molaires égales des deux fractions de la bibliothèque. Bibliothèque échec de préparation peut résulter de ne importe quelle étape pendant la procédure. Si l'ADN dégradé est traitée elle se traduira dans les bibliothèques qui ne sont pas enrichis en fragments Mspl et donc de la faible couverture CpG en utilisant les paramètres de séquençage décrites dans ce protocole. Si une enzyme est non fonctionnelle ou exclu par inadvertance de l'une des réactions, le protocole donné la bibliothèque attendu. Si le rea de ligaturection est inefficace, les adaptateurs sont à une concentration plus élevée que prévu, et / ou la concentration des amorces utilisé est un réactif limitant pour les étapes finales d'amplification, l'échec de la bibliothèque peut se produire. Adaptateurs excès (considéré comme un des pics à ~ 150 pb dans les résultats de bioanalyse; Figure 3D-F) à la bibliothèque sera également interférer avec le séquençage due au regroupement aveugle de la bibliothèque et adaptateurs excès. Si une telle bibliothèque peut séquencer apparemment normalement, une partie importante du lit sera séquences simplement l'adaptateur. Si des adaptateurs en excès sont observées dans une bibliothèque, il est préférable de répéter la préparation bibliothèque si le matériel est disponible en utilisant du matériel d'entrée optimal à l'adaptateur rapports quantitatifs. Enfin, pour assurer une amplification par PCR efficace des bibliothèques, les fractions bibliothèque inférieurs et supérieurs sont maintenus comme des échantillons distincts dans l'ensemble de la conversion au bisulfite et PCR étapes d'enrichissement. Ne pas le faire donne l'efficacité différentielle de l'amplification au cours de la PCR réaction de fractions supérieures et inférieures (comme on le voit sur la figure 3G trace bleue) et le potentiel de la représentation inégale des loci génomiques respectif couverte dans chaque fraction bibliothèque au cours du séquençage. L'utilisateur peut choisir d'inclure une étape de PCR quantitative immédiatement après la conversion au bisulfite de titrage en outre des cycles de PCR optimales nécessaires pour amplifier les bibliothèques générées.
ERRBS protocole de préparation de la bibliothèque comporte plusieurs étapes clés dans lesquels les réactifs spécifiques sont recommandées. Lors de l'étape de fin de réparation, l'utilisation d'un mélange de dNTP à quatre nucleotides permet fin de réparation de tous produits qui ne contiennent pas le surplomb CG, tels que ceux résultant de MspI activité enzymatique en étoile et des fragments d'ADN cisaillé présents dans l'échantillon d'ADN d'origine. Il en résulte une meilleure représentation CpG dans les résultats. A l'étape de ligature, il est essentiel d'utiliser une ligase forte concentration (2.000.000 unités / ml) et méthylés adaptateurs pour se assurer que la Reacti de ligationOn est efficace et que la conversion au bisulfite ne influence pas les séquences d'adaptation essentielles pour l'alignement de données précises. A l'étape PCR, en utilisant une polymérase capable d'amplifier des fragments d'ADN riches en GC traité au bisulfite est nécessaire pour une grande spécificité. Enfin, pour assurer l'élimination des adaptateurs et les amorces en excès, SPRI cordon purification (par exemple: Agencourt AMPure XP) est recommandé plutôt que de tests basés sur des colonnes pour ligature et isolements de produits PCR.
Afin de générer des données de haute qualité, il est important pour assurer une conversion au bisulfite efficace. Le contrôle présenté offre à l'utilisateur la possibilité de déterminer l'efficacité de conversion avant le séquençage. En variante, un ADN non humain tel que lambda ADN peut être utilisé en tant que contrôle interne (spike-in). En raison des différences entre les espèces, ce type de commande peut être directement inclus dans le séquençage en aval (par exemple, tel qu'il est utilisé par Yu, et al. 34). Cependant, si le pic i-ins utilisé, il ne peut être utilisé pour déterminer l'efficacité de conversion avant le séquençage bibliothèque amplifiée à moins unique et séquence avant le séquençage bibliothèque de façon indépendante. Les taux de conversion déterminés sont basés sur l'état de méthylation des sites CpG non. Cela peut ne pas être approprié pour une utilisation dans le contexte de forte méthylation de la cytosine dans le contexte non CpG (par exemple des cellules souches embryonnaires) et des échantillons parallèles ou d'autres moyens d'évaluation de l'efficacité de conversion peuvent être utilisés à cette fin.
Il ya quelques mises en garde à l'adresse qui sont uniques à l'enchaînement des bibliothèques ERRBS. Les trois premières bases des fractions de la bibliothèque séquencés sont presque uniformément non aléatoire en raison du site de coupe de reconnaissance MspI (C ^ CGG; voir la figure 4B, C). Il en résulte le risque de perte de données importantes en raison de la faible qualité lectures résultant d'une mauvaise localisation de cluster en dépit de la densité de cluster haute apparente au cours du séquençage. Pour surmonter cet obstacle,inclure une bibliothèque de grande complexité dans une voie indépendante (contrôle PhiX ou un autre type de bibliothèque) comme une voie de contrôle dédié. Bibliothèques de haute complexité ont des extrémités contenant une représentation équilibrée des A, C, T et G dans les quatre premières bases séquencées. Voies de contrôle appropriés comprennent les bibliothèques telles que l'ARN-Seq, ChIP-seq, le séquençage du génome entier, ou un contrôle offert par le fabricant de la machine de séquençage (par exemple v3 contrôle PhiX). Lorsque désignée comme une voie de commande pour la course respective de séquençage, il peut servir de base pour la génération de la matrice qui est utilisée au cours des quatre premières bases de séquençage pour détecter des positions de la grappe. La qualité supérieure lectures capturé augmentera la couverture moyenne par site CpG de 5,2 (n = 4). Alternativement, cette difficulté technique peut également être surmonté en utilisant une approche de séquençage sombre comme décrit précédemment 23. Autres critères de séquençage suivent des procédures normalisées d'exploitation par les protocoles du fabricant. Enfin, la couverture par CpG chosen pour l'analyse des données sera guidé par l'utilisateur et en partie par les questions biologiques d'intérêt. 10x seuil de couverture offre une approche d'analyse de couverture élevé, mais ce seuil peut être abaissé devrait-il être d'intérêt.
Une discussion complète de l'analyse de données ERRBS est au-delà du champ d'application de cet article, cependant, différemment cytosines méthylés et régions peuvent être déterminées en utilisant des outils open source 31,51-53. Considérations et des approches d'analyse supplémentaires ont été bien décrit 54,55, et le lecteur est encouragé à rechercher la littérature pour les outils les plus appropriés pour l'analyse prévue.
Comparé à d'autres méthodes publiées, ERRBS propose un protocole de quatre jours qui, lorsqu'il est effectué alors que les rendements décrits taux élevés de reproductibilité. Il a été validé par rapport à l'étalon-or MassARRAY EpiTYPER 26, est rentable pour des données de haute couverture, et est adaptable pour différents matériaux d'entrée(montants favorables pour le traitement de l'échantillon clinique et d'autres types cellulaires de basse fréquence) et des approches de séquençage. Il offre une résolution paires de bases à des loci biologiquement pertinente et peut être utilisé dans les analyses d'intégration avec d'autres techniques de profilage du génome entier facteur de transcription contraignant, remodelage de la chromatine, marques épigénétiques et d'autres modifications cytosine d'intérêt. L'utilisation des données ERRBS dans de telles études peut contribuer à une approche moléculaire complète et permettre grande dimension analyses dans l'étude de modèles biologiques et la maladie humaine.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |