Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
ADN mapeo patrón de metilación se estudia en gran medida en los tejidos normales y enfermos. Una variedad de métodos se han establecido para interrogar a los patrones de metilación de citosina en las células. Representación reducida de toda la secuenciación del genoma de bisulfito fue desarrollado para detectar pares de bases patrones de metilación de citosina resolución cuantitativos en loci genómica GC-ricos. Esto se logra mediante la combinación del uso de una enzima de restricción seguido por la conversión de bisulfito. Enhanced representación reducida bisulfito de secuenciación (ERRBS) aumenta el loci genómico biológicamente relevante cubierto y se ha utilizado para perfil de metilación de citosina en el ADN de humano, ratón y otros organismos. ERRBS inicia con la restricción de la digestión enzimática de ADN para generar fragmentos de bajo peso molecular para uso en la preparación de la biblioteca. Estos fragmentos se someten a la construcción de bibliotecas estándar para la secuenciación de próxima generación. Bisulfito de conversión de citosinas no metiladas antes de la última amplificatide paso permite la resolución de base cuantitativa de los niveles de metilación de citosina en loci genómicos cubierto. El protocolo puede ser completada dentro de cuatro días. A pesar de baja complejidad en los primeros tres bases secuenciadas, bibliotecas ERRBS producen datos de alta calidad cuando se utiliza un carril de control de secuencia designada. Análisis de la cartografía y la bioinformática se realiza entonces y produce datos que se puede integrar fácilmente con una variedad de plataformas en todo el genoma. ERRBS puede utilizar pequeñas cantidades de material de entrada por lo que es factible para procesar las muestras clínicas humanas y aplicable en una amplia gama de aplicaciones de investigación. El video producido demuestra los pasos críticos del protocolo ERRBS.
La metilación del ADN en citosina (5-metilcitosina) es una marca epigenética crítico en células de mamífero para una variedad de procesos biológicos, incluyendo, pero no limitado a la impresión, la inactivación del cromosoma X, el desarrollo, y la regulación de la expresión génica 1-8. El estudio de los patrones de metilación del ADN en los trastornos malignos y otros ha determinado los patrones específicos de la enfermedad y ha contribuido a la comprensión de la patogénesis de la enfermedad y los posibles descubrimientos de biomarcadores 9-17. Hay muchos protocolos que interrogan el epigenoma de estado de metilación del ADN. Estos se pueden dividir en basado afinidad, la enzima de restricción-basan, y ensayos basados conversión-bisulfito que utilizan microarrays o plataformas de secuenciación de aguas abajo. Además, hay algunos protocolos que unen estas categorías generales incluyendo, pero no limitado a, análisis de restricción combinado bisulfito de 18 y representación reducida bisulfito de secuenciación (RRB 19). </p>
RRB fue descrito originalmente por Meissner et al. 19,20. El protocolo introdujo un paso para enriquecer regiones genómicas ricas en GC, seguido por secuenciación de bisulfito, lo que resultó en datos de resolución de pares de bases cuantitativa que es rentable 21,22. Las regiones ricas en GC son el blanco de la enzima de restricción MspI (C ^ CGG), y la metilación de citosina se resuelve mediante la conversión de bisulfito de citosinas (desaminación de citosinas no modificados a uracilo), seguido de la reacción en cadena de la polimerasa (PCR). RRB cubrieron la mayoría de los promotores de genes y las islas CpG en una fracción de la secuencia requerida para todo un genoma; sin embargo RRBs tenían cobertura limitada de costas CpG y otras regiones intergénicas de relevancia biológica. Varios grupos han publicado actualizado protocolos RRBs desde el informe original que mejorar en la metodología y cobertura resultante de estas regiones genómicas 23-25. Enhanced Representación reducido bisulfito Sequferencias (ERRBS) incluye modificaciones de preparación de biblioteca y una alineación de datos alternativa de aproximación 26 cuando se compara con los RRB. ERRBS resultó en un mayor número de CpG representadas en los datos generados y el aumento de la cobertura de todas las regiones genómicas interrogado 26. Este método ha sido utilizado para resolver los patrones de metilación del ADN en paciente humano y de otros especímenes de animales 26-30.
El protocolo descrito ERRBS ofrece detalles sobre todos los pasos necesarios para la terminación y los datos se generó utilizando ADN humano representante (muestras se obtuvieron a partir de informes anteriores, las muestras de pacientes de-identificado 31, y una muestra de médula ósea CD34 + a partir de un donante humano normal). El protocolo incluye un proceso de selección de tamaño automático, lo que reduce el tiempo de procesamiento por muestra y permite una mayor precisión en la selección de tamaño de la biblioteca. El protocolo combina una serie de técnicas de biología molecular establecidas. ADN de alto peso molecular se digiere wITH una enzima de restricción insensible a metilación (MspI), seguido de la reparación final, A-tizón, y ligación de adaptadores metilados. Selección del tamaño de los fragmentos ricos en GC es seguido por la conversión de bisulfito y la amplificación PCR antes de la secuenciación. Conversión de bisulfito se ha descrito previamente 32 y revisión detallada de análisis y aplicaciones de datos está más allá del alcance de este trabajo, sin embargo se incluyen recomendaciones y referencias para el uso de los lectores. El protocolo se puede realizar en cuatro días y es susceptible de pequeña entrada (50 ng o menos) las cantidades de material. El protocolo ya que los rendimientos descritos de datos con alta cobertura por sitio CpG suficiente no sólo para las determinaciones diferenciales sitio de metilación y la región, sino también para la detección de polimorfismo epigenética como se describe por Landan, et al. 33.
Los datos de resolución rendimientos pares de bases del protocolo presentado de metilación de citosina en regiones genómicas biológicamente relevantes. El protocolo escrito como está optimizado para 50 ng de material de partida, sin embargo, puede ser adaptada para manejar una amplia gama de material de entrada (5 ng o más) 26. Esto requerirá ajustes de algunos de los pasos del protocolo como se ve en la Tabla 6. Las bibliotecas ERRBS son susceptibles de secuenciación final emparejado y aún más la cobertura genómico también se puede lograr mediante secuenciación lee más de 51 ciclos. Secuenciación multiplexada ofrecerá un protocolo de menor costo por muestra, sin embargo, esto se traducirá en una cobertura reducida por sitio CpG representado en los datos (Figura 5 y Tabla 8), y no producir suficiente profundidad de cobertura para realizar análisis que requieren una alta cobertura por CpG sitio (por ejemplo, como se describe por Landan et al. 33). Por último, este protocolo (o cualquier protoco basada en bisulfitol) no puede distinguir entre metil-citosina y-hidroximetil citosina 46,47. Sin embargo, los datos generados se pueden integrar con otro protocolo de resultados 48,49 para delinear las diferentes modificaciones, y otras modificaciones de citosina recientemente reportaron 50, en caso de ser de su interés.
Aparecerán bibliotecas de alta calidad, como se muestra en la Figura 3A-C, y una vez combinado para la secuenciación produce una traza como se muestra en la Figura 3G (trazo rojo) que representa contribuciones molares iguales de ambas fracciones de la biblioteca. Insuficiencia preparación de la biblioteca puede resultar de cualquier etapa durante el procedimiento. Si se procesa ADN degradado que se traducirá en las bibliotecas que no están enriquecidas en fragmentos MspI y por lo tanto en la cobertura bajo CpG utilizando los parámetros de secuenciación descritos en este protocolo. Si una enzima no es funcional o inadvertidamente excluidos de una de las reacciones, el protocolo no dió la biblioteca esperado. Si el rea ligaduracción es ineficiente, adaptadores están en una concentración mayor de lo esperado, y / o la concentración de cebadores usado es un reactivo limitante para los pasos de amplificación final, se puede producir el fracaso de la biblioteca. El exceso de adaptadores (visto como picos en ~ 150 pb en los resultados del bioanalizador; Figura 3D-F) en la biblioteca también interferirá con la secuenciación debido al agrupamiento indiscriminado de la biblioteca y el exceso de adaptadores. Mientras que tales una biblioteca puede secuenciar aparentemente normalmente, una porción significativa de la lee será secuencias meramente adaptador. Si se observan exceso de adaptadores en una biblioteca, lo mejor es repetir la preparación de la biblioteca si el material está disponible utilizando material de entrada óptima al adaptador proporciones cuantitativas. Finalmente, para asegurar la amplificación por PCR eficiente de las bibliotecas, las fracciones de la biblioteca inferiores y superiores se mantienen como muestras separadas a lo largo de la conversión de bisulfito y etapas de enriquecimiento de PCR. De no hacerlo, se obtiene la eficacia diferencial de amplificación durante la PCR reacción de fracciones superiores e inferiores (como se ve en la Figura 3G traza azul) y el potencial de representación desigual de la respectiva loci genómico cubierto en cada fracción de la biblioteca durante la secuenciación. El usuario puede optar por incluir un paso de PCR cuantitativa inmediatamente después de la conversión de bisulfito para su posterior titulación de ciclos de PCR óptimos necesarios para amplificar las bibliotecas se generan.
ERRBS protocolo de preparación de biblioteca tiene varios pasos clave en el que se recomiendan reactivos específicos. En la etapa de reparación de extremo, el uso de una mezcla de dNTP de cuatro nucleótidos permite extremo reparación de cualquiera de los productos que no contienen el voladizo CG, tales como las resultantes de MspI actividad estrella enzimática y los fragmentos de ADN cortados presentes en la muestra de ADN original. Esto se traduce en una mejor representación CpG en los resultados. En la etapa de ligación es fundamental para utilizar una ligasa alta concentración (2.000.000 unidades / ml) y los adaptadores metilados para asegurar que el Reacti ligaduraen es eficiente y que la conversión de bisulfito no influye en las secuencias esenciales para la alineación de datos precisa de adaptador. En la etapa de PCR, usando una polimerasa capaz de amplificar fragmentos de ADN ricas en GC tratado con bisulfito es necesario para alta especificidad. Por último, para asegurar la eliminación del exceso de adaptadores y cebadores, purificación SPRI talón (por ejemplo: Agencourt AMPure XP) se recomienda en lugar de ensayos basados en columnas para la ligadura y aislamientos de productos de PCR.
Con el fin de generar datos de alta calidad, es importante para asegurar la conversión de bisulfito eficiente. El control presentado ofrece al usuario la capacidad de determinar la eficiencia de conversión antes de la secuenciación. Como alternativa, un ADN no humanos tales como ADN lambda se puede utilizar como un control interno (pico-in). Debido a las diferencias en las especies, este tipo de control puede incluirse directamente en la secuenciación de aguas abajo (por ejemplo, tal como se utiliza por Yu, et al. 34). Sin embargo, si el punto de I-ins utilizado, no puede ser utilizado para determinar la eficiencia de conversión antes de la secuenciación de la biblioteca amplificada a menos única e independientemente secuenciado antes de la secuenciación biblioteca. Los tipos de conversión determinados se basan en el estado de metilación en sitios no CpG. Esto puede no ser apropiado para el uso en el contexto de alta metilación de citosina en contexto no CpG (por ejemplo células madre embrionarias) y muestras paralelas o otros medios de evaluación de la eficiencia de conversión puede ser utilizado para este propósito.
Hay algunas advertencias a la dirección que son exclusivos de la secuenciación de las bibliotecas ERRBS. Las tres primeras bases de las fracciones de la biblioteca secuenciados son casi uniformemente no aleatoria debido a la sitio de corte reconocimiento MspI (C ^ CGG; véase la Figura 4B, C). Esto resulta en la posibilidad de pérdida de datos importantes debido a la baja calidad lee resultante de una mala localización grupo a pesar de la aparente alta densidad racimo durante la secuenciación. Para superar esta barrera,incluir una biblioteca de alta complejidad en un carril independiente (control PhiX u otro tipo de biblioteca) como un carril de control dedicado. Bibliotecas de alta complejidad tienen extremos que contienen una representación equilibrada de A, C, T y G en los primeros cuatro bases secuenciadas. Carriles de control adecuados incluyen bibliotecas tales como ARN-ss, chip-ss, la secuenciación del genoma, o un control ofrecido por el fabricante de la máquina de secuenciación (por ejemplo v3 control PhiX). Cuando designado como un carril de control para la respectiva ejecución de secuenciación, puede servir como base para la generación de la matriz que se utiliza durante los primeros cuatro bases de secuenciación para detectar posiciones de racimo. La mayor calidad lee capturado elevará la cobertura media por CpG sitio por 5,2 (n = 4). Alternativamente, esta dificultad técnica también se puede superar utilizando un enfoque de secuenciación oscuro como se ha descrito previamente 23. Otros criterios de secuenciación siguen procedimientos operativos estándar por los protocolos del fabricante. Por último, la cobertura por CpG ccalzas para el análisis de datos será guiada por el usuario y, en parte, por las cuestiones biológicas de interés. Umbral de cobertura de 10x proporciona un enfoque de análisis de alta cobertura, sin embargo este umbral se puede bajar debería que ser de interés.
Una discusión completa de análisis de datos ERRBS está más allá del alcance de este artículo, sin embargo, diferencialmente citosinas metiladas y regiones pueden determinarse utilizando herramientas de código abierto 31,51-53. Consideraciones de análisis adicionales y enfoques han sido bien descritos 54,55, y se anima al lector a buscar en la literatura para herramientas más adecuadas para el análisis planificado.
En comparación con otros métodos publicados, ERRBS ofrece un protocolo de cuatro días que, cuando se lleva a cabo ya que los rendimientos descritos altas tasas de reproducibilidad. Se ha validado en comparación con el estándar de oro MassARRAY EpiTYPER 26 años, es rentable para datos de alta cobertura, y es adaptable a diversos materiales de entradacantidades (favorables para el procesamiento de muestras clínicas y otros tipos de células de baja frecuencia) y enfoques de secuenciación. Se ofrece una resolución de pares de bases en loci biológicamente relevante y se puede utilizar en los análisis de integración con otras técnicas de perfilado factor de transcripción de todo el genoma de unión, remodelación de la cromatina, marcas epigenéticas y otras modificaciones de citosina de interés. El uso de datos ERRBS en tales estudios puede contribuir a un enfoque molecular amplia y permitir para alta análisis dimensionales en el estudio de modelos biológicos y enfermedades humanas.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |