Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
Padrão de metilação do ADN de mapeamento é fortemente estudada em tecidos normais e doentes. Uma variedade de métodos tem sido estabelecido para interrogar os padrões de metilação da citosina em células. Representação reduzida do genoma bissulfito sequenciamento completo foi desenvolvido para detectar padrões de pares de bases resolução metilação da citosina quantitativos em loci genômico rico em GC. Isto é conseguido através da combinação da utilização de uma enzima de restrição seguida por conversão de bissulfito. Reforçada reduzida Representação Bissulfito Sequencing (ERRBS) aumenta os loci genómico biologicamente relevante coberto e foi usado ao perfil metilação da citosina no ADN de humano, rato e outros organismos. ERRBS inicia com enzimas de restrição para gerar fragmentos de ADN de baixo peso molecular para utilização na preparação da biblioteca. Estes fragmentos são submetidos a construção da biblioteca de padrão para a próxima geração de sequenciação. Conversão Bisulfite de citosinas não metiladas anteriores da amplificati definitivana etapa permite a resolução de base quantitativa dos níveis de metilação de citosina em loci genômica coberto. O protocolo pode ser concluído no prazo de quatro dias. Apesar de baixa complexidade nas três primeiras bases sequenciadas, bibliotecas ERRBS produzir dados de alta qualidade ao usar uma pista controle seqüencial designado. Mapeamento e análise bioinformática é então realizada e produz dados que podem ser facilmente integrado com uma variedade de plataformas de todo o genoma. ERRBS podem utilizar pequenas quantidades de material de entrada tornando viável para processar amostras clínicas humanas e aplicável em uma variedade de aplicações de pesquisa. O vídeo produzido demonstra etapas críticas do protocolo ERRBS.
A metilação do DNA em citosina (5-metilcitosina) é uma marca epigenética crítico em células de mamífero para uma variedade de processos biológicos, incluindo, mas não se limitando a impressão, inactivação do cromossoma X, desenvolvimento, e da regulação da expressão do gene 1-8. O estudo dos padrões de metilação do DNA em distúrbios malignos e outros determinou padrões específicos de doenças e contribuiu para o entendimento da patogênese da doença e potenciais descobertas biomarcadores 17/09. Há muitos protocolos que interrogam o epigenoma para estado de metilação do DNA. Estes podem ser divididos em baseada em afinidade, à base de enzima de restrição e ensaios baseados em bissulfito de conversão que utilizam plataformas de microarray de sequenciação ou a jusante. Além disso, existem alguns protocolos que colmatar estas categorias gerais, incluindo, mas não limitado a, combinado análise de restrição Bisulfite 18 e Redução Representação Bisulfite Sequencing (RRBS 19). </p>
RRBS foi originalmente descrito por Meissner et al. 19,20. O protocolo introduzido um passo para enriquecer regiões genómicas rico em GC, seguida de sequenciação bissulfito, o que resultou em dados quantitativos de resolução de base de par que é de custo eficaz 21,22. As regiões ricas em GC são alvo da enzima de restrição MspI (C ^ CGG), e metilação da citosina é resolvido por conversão bissulfito de citosinas (desaminação de citosinas não modificados para uracilo), seguido de reacção em cadeia da polimerase (PCR). RRBS coberto a maioria dos promotores de genes e ilhas de CpG em uma fracção da sequência necessária para um genoma inteiro; no entanto RRBS tinha cobertura limitada de margens CPG e outras regiões intergênicas de relevância biológica. Vários grupos publicaram atualizado protocolos RRBS desde o relatório original que melhorar a metodologia e cobertura resultante dessas regiões genômicas 23-25. Reforçada Representação Redução Bisulfite sequmentavam (ERRBS) inclui modificações de preparação da biblioteca e um alinhamento de dados alternativo de aproximação 26 quando comparado com RRBS. ERRBS resultou em um maior número de CpGs representadas nos dados gerados e aumento da cobertura de todas as regiões genômicas interrogados 26. Este método tem sido utilizado para resolver padrões de metilação de ADN em paciente humanos e outros espécimes animais 26-30.
O protocolo descrito ERRBS ofertas detalhes sobre todos os passos necessários para a realização e os dados foram gerados utilizando ADN humano representativo (amostras foram obtidas a partir previamente relatados, identificada de 31 amostras de pacientes, e uma amostra de medula óssea CD34 + de um dador humano normal). O protocolo inclui um processo automatizado de selecção do tamanho, o que reduz o tempo de processamento por amostra e permite uma maior precisão na selecção do tamanho da biblioteca. O protocolo combina uma série de técnicas de biologia molecular estabelecidas. ADN de elevado peso molecular é digerido wom uma enzima de restrição metilação-insensitive (MspI), seguido pelo final do reparo, A-tailing, e ligadura de adaptadores metilados. Selecção do tamanho dos fragmentos rico em GC é seguido por conversão bissulfito e a amplificação por PCR antes da sequenciação. Conversão Bisulfite tem sido descrito anteriormente 32 e revisão detalhada de análise e aplicações de dados está além do escopo deste artigo, no entanto recomendações e referências são incluídos para uso dos leitores. O protocolo pode ser realizada ao longo de quatro dias, e é passível de pequena entrada (50 ng ou menos) quantidades de material. O protocolo como descrito produz dados com elevada cobertura por sítio CpG suficiente não só para a região do sítio de metilação e determinações diferenciais, mas também para a detecção de polimorfismo epigenética como descrito por Landan, et ai. 33.
Os dados de resolução rendimentos de pares de bases de protocolo apresentada de metilação da citosina em regiões genômicas de interesse biológico. O protocolo como escrito é optimizada para 50 ng de material de partida, no entanto, ele pode ser adaptado para tratar uma variedade de material de entrada (5 ng ou mais) 26. Isto irá necessitar de ajustes de algumas das etapas do protocolo como pode ser visto na Tabela 6. As bibliotecas são passíveis de ERRBS emparelhado sequenciação extremidade e uma cobertura adicional genómico também pode ser conseguida por sequenciação lê mais do que 51 ciclos. Seqüenciamento multiplexado vai oferecer um protocolo de menor custo por amostra, no entanto, isso vai resultar em uma cobertura reduzida por site CpG representado nos dados (Figura 5 e Tabela 8), e não vai render profundidade suficiente de cobertura para realizar análises que requerem alta cobertura por sítio CpG (por exemplo, como descrito por Landan et ai. 33). Finalmente, este protocolo (ou qualquer Protoco à base de bissulfitol) não pode distinguir entre metil-citosina e de citosina hidroximetil-46,47. No entanto, os dados gerados podem ser integrados com outro protocolo resulta 48,49 para delinear as diferentes modificações, e outras modificações citosina recentemente relatado 50, eles devem ser de interesse.
Bibliotecas de alta qualidade irá aparecer como mostrado na Figura 3A-C, e uma vez reunidas para sequenciação origina um traço tal como mostrado na Figura 3G (traço vermelho) representando contribuições molares iguais de ambas as fracções da biblioteca. Falha preparação da biblioteca pode resultar de qualquer passo durante o processo. Se DNA degradado é processada que irá resultar em bibliotecas que não são enriquecidas em fragmentos MspI e, portanto, em baixa cobertura CpG utilizando os parâmetros de sequenciamento descritos neste protocolo. Se uma enzima é não-funcional ou excluídas inadvertidamente uma das reacções, o protocolo não irá produzir a biblioteca esperado. Se a rea ligaduracção é ineficiente, adaptadores estão em uma concentração mais elevada do que o esperado, e / ou a concentração de iniciadores utilizado é um reagente limitante para as etapas finais de amplificação, pode ocorrer falha na biblioteca. Adaptadores excesso (visto como um picos em ~ 150 pb em resultados Bioanalyzer; Figura 3D-F) na biblioteca também irá interferir com a sequenciação devido à aglomeração indiscriminada tanto da biblioteca e adaptadores em excesso. Embora uma tal biblioteca pode sequenciar aparentemente normalmente, uma porção significativa da lê será meramente sequências adaptadoras. Se os adaptadores em excesso são observados em uma biblioteca, o melhor é repetir a preparação biblioteca se o material está disponível usando material de entrada ideal para o adaptador relações de quantidades. Finalmente, para assegurar a eficiência de amplificação por PCR das bibliotecas, as fracções da biblioteca mais baixas e mais altas são mantidas como amostras separadas em toda a conversão de bissulfito e passos de enriquecimento de PCR. Não fazer isso gera eficiência diferencial de amplificação durante a PCR reacção das fracções superiores e inferiores (como visto na Figura 3G azul traço) e o potencial para a representação desigual do respectivo locus genómico coberto em cada fracção da biblioteca durante a sequenciação. O utilizador pode optar por incluir um passo de PCR quantitativo imediatamente após a conversão para além de bissulfito de titulação de ciclos de PCR ideais necessárias para amplificar as bibliotecas sendo gerado.
ERRBS protocolo de preparação biblioteca tem vários passos-chave em que são recomendados reagentes específicos. No passo final de reparação, o uso de uma mistura de dNTP quatro nucleótidos permite a fim de reparação de quaisquer produtos que não contenham a saliência CG, tais como os resultantes de MspI actividade enzimática estrela e fragmentos de ADN cortados presentes na amostra original do ADN. Isto resulta numa melhoria representação de CpG nos resultados. No passo de ligação é crítica a utilização de uma ligase de alta concentração (2.000.000 unidades / ml) e adaptadores metilados para assegurar que a ligadura Reactiem é eficiente e que a conversão de bissulfito não influencia as sequências essenciais para o alinhamento preciso do adaptador de dados. No passo de PCR, usando uma polimerase capazes de amplificar fragmentos de DNA rico em GC tratados com bissulfito é necessária para uma elevada especificidade. Finalmente, para garantir a eliminação dos adaptadores em excesso e os iniciadores, SPRI purificação talão (por exemplo: Agencourt AMPure XP) é recomendado em vez de ensaios baseados em colunas de ligação e os isolamentos de produtos de PCR.
A fim de gerar dados de alta qualidade, é importante para garantir a conversão eficiente bissulfito. O controle apresentou oferece ao usuário a capacidade de determinar a eficiência da conversão antes da sequenciação. Como uma alternativa, um ADN não-humana, tais como DNA de lambda pode ser usado como um controlo interno (espeta-in). Devido às diferenças de espécies, este tipo de controlo pode ser directamente incluído na sequenciação a jusante (por exemplo, tal como utilizado por Yu, et ai. 34). No entanto, se o pico de i-ins utilizados, que não pode ser usado para determinar a eficiência de conversão antes da sequenciação, a menos biblioteca amplificada exclusivamente e sequenciado antes da sequenciação biblioteca de forma independente. As taxas de conversão são determinadas com base no estado de metilação em locais que não de CpG. Isto pode não ser adequado para utilização no contexto de alta metilação da citosina no contexto não CpG (por exemplo, células estaminais embrionárias) e amostras paralelas ou qualquer outro meio de avaliar a eficiência de conversão pode ser utilizado para este fim.
Há algumas ressalvas para o endereço que são exclusivos para o seqüenciamento de bibliotecas ERRBS. As primeiras três bases das fracções da biblioteca sequenciados são quase uniformemente não aleatória devido ao local de reconhecimento do MspI corte (C ^ CGG; ver Figura 4B, C). Isso resulta na possibilidade de perda de dados significativa devido à baixa qualidade lê resultantes de uma má localização do cluster apesar de aparente alta densidade de agrupamento durante o seqüenciamento. Para superar essa barreira,incluir uma biblioteca de alta complexidade em uma pista independente (controle phix ou outro tipo de biblioteca) como uma pista de controle dedicado. Bibliotecas alta complexidade têm extremidades contendo uma representação equilibrada de A, C, T e G nas quatro primeiras bases sequenciadas. Faixas de controlo adequados incluem bibliotecas como RNA-seq, ChIP-seq, seqüenciamento do genoma inteiro, ou um controle oferecido pelo fabricante de máquinas de seqüenciamento (eg v3 Controle phix). Quando designado como uma pista de controlo para o respectivo prazo de sequenciação, que pode servir como base para a geração de matriz que é utilizado durante as primeiras quatro bases da sequenciação para detectar posições de fragmentação. A maior qualidade lê capturado elevará a cobertura média por local CpG em 5,2 (n = 4). Alternativamente, esta dificuldade técnica, também podem ser ultrapassadas pela utilização de uma abordagem de sequenciação escuro como previamente descrito 23. Outros critérios de sequenciamento seguir os procedimentos operacionais padrão por protocolos do fabricante. Finalmente, a cobertura por CpG chosen para análise de dados será guiado pelo usuário e, em parte, pelas questões biológicas de interesse. Limite de cobertura de 10x oferece uma abordagem de análise de alta cobertura, no entanto, este limite pode ser reduzido que deveria ser de interesse.
Uma discussão completa de análise de dados ERRBS está além do escopo deste artigo, no entanto, diferencialmente cytosines e regiões metilados pode ser determinada utilizando ferramentas de código aberto 31,51-53. Análise considerações adicionais e abordagens têm sido bem descrita 54,55, eo leitor é encorajado a procurar a literatura para instrumentos mais adequados para a análise planejada.
Comparado a outros métodos publicados, ERRBS oferece um protocolo de quatro dias, que quando realizada como rendimentos descritas altas taxas de reprodutibilidade. Ele foi validado em comparação com o padrão ouro MassARRAY EpiTYPER 26, é para dados de alta cobertura de baixo custo, e é adaptável para diversos materiais de entradaquantidades (favoráveis para processamento de amostras clínicas e outros tipos de células de baixa frequência) e as abordagens de sequenciamento. Ele oferece resolução de pares de bases em loci biologicamente relevante e pode ser usado em integrativa analisa com outras técnicas de perfil fator de todo o genoma de transcrição, a remodelação da cromatina, marcas epigenéticas e outras modificações citosina de interesse. Uso de dados ERRBS em tais estudos podem contribuir para uma abordagem molecular abrangente e permitir alta analisa dimensional no estudo de modelos biológicos e doenças humanas.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |