Nous décrivons ici le protocole et la mise en œuvre du méthyl-Seq, une plate-forme épigénomique, utilisant un modèle de rat pour identifier les changements épigénétiques liés à l’exposition de stress chronique. Les résultats démontrent que la plate-forme de méthyl-Seq de rat est capable de détecter des différences de méthylation que résultent d’une exposition de stress chez les rats.
Que les génomes d’une plus grande variété d’animaux seront disponibles, il y a un besoin croissant d’outils qui permet de capturer les changements épigénétiques dynamiques dans ces modèles animaux. Le rat est un animal modèle particulier où un outil épigénétique peut compléter les nombreuses études pharmacologiques et comportementales pour fournir des informations perspicaces mécanistes. À cette fin, nous avons adapté le système de Capture SureSelect cible (dénommé méthyl-Seq) chez le rat, qui peut évaluer le taux de méthylation d’ADN au sein du génome du rat. La conception de rat ciblés promoteurs, îles de CpG, rives de l’île et les régions riches en GC de tous les gènes RefSeq.
Pour appliquer le programme sur une expérience de rat, rats Sprague Dawley mâles ont été exposés à un stress chronique variable pendant 3 semaines, après quoi les échantillons de sang ont été prélevés pour l’extraction d’ADN génomique. Méthyl-Seq bibliothèques ont été construits des échantillons d’ADN de rat par cisaillement, ligation de l’adaptateur, enrichissement de la cible, conversion de bisulfite et multiplexage. Bibliothèques ont été séquencés sur une plate-forme de séquençage de prochaine génération et les lectures séquencés ont été analysées afin d’identifier les DMR entre les ADN des rats stressés et non stressés. Meilleur candidat DMR ont été validés indépendamment par pyrosequencing bisulfite pour confirmer la robustesse de la plate-forme.
Les résultats démontrent que la plate-forme de méthyl-Seq de rat est un outil utile et épigénétique qui permet de capturer les changements de méthylation induites par l’exposition au stress.
Avancées du séquençage haut-débit ont conduit à une profusion de séquences génomiques pour modèle et organismes non-modèles. La disponibilité de telles séquences a facilité les recherches en génétique, génomique comparative et transcriptomique. Par exemple, les séquences génomiques disponibles sont très utiles pour aligner les données de séquençage de ChIP-Seq expériences qui enrichissent l’ADN issu de sa liaison avec l’histone modifications1ou séquençage de bisulfite, qui mesure la méthylation de l’ADN par détecter l’uracile formé de conversion de bisulfite de cytosines non méthylé2. Toutefois, on a des retards dans la mise en œuvre de plates-formes épigénomique qui incorporent des données de séquençage génomique disponible dans leur conception en raison d’un manque de données annotées des séquences régulatrices spécifiques qui peuvent influencer la fonction du gène.
En particulier, méthylation de l’ADN est l’un des plus largement étudiées modifications épigénétiques sur l’ADN qui peuvent tirer parti des données génomiques disponibles pour la construction d’une plate-forme de méthylomiques. Un tel exemple est une plateforme basée sur la baie pour l’humain méthylome3, qui a été largement utilisé dans les différentes disciplines de l’oncologie de psychiatrie4,5. Malheureusement, les plates-formes similaires pour des modèles animaux non-humains sont rares, qu’il n’y a pratiquement aucune plateforme largement utilisé qui ont profité de la séquence génomique dans leur conception initiale.
Une méthode commune pour évaluer le paysage méthylomiques de modèles animaux non-humains est bisulfite de représentation réduite séquençage (Orr)6. Cette approche permet de surmonter le coût du séquençage du génome entier bisulfite qui, tout en offrant un paysage complet méthylomiques, offre une couverture de lecture-profondeur inférieure en raison de coût et des informations fonctionnelles limitées dans de vastes zones pauvres en gène du génome2 . Obligations à rendement réel implique Sommaire de restriction et de sélection de taille de l’ADN génomique d’enrichir à fortement les séquences riches en GC comme les îles de CpG qui sont communément trouvés près de promoteurs de gènes et joueraient un rôle dans le règlement de gène7. Alors que la méthode Orr a été utilisée dans un certain nombre d’études importantes, sa dépendance sur les enzymes de restriction n’est pas sans limites et défis remarquables. Par exemple, enrichissement des séquences riches en GC dans Orr est entièrement dépendante de la présence de séquences spécifiques reconnus par les enzymes de restriction et sélection taille ultérieure par électrophorèse. Cela signifie que n’importe quel régions génomiques qui ne contiennent pas ces sites de restriction sont exclues lors de la sélection de la taille. En outre, hétérospécifique comparaisons sont difficiles à moins que les mêmes sites de restriction sont présents dans les mêmes locus parmi les différentes espèces.
Une des façons de surmonter les limitations de ces obligations sont d’utiliser une méthode d’enrichissement qui tire profit de la séquence génomique publiée dans la conception de la plate-forme. La plate-forme humaine basée sur la baie utilise des sondes d’apprêt conçus contre GPC spécifique d’allèle spécifique (CG vs TG après conversion du bisulfite) cible recuit et amorce l’extension. Sa conception reflète non seulement la séquence génomique humaine disponible, mais des régions régulatrices vérifiée expérimentalement acquises de multiples champs d’enquête, comme ENCODE et ENSEMBL8. Malgré sa large utilisation dans les enquêtes de méthylomiques humaine, une plate-forme similaire n’existe pas pour les animaux de modèle. En outre, le format tableau met une contrainte importante sur la surface disponible pour positionner la sonde. Dans les dernières années, des efforts ont été faits pour combiner la cible-spécificité offerte par capture sonde design et la fonctionnalité de haut débit de nouvelle génération séquençage. Une telle entreprise a entraîné le système enrichissement cible basée sur le séquençage du génome de la souris (souris méthyl-Seq), qui servait à identifier les différences de cerveau-spécifique ou induite par les glucocorticoïdes de méthylation9,10. Plates-formes similaires pour d’autres modèle et non-modèle animaux sont nécessaires pour faciliter la recherche épigénomique chez ces animaux.
Ici, nous démontrons la mise en œuvre de cette plateforme novatrice pour analyser les méthylomiques sur le rat. Le rat a servi comme modèle animal important en pharmacologie, le métabolisme, neuroendocrinologie et comportement. Par exemple, il y a un besoin croissant de comprendre les mécanismes sous-jacents qui donnent lieu à la toxicité des médicaments, l’obésité, réponse au stress ou la toxicomanie. Une plate-forme haut débit capable de capturer les changements de méthylomiques liés à ces conditions augmenterait notre compréhension des mécanismes. Le génome du rat est toujours sans annotation pour les régions régulatrices, nous constituée de promoteurs non redondant, îles de CpG, île rives11et précédemment identifié les séquences riches en GC dans le rat méthyl-Seq plate-forme12.
Afin d’évaluer la conception et mise en oeuvre de la plate-forme SureSelect cible enrichissement (génériquement appelés méthyl-Seq) pour le génome du rat, nous avons utilisé un modèle de rat de stress chronique de variables (CV)13 à identifier différentiellement méthylés régions entre animaux non accentués et stressés. Notre conception de la plate-forme, protocole et mise en œuvre peuvent être utiles pour les chercheurs qui veulent mener une enquête complète et impartiale d’épigénétique sur un organisme dont la séquence génomique est déjà disponible, mais reste mal annoté.
Dans cette étude, nous avons conçu et mis en œuvre de la plate-forme de méthyl-Seq pour le génome du rat. En faisant preuve de son utilité avec un modèle de rat du stress, nous avons démontré que le pipeline expérimental et analytique peut fournir des régions différentiellement méthylées entre deux groupes de comparaison.
Afin d’assurer une mise en œuvre de la plate-forme, plusieurs étapes critiques doivent être respectés. Première qualité de l’ADN et la quantité a un impact significatif sur la qualité et la quantité de la bibliothèque de méthyl-Seq finale. Nous avons utilisé un fluorimètre, plutôt que d’un spectrophotomètre, pour s’assurer que nos mesures d’ADN reflète la quantité d’ADN double brin. Le bioanalyzer a été utilisé pour mesurer la taille moléculaire et la quantité d’ADN après la tonte et après ligature de l’adaptateur. Vérifier la taille de la molécule « décalage » entre ces étapes est essentielle confirmer la présence des adaptateurs aux extrémités de chaque fragment d’ADN qui fera l’objet d’adaptateur-mediated PCR dans les étapes ultérieures. La quantité d’ADN à la fin de l’étape de la ligature d’adaptateur est également importante, depuis au moins 100 ng du produit bibliothèque est nécessaire à cette étape afin d’assurer une quantité suffisante est disponible après les étapes de conversion enrichissement et bisulfite de cible. Une mesure de haute sensibilité finale a été réalisée sur la bibliothèque de méthyl-Seq construite afin que la bibliothèque peut être correctement diluée pour le clustering ultérieures sur le séquenceur de prochaine génération. Enfin, bisulfite pyrosequencing travaillait comme une méthode très quantitative, indépendante pour évaluer la précision du pipeline analytique. La validation finale avec les échantillons et réplication à l’aide d’animaux supplémentaires d’origine sont des étapes cruciales pour assurer que l’expérience peut détecter des changements biologiquement significatifs dans la méthylation de l’ADN.
Nous incluons également plusieurs lignes directrices en cas d’écart par rapport au protocole ou si des problèmes sont rencontrés. Tout d’abord, il est possible de perdre trop d’ADN au cours de la fin-réparation, ligature de l’adaptateur ou étapes de purification des billes magnétiques. Par ailleurs, à partir des quantités d’ADN pourrait être petit (< 200 ng) en raison de la disponibilité limitée des tissus/ADN ou mise en œuvre des différentes méthodes d’enrichissement telles que le tri des cellules fluorescence activé. Augmentant le nombre de cycles au cours des étapes de l’amplification de deux bibliothèques peut être en mesure de compenser la perte excessive de l’ADN ou faible à partir de quantité d’ADN dans tout le protocole de construction de bibliothèque. Cependant, pas plus qu’un autre cycles 2 et 3 sont recommandés, comme l’amplification excessive modèle est susceptible d’entraîner une augmentation du nombre de lectures en double en cours de séquençage. Ces doublons sont exclus pendant l’étape de l’alignement afin d’éviter les biais dans le calcul du pourcentage de méthylation. Deuxièmement, si la taille moyenne des ADN n’augmente pas de plus de 30 points de base, vérifiez que les réactifs sont nouvelles, comme T4 ADN polymérase, Klenow et/ou T4 ligase peut être vieux. Réactifs de rechange disponibles dans le commerce peuvent être utilisés.
En outre, il est possible que le DMR prévue ne pourrait pas valider par pyrosequencing, où les différences de méthylation de l’ADN n’existent pas ou sont sensiblement inférieures à celles prédites par analyse. Validation pauvre des régions de candidat est un problème trop commun pour nombre d’analyses Génome-large, par exemple quand pyrosequencing résultats ne confirment pas la méthylation différentielle ou l’ampleur de l’effet est beaucoup plus petite que celle prédite par l’analyse. BSmooth est un paquet analytique qui « lisse » les niveaux de la méthylation dans une fenêtre des GPC multiples. Pour l’expérience en cours, BSmooth mis en cause un DMR dont les niveaux de méthylation ont été validés par le bisulfite pyrosequencing. Cependant, il y aura probablement des différences entre les niveaux de méthylation prévues par BSmooth et celles vérifiées par pyrosequencing. Les écarts résultent de la fonction de lissage qui permet d’estimer les valeurs moyennes de la méthylation dans l’ensemble de la GPC dans un DMR, y compris consécutifs GPC qui peut-être différer dans la méthylation de l’ADN de plus de 50 % ou GPC dont les valeurs de méthylation ont été exclus due à sous seuil lire la profondeur. R-paquets comme MethylKit24 peuvent servir à identifier les petites fenêtres de GPC ou même unique GPC qui le taux de méthylation corréler fortement avec ceux validés par pyrosequencing. Mise en œuvre de différents forfaits et tester leurs régions prévues ou GPC de méthylation différentielle par pyrosequencing assurera la solidité des données. Alternativement, bibliothèques de méthyl-Seq originales peuvent être reséquencées et ajoute les fichiers lus pour augmenter la profondeur. Étant donné que la détermination des niveaux de méthylation sont semi-quantitatifs et dicté par le nombre de lectures [(# of CpGs) / (nombre de TpGs + GPC)], augmentant la profondeur pour un CpG donnée augmentera la précision de sa valeur de pourcentage de méthylation. Dans cette étude, nous avons ne considéré que GPC dont les valeurs de méthylation ont été déterminées par au moins dix lectures et atteint une couverture globale de lecture de 19 x pour chaque CpG.
La plate-forme de méthyl-Seq de rat n’est pas sans ses limites. Bien qu’il soit plus rentable que le séquençage du génome entier bisulfite, c’est beaucoup plus cher que les autres méthodes. Néanmoins, la plupart des coûts a été pour l’achat de voies sur le séquenceur et non pour le système de capture. Selon la profondeur nécessaire, avec des comparaisons de croix-tissus nécessitant moins en raison de différences de grande (25 à 70 %)12 dans la méthylation de l’ADN, le coût peut être réduit par multiplexage plus d’échantillons par voie de circulation et à l’aide d’une plateforme de plus grande capacité. En outre, la préparation de l’échantillon est plus de temps que d’autres méthodes. Bien que similaire aux autres approches pulldown qui incorporent le séquençage de nouvelle génération, les étapes de purification et de conversion de bisulfite supplémentaire ajoutent à la charge de travail. Dans l’ensemble, la plate-forme de méthyl-Seq est une alternative rentable au séquençage du génome entier et offre une résolution paires de bases à plus de 2,3 millions de GPC, qui est beaucoup plus que ceux analysés par microarray-plateformes. À ce jour, l’homme disponibles sur le marché et la souris, méthyl-Seq plates-formes ont été utilisés pour documenter les changements d’alcooliques dans le macaque cerveau25,26, sur le développement neurologique des gènes dans le cerveau de souris9et hémato-encéphalique cibles de glucocorticoïdes10. En outre, la possibilité de cibler des régions spécifiques, indépendamment de la reconnaissance de séquences par des enzymes de restriction rend une plate-forme idéale pour les comparaisons entre les espèces. Pour cette étude, nous avons conçu la plate-forme méthyl-Seq pour le rat, pour laquelle de nombreuses expériences pharmacologiques, métaboliques et comportementales sont effectuées sans le bénéfice d’un outil de Génome-large méthylomiques. Nos résultats montrent qu’il peut être utilisé pour détecter les DMR dans un modèle de rat de stress et autres paramètres physiologiques tels que Global plasmatique CORT en corrélation.
La plateforme de méthyl-Seq est idéale pour des expériences épigénétiques chez les animaux avec des génomes séquencés qui ne disposent pas de suffisamment de preuves expérimental documentant les régions régulatrices. Lorsque ces régions sont mises à disposition, des régions supplémentaires peuvent être personnalisés et attachées à la version actuelle. En outre, la plateforme est idéale pour la génomique comparative, étant donné que l’enrichissement de la cible n’est pas limité par la reconnaissance de l’enzyme de restriction. Par exemple, la région du promoteur d’un gène d’intérêt peut être capturée indépendamment de savoir si elle abrite un site de restriction spécifique. De même, les régions régulatrices, comme celles de la souris ou des humains, qui sont conservées dans le génome d’intérêt peuvent être capturées.
The authors have nothing to disclose.
Cette étude a été financée par les NIH grant MH101392 (RSL) et de soutien des prix et fondations suivantes : un NARSAD Young Investigator Award, Margaret Ann prix enquêteur, le James Wah Mood Disorders érudit fonds via le Charles T. Bauer Foundation, Baker Foundation et la projet Match Foundation (RSL).
Radioimmuno assay (RIA) | MP Biomedicals | 7120126 | Corticosterone, 125I labeled |
Master Pure DNA Purification Kit | Epicentre/Illumina | MC85200 | |
Thermal-LOK 2-Position Dry Heat Bath | USA Scientific | 2510-1102 | Used with 1.5 mL tubes |
Vortex Genie 2 | Fisher | 12-812 | Vortex Mixer |
Ethyl alcohol, Pure | Sigma-Aldrich | E7023 | 100% Ethanol, molecular grade |
Centrifuge 5424 R | Eppendorf | – | Must be capable of 20000 x g |
Qubit 2.0 | ThermoFisher Scientific | Q32866 | Fluorometer |
Qubit dsDNA BR Assay Kit | ThermoFisher Scientific | Q32850 | |
Qubit dsDNA HS Assay Kit | ThermoFisher Scientific | Q32851 | High sensitivity DNA detection reagents |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
SureSelectXT Rat Methyl-Seq Reagent Kit | Agilent Technologies | G9651A | Reagents for preparing the Methyl-Seq library |
SureSelect Rat Methyl-Seq Capture Library | Agilent Technologies | 931143 | RNA baits for enrichment of rat targets |
IDTE, pH 8.0 | IDT DNA | 11-05-01-09 | 10 mM TE, 0.1 mM EDTA |
DNA LoBind Tube 1.5 mL | Eppendorf | 22431021 | |
Covaris E-series or S-series | Covaris | – | Isothermal sonicator |
microTUBE AFA Fiber Pre-Slit Snap-Cap 6x16mm (25) | Covaris | 520045 | |
Water, Ultra Pure (Molecular Biology Grade) | Quality Biological | 351-029-721 | |
Veriti 96 Well-Thermal Cycler | Applied Biosystems | 4375786 | |
AMPure XP Beads | Beckman Coulter | A63880 | DNA-Binding magnetic beads |
96S Super Magnet | ALPAQUA | A001322 | Magnetic plate for purification steps |
2200 TapeStation | Agilent Technologies | G2965AA | Electrophresis-based bioanalyzer |
D1000 ScreenTape | Agilent Technologies | 5067-5582 | |
D1000 ScreenTape High Sensitivity | Agilent Technologies | 5067-5584 | |
D1000 Reagents | Agilent Technologies | 5067-5583 | |
D1000 Reagents High Sensitivity | Agilent Technologies | 5067-5585 | |
DNA110 SpeedVac | ThermoFisher Scientific | – | Vacuum Concentrator |
Dynabeads MyOne Streptavidin T1 magnetic beads | Invitrogen | 65601 | Streptavidin magnetic beads |
Labquake Tube Rotator | ThermoFisher Scientific | 415110Q | Nutator Mixer is also acceptable |
EZ DNA Methylation-Gold Kit | Zymo Research | D5006 | Bisulfite conversion kit. Contains Binding, Wash, Desulphonation, and Elution buffers |
Illumina Hi-Seq 2500 | Illumina | – | Next-generation sequencing machine |
PCR and Pyrosequencing Primers | IDT DNA | Variable | |
Taq DNA Polymerase with ThermoPol Buffer – 2,000 units | New England BioLabs | M0267L | |
Deoxynucleotide (dNTP) Solution Set | New England BioLabs | N0446S | |
Pyromark MD96 | QIAGEN | – | Pyrosequencing machine |
Ethyl Alcohol 200 Proof | Pharmco-Aaper | 111000200 | 70% Ethanol solution |
Sodium Hydroxide Pellets | Sigma-Aldrich | 221465 | 0.2 M NaOH denature buffer solution |
Tris (Base) from J.T. Baker | Fisher Scientific | 02-004-508 | 10 mM Tris Acetate Buffer wash buffer solution |
PyroMark Gold Q96 Reagents (50×96) | QIAGEN | 972807 | Reagents required for pyrosequencing |
PyroMark Annealing Buffer | QIAGEN | 979009 | |
PyroMark Binding Buffer (200 ml) | QIAGEN | 979006 | |
Streptavidin Sepharose High Performance Beads | GE Healthcare | 17-5113-01 | Streptavidin-coated sepharose beads |
PyroMark Q96 HS Plate | QIAGEN | 979101 | Pyrosequencing assay plate |
Eppendorf Thermomixer R | Fisher Scientific | 05-400-205 | Plate mixer. 96-well block sold separately (cat. No 05-400-207) |
SureDesign Website | Agilent Technologies | – | Target capture design software (https://earray.chem.agilent.com/suredesign/) |
UCSC Genome Browser | University of California Santa Cruz | – | rat Nov 2004 rn4 assembly |
Agilent Methyl-Seq Protocol | Agilent Technologies | – | https://www.agilent.com/cs/library/usermanuals/public/G7530-90002.pdf |