La présente étude décrit le flux de travail pour gérer les données de méthylation de l’ADN obtenues par les technologies de microréseaux. Le protocole illustre les étapes allant de la préparation de l’échantillon à l’analyse des données. Toutes les procédures sont décrites en détail et la vidéo montre les étapes importantes.
L’obésité est directement liée au mode de vie et a été associée à des changements de méthylation de l’ADN qui peuvent entraîner des altérations de l’adipogenèse et des processus de stockage des lipides contribuant au développement de la maladie. Nous démontrons un protocole complet allant de la sélection à l’analyse des données épigénétiques des patients avec et sans obésité. Toutes les étapes du protocole ont été testées et validées dans le cadre d’une étude pilote. 32 femmes ont participé à l’étude, dans laquelle 15 personnes ont été classées avec obésité selon l’indice de masse corporelle (IMC) (45,1 ± 5,4 kg / m2); et 17 personnes ont été classées sans obésité selon l’IMC (22,6 ± 1,8 kg/m2). Dans le groupe obèse, 564 sites CpG liés à la masse grasse ont été identifiés par une analyse de régression linéaire. Les sites cpg se trouvaient dans les régions promotrices. L’analyse différentielle a révélé 470 CpG hypométhylés et 94 sites hyperméthylés chez les personnes obèses. Les voies enrichies les plus hypométhylées étaient dans le RUNX, la signalisation WNT et la réponse à l’hypoxie. Les voies hyperméthylées étaient liées à la sécrétion d’insuline, à la signalisation du glucagon et au Ca2+. Nous concluons que le protocole a efficacement identifié les modèles de méthylation de l’ADN et la méthylation de l’ADN liée aux traits. Ces modèles pourraient être associés à une altération de l’expression des gènes, affectant l’adipogenèse et le stockage des lipides. Nos résultats ont confirmé qu’un mode de vie obésogène pourrait favoriser des changements épigénétiques dans l’ADN humain.
Les technologies omiques à grande échelle sont de plus en plus utilisées dans les études sur les maladies chroniques. Une caractéristique intéressante de ces méthodes est la disponibilité d’une grande quantité de données générées pour la communauté scientifique. Par conséquent, une demande de normalisation des protocoles est apparue pour permettre une comparaison technique entre les études. La présente étude suggère la normalisation d’un protocole pour obtenir et analyser des données de méthylation de l’ADN, en utilisant une étude pilote comme exemple appliqué.
La dépense énergétique négative prédomine dans les modes de vie humains modernes, conduisant à une accumulation excessive de tissu adipeux et, par conséquent, au développement de l’obésité¹. De nombreux facteurs ont augmenté les taux d’obésité, tels que le sédentarisme, les régimes riches en calories et les routines stressantes. L’Organisation mondiale de la santé (OMS) a estimé que 1,9 milliard d’adultes étaient obèses en 2016, ce qui signifie que plus de 20% de la population mondiale a un IMC de plus de 30 kg/m22. La mise à jour la plus récente de 2018 a révélé que la prévalence de l’obésité aux États-Unis d’Amérique (USA) était supérieure à 42 %3.
L’épigénétique est l’adaptation structurelle des régions chromosomiques pour enregistrer, signaler ou perpétuer des états d’activité altérés4. La méthylation de l’ADN est une altération chimique réversible dans les sites de dinucléotides cytosine-guanosine (sites CpG), formant la 5-méthylcytosine-pG (5mCpG). Il peut moduler l’expression des gènes en régulant l’accès de la machinerie de transcription à l’ADN5,6,7,8. Dans ce contexte, il est essentiel de comprendre quels sites cpG sont associés à des traits liés à l’obésité9. De nombreux facteurs peuvent soutenir ou empêcher la méthylation de l’ADN spécifique au site. Les enzymes nécessaires à ce processus, telles que les méthyltransférases d’ADN10 (DNTM) et les dix-onze translocations (TET), peuvent favoriser la méthylation ou la déméthylation de l’ADN lors d’expositions environnementales11.
Compte tenu de l’intérêt croissant pour les études sur la méthylation de l’ADN au cours des dernières années, le choix de la stratégie d’analyse la plus appropriée pour répondre précisément à chaque question a été une préoccupation essentielle des chercheurs12,13,14. Le réseau de méthylation de l’ADN 450K est la méthode la plus populaire, utilisée dans plus de 360 publications14 pour déterminer le profil de méthylation de l’ADN. Il peut déterminer la méthylation de jusqu’à 485 000 CpG situés dans 99 % des gènes connus15. Cependant, cette baie a été abandonnée et remplacée par l’EPIC, couvrant 850 000 sites CpG. Le protocole actuel peut être appliqué à la fois pour 450K et EPIC16,17,18.
Le protocole est présenté étape par étape à la figure 1 et comprend les étapes suivantes : sélection de la population, échantillonnage, préparation d’expériences, pipeline de méthylation de l’ADN et analyse bioinformatique. Une étude pilote réalisée dans notre laboratoire est démontrée ici pour illustrer les étapes du protocole proposé.
Figure 1: Schéma du protocole présenté. Veuillez cliquer ici pour voir une version plus grande de cette figure.
Les réseaux de méthylation de l’ADN sont les méthodes les plus utilisées pour accéder à la méthylation de l’ADN en raison de leur rapport coût-bénéfice14. La présente étude décrit un protocole détaillé utilisant une plate-forme de microréseau disponible dans le commerce pour évaluer la méthylation de l’ADN dans une étude pilote réalisée dans une cohorte brésilienne. Les résultats obtenus à partir de l’étude pilote ont confirmé l’efficacité du protocole. La figure 3 montre la comparabilité de l’échantillon et la conversion complète du bisulfite32.
En tant qu’étape de contrôle de la qualité, l’algorithme ChAMP a recommandé l’exclusion des sites CpGs pendant le processus de filtrage. L’objectif de l’exclusion des sondes est d’améliorer l’analyse des données et d’éliminer les biais. Les CpG de faible qualité (valeurs de p inférieures à 0,05) ont été supprimés pour éliminer le bruit expérimental dans l’ensemble de données. Les objectifs sont restés dépassés dans l’analyse du diagramme de densité. Zhou33 a décrit l’importance de filtrer les CpG près des SNP pour éviter les incohérences, la mauvaise interprétation de la méthylation des cytosines polymorphes et la cause de la couleur de commutation de la conception de sonde de type I34. De plus, comme les chromosomes XY sont affectés différemment par l’empreinte, Heiss et Just35 ont renforcé l’importance de filtrer ces sondes car, chez les femelles, les problèmes d’hybridation peuvent être des facteurs de confusion35.
La date d’expiration du DMAP, la date d’ouverture du formamide, la qualité analytique de l’éthanol absolu et le nombre total de leucocytes sont considérés comme des étapes critiques du protocole.
De plus, selon nos observations, l’estimation du type cellulaire est essentielle dans la réalisation de l’analyse bioinformatique. La méthode Houseman effectue l’estimation du type de cellule comme décrit dans l’étude de Tian30. Cette méthode est basée sur 473 sites CpG spécifiques qui peuvent prédire les pourcentages des types de cellules les plus importants, tels que les granulocytes, les monocytes, les cellules B et les cellules T36. Nous avons utilisé la fonction recommandée « myRefbase » du paquet ChAMP. Après l’estimation, l’algorithme ChAMP ajuste les valeurs bêta et élimine ce biais de l’ensemble de données. Cette étape est cruciale dans les études axées sur l’obésité car cette population présente une différence considérable dans les globules blancs en raison de leur état inflammatoire chronique.
Nous avons uniquement modifié la carte de capuchon d’origine pour le sceau PCR commun en ce qui concerne la modification de la méthode et le dépannage. Après chaque processus de centrifugation, le sceau a été changé pour un nouveau. Nous n’avons pas pu utiliser l’étanchéité thermique standard et l’avons adaptée en utilisant du papier d’aluminium autour de la plaque.
Bien que les essais commerciaux aient été considérés comme une norme d’or pour les études épigénétiques, l’une des limites du protocole pourrait être la spécificité des réactifs et de l’équipement d’une marque unique37,38,39,40. Une autre limite est le manque d’indicateurs permettant d’identifier la progression correcte de l’expérience41.
La normalisation du présent protocole représente un excellent guide pour la recherche épigénétique, réduisant les erreurs humaines au cours du processus et permettant une analyse réussie des données et la comparabilité entre différentes études.
Selon nos résultats, les expériences de méthylation de l’ADN conviennent aux études comparant des individus avec et sans obésité43. De plus, l’analyse bioinformatique proposée a fourni des données de haute qualité et pourrait être prise en compte dans des études à grande échelle.
En utilisant l’analyse SVD, nous avons identifié que les traits liés à l’obésité (IMC, WC et FM) influençaient la variabilité des données de méthylation de l’ADN. En conséquence significative, l’estimation du type cellulaire indique que les cellules tueuses naturelles (NK) et les cellules B étaient plus élevées chez les femmes obèses que chez les femmes non obèses (figure 5). Le nombre plus élevé de ces cellules pourrait s’expliquer par l’état inflammatoire de bas grade de ces individus44. Nous avons observé que les patients obèses ont des CpG hypo- et hyperméthylés dans les régions promotrices des gènes associés à la masse grasse. La plupart des sites étaient hypométhylés, ce qui pourrait être lié à l’augmentation naturelle des niveaux d’espèces réactives de l’oxygène (ROS) chez ces individus. Cette condition de stress oxydatif peut favoriser la perturbance de la guanine au site dinucléotide, formant de la 8-hydroxy-2′-désoxyguanosine (8-OHdG), entraînant un site dinucléotidique 5mCp-8-OHdG et provoquant le recrutement d’enzymes TET. Tous ces événements pourraient être responsables de la promotion de l’hypométhylation et de l’hyperméthylation de l’ADN par différents mécanismes d’action45.
En outre, le taux d’adipogenèse semble augmenter chez les personnes obèses, avec environ 10% de nouvelles cellules aux anciennes cellules46,47. Les apports épigénétiques, mettant l’accent sur l’environnement obésogène, peuvent modifier les taux de prolifération et de différenciation des cellules, favorisant le développement de la masse grasse48. Les changements épigénétiques peuvent également affecter les programmes adipogéniques, facilitant ou limitant leur développement. Les facteurs de transcription primaires (PPARγ ou C/EBPα) ou l’assemblage de complexes multiprotéiques, positionnés dans des régions promotrices en aval exploitées en incluant ou excluant des enzymes modificatrices épigénétiques, régulent l’expression des gènes par hyper- ou hypométhylation45. La voie PPARγ a déjà été décrite pour modifier la voie WNT, qui avait des gènes enrichis dans cette étude. Bien que l’on ne sache toujours pas comment la signalisation WNT se produit pendant l’adipogenèse, des études récentes ont rapporté qu’elle pourrait jouer un rôle essentiel dans le métabolisme des adipocytes, en particulier dans des conditions obésogènes49.
The authors have nothing to disclose.
Nous tenons à remercier Yuan Tian, Ph.D. (tian.yuan@ucl.ac.uk) d’être disponible pour répondre à tous les doutes sur le paquet ChAMP. Nous remercions également Guilherme Telles, Msc. pour sa contribution aux questions techniques et scientifiques de cet article; il a fait des considérations importantes concernant l’épigénétique et les techniques de capture et de formatage vidéo (guilherme.telles@usp.br). Financement des consommables : Fondation de recherche de São Paulo (FAPESP) (#2018/24069-3) et Conseil national pour le développement scientifique et technologique (CNPq : #408292/2018-0). Financement personnel : (FAPESP : #2014/16740-6) et Programme d’excellence académique de la Coordination pour le développement du personnel de l’enseignement supérieur (CAPES: 88882.180020/2018-01). Les données seront rendues publiques et librement accessibles sans restriction. Correspondance d’adresse à NYN (e-mail: nataliayumi@usp.br) ou CBN (e-mail: carla@fmrp.usp.br).
Absolute ethanol | J.T. Baker | B5924-03 | |
Agarose gel | Kasvi | K9-9100 | |
Electric bioimpedance | Quantum BIA 450 Q – RJL System | ||
Ethylenediaminetetraacetic acid (EDTA) | Corning | 46-000-CI | |
EZ DNA Methylation-Gold kit | ZymoResearch, Irvine, CA, USA | D5001 | |
Formamide | Sigma | F9037 | |
FMS—Fragmentation solution | Illumina | 11203428 | Supplied Reagents |
HumanMethylation450 BeadChip | Illumina | ||
Maxwell Instrument | Promega, Brazil | AS4500 | |
MA1—Multi-Sample Amplification 1 Mix | Illumina | 11202880 | Supplied Reagents |
MicroAmp Optical Adhesive Film | Thermo Fisher Scientific | 201703982 | |
MSM—Multi-Sample Amplification Master Mix | Illumina | 11203410 | Supplied Reagents |
NaOH | F. MAIA | 114700 | |
PB1—Reagent used to prepare BeadChips for hybridization | Illumina | 11291245 | Supplied Reagents |
PB2—Humidifying buffer used during hybridization | Illumina | 11191130 | Supplied Reagents |
2-propanol | Emsure | 10,96,34,01,000 | |
RA1—Resuspension, hybridization, and wash solution | Illumina | 11292441 | Supplied Reagents |
RPM—Random Primer Mix | Illumina | 15010230 | Supplied Reagents |
STM—Superior Two-Color Master Mix | Illumina | 11288046 | Supplied Reagents |
TEM—Two-Color Extension Master Mix | Illumina | 11208309 | Supplied Reagents |
Ultrapure EDTA | Invitrogen | 155576-028 | |
96-Well Reaction Plate with Barcode (0.1mL) | ByoSystems | 4346906 | |
96-Well Reaction Plate with Barcode (0.8mL) | Thermo Fisher Scientific | AB-0859 | |
XC1—XStain BeadChip solution 1 | Illumina | 11208288 | Supplied Reagents |
XC2—XStain BeadChip solution 2 | Illumina | 11208296 | Supplied Reagents |
XC3—XStain BeadChip solution 3 | Illumina | 11208392 | Supplied Reagents |
XC4—XStain BeadChip solution 4 | Illumina | 11208430 | Supplied Reagents |