O presente estudo descreve o fluxo de trabalho para gerenciar dados de metilação de DNA obtidos por tecnologias de microarray. O protocolo demonstra passos desde a preparação da amostra até a análise de dados. Todos os procedimentos são descritos em detalhes, e o vídeo mostra os passos significativos.
A obesidade está diretamente ligada ao estilo de vida e tem sido associada a alterações de metilação de DNA que podem causar alterações nos processos de adipogênese e armazenamento lipídeca contribuindo para o desenvolvimento da doença. Demonstramos um protocolo completo desde a seleção até a análise de dados epigenéticos de pacientes com e sem obesidade. Todas as etapas do protocolo foram testadas e validadas em estudo piloto. Participaram do estudo 32 mulheres, nas quais 15 indivíduos foram classificados com obesidade segundo o Índice de Massa Corporal (IMC) (45,1 ± 5,4 kg/m2); e 17 indivíduos foram classificados sem obesidade segundo o IMC (22,6 ± 1,8 kg/m2). No grupo com obesidade, 564 locais de IPC relacionados à massa gorda foram identificados por análise de regressão linear. Os locais do CpG estavam nas regiões promotoras. A análise diferencial encontrou 470 CpGs hipometilados e 94 sítios hipermetilados em indivíduos com obesidade. As vias enriquecidas mais hipometiladas foram no RUNX, sinalização WNT e resposta à hipóxia. As vias hipermetiladas estavam relacionadas à secreção de insulina, sinalização glucagon e Ca2+. Concluímos que o protocolo identificou efetivamente padrões de metilação de DNA e metilação de DNA relacionada a traços. Esses padrões podem estar associados à expressão genética alterada, afetando a adipogênese e o armazenamento lipídudo. Nossos resultados confirmaram que um estilo de vida obesogênico poderia promover mudanças epigenéticas no DNA humano.
As tecnologias de omics em larga escala têm sido cada vez mais utilizadas em estudos de doenças crônicas. Uma característica interessante desses métodos é a disponibilidade de uma grande quantidade de dados gerados para a comunidade científica. Por isso, surgiu uma demanda de padronização dos protocolos para permitir a comparação técnica entre os estudos. O presente estudo sugere a padronização de um protocolo para obtenção e análise de dados de metilação de DNA, utilizando um estudo piloto como exemplo aplicado.
O gasto energético negativo predomina nos estilos de vida humanos modernos, levando a um acúmulo excessivo de tecido adiposo e, consequentemente, ao desenvolvimento da obesidade¹. Muitos fatores têm aumentado as taxas de obesidade, como sedentarismo, dietas de alta caloria e rotinas estressantes. A Organização Mundial da Saúde (OMS) estimou que 1,9 bilhão de adultos eram obesos em 2016, o que significa que mais de 20% da população mundial tem mais de 30 kg/m2 de IMC. A atualização mais recente de 2018 revelou que a prevalência de obesidade nos Estados Unidos da América (EUA) foi superior a 42%3.
Epigenética é a adaptação estrutural das regiões cromossômicas para registrar, sinalizar ou perpetuar estados de atividade alterada4. A metilação do DNA é uma alteração química reversível nos sítios de dinucleotídeos citosina-guanosina (sítios CpG), formando 5-metilcittosina-pG (5mCpG). Pode modular a expressão genética regulando o acesso da máquina de transcrição ao DNA5,6,7,8. Nesse contexto, é essencial compreender quais locais de CpG estão associados a traços relacionados à obesidade9. Muitos fatores podem apoiar ou prevenir a metilação de DNA específica do local. Enzimas necessárias para esse processo, como metiltransferases de DNA10 (DNTMs) e dez e onze translocações (TETs), podem promover a metilação ou desmetilação do DNA sob exposições ambientais11.
Considerando o crescente interesse pelos estudos de metilação de DNA nos últimos anos, escolher a estratégia de análise mais adequada para responder com precisão a cada pergunta tem sido uma preocupação essencial dos pesquisadores12,13,14. A matriz de metilação de DNA de 450K é o método mais popular, usado em mais de 360 publicações14 para determinar o perfil de metilação de DNA. Pode determinar a metilação de até 485.000 CpGs localizados em 99% dos genes conhecidos15. No entanto, esta matriz foi descontinuada e substituída pelo EPIC, cobrindo 850.000 sites cpg. O presente protocolo pode ser aplicado tanto para 450K quanto para EPIC16,17,18.
O protocolo é apresentado passo a passo na Figura 1 e compreende as seguintes etapas: seleção populacional, amostragem, preparação de experimentos, pipeline de metilação de DNA e análise bioinformática. Um estudo piloto realizado em nosso laboratório é demonstrado aqui para ilustrar os passos do protocolo proposto.
Figura 1: Esquema do protocolo apresentado. Clique aqui para ver uma versão maior desta figura.
As matrizes de metilação de DNA são os métodos mais utilizados para acessar a metilação de DNA devido à sua relação custo-benefício14. O presente estudo descreveu um protocolo detalhado utilizando uma plataforma de microarray comercialmente disponível para avaliar a metilação de DNA em um estudo piloto realizado em uma coorte brasileira. Os resultados obtidos pelo estudo piloto confirmaram a eficácia do protocolo. A Figura 3 mostra a comparabilidade da amostra e a conversão completa de bisullfita32.
Como uma etapa de controle de qualidade, o algoritmo ChAMP recomendou a exclusão de sites de CpGs durante o processo de filtragem. O objetivo da exclusão das sondas é melhorar a análise de dados e eliminar o viés. Os CpGs de baixa qualidade (valores p inferiores a 0,05) foram removidos para eliminar ruídos experimentais no conjunto de dados. Os alvos permaneceram passados na análise da parcela de densidade. Zhou33 descreveu a importância de filtrar CpGs perto de SNPs para evitar incompatibilidades, má interpretação da metilação de citosinas polimórficas e causar a cor do switch do design da sonda tipo I34. Além disso, como os cromossomos XY são diferencialmente impactados pela impressão, Heiss e Just35 reforçaram a importância de filtrar essas sondas porque, nas fêmeas, os problemas com a hibridização podem ser fatores confusos35.
A data de validade do DMAPs, a data de abertura do formamida, a qualidade analítica do etanol absoluto e a contagem total de leucócitos são consideradas etapas críticas no protocolo.
Além disso, de acordo com nossas observações, a estimativa do tipo celular é essencial na realização da análise bioinformática. O método Houseman realiza a estimativa do tipo celular, conforme descrito no estudo de Tian30. Este método é baseado em 473 locais específicos de CpG que podem prever as porcentagens dos tipos celulares mais importantes, como granulócitos, monócitos, células B e células T36. Usamos a função recomendada “myRefbase” do pacote ChAMP. Após a estimativa, o algoritmo ChAMP ajusta os valores beta e elimina esse viés do conjunto de dados. Essa etapa é crucial em estudos focados na obesidade porque essa população tem uma diferença considerável nos glóbulos brancos devido ao seu estado inflamatório crônico.
Nós apenas mudamos o mapa original da tampa para o selo PCR comum em relação à modificação do método e solução de problemas. Após cada processo de centrifugação, o selo foi trocado por um novo. Não pudemos usar a vedação de calor padrão e adaptá-lo usando papel alumínio ao redor da placa.
Embora os ensaios comerciais tenham sido considerados padrão-ouro para estudos epigenéticos, uma limitação do protocolo pode ser a especificidade dos reagentes e equipamentos de uma marca única37,38,39,40. Outra limitação é a falta de indicadores que permitam identificar o correto progresso do experimento41.
A padronização do presente protocolo representa um grande guia para a pesquisa epigenética, reduzindo erros humanos durante o processo e permitindo a análise e comparabilidade bem-sucedidas de dados entre diferentes estudos.
De acordo com nossos resultados, experimentos de metilação de DNA são adequados para estudos que comparam indivíduos com e sem obesidade43. Além disso, a análise bioinformática proposta forneceu dados de alta qualidade e poderia ser considerada em estudos de grande escala.
Utilizando a análise do SVD, identificamos que os traços relacionados à obesidade (IMC, CC e FM) influenciaram a variabilidade nos dados de metilação de DNA. Como resultado significativo, a estimativa do tipo celular indica que ambas as células assassinas naturais (NK) e B foram mais elevadas em mulheres com obesidade do que em mulheres sem obesidade (Figura 5). As maiores contagens dessas células poderiam ser explicadas pelo estado inflamatório de baixo grau desses indivíduos44. Observou-se que pacientes com obesidade possuem CpGs hipoetiladas e hipermetiladas em regiões promotoras de genes associados à massa gorda. A maioria dos locais eram hipometilados, o que poderia estar relacionado ao aumento natural dos níveis reativos de oxigênio (ROS) nesses indivíduos. Esta condição de estresse oxidativo pode promover perturbação guanina no local do dinucleotídeo, formando 8-hidroxi-2′-desoxyguanosine (8-OHdG), resultando em um local de dinucleotídeo de 5mCp-8-OHdG, e causando o recrutamento de enzimas TET. Todos esses eventos podem ser responsáveis por promover hipometilação de DNA e hipermetilação por diferentes mecanismos de ação45.
Além disso, a taxa de adipogênese parece aumentar em indivíduos com obesidade, com aproximadamente 10% de novas células para células antigas46,47. Contribuições epigenéticas, enfatizando o ambiente obesogênico, podem alterar as taxas de proliferação e diferenciação das células, favorecendo o desenvolvimento da massa gorda48. Mudanças epigenéticas também podem afetar programas adipogênicos, facilitando ou restringindo seu desenvolvimento. Fatores de transcrição primária (PPARγ ou C / EBPα) ou a montagem de complexos multiproteínas, posicionados em regiões promotoras a jusante operadas incluindo ou excluindo enzimas modificadores epigenéticas, regulam a expressão genética através de hiper ou hipometilação45. A via PPARγ foi descrita anteriormente para alterar a via WNT, que teve genes enriquecidos neste estudo. Embora ainda não se saiba como a sinalização do WNT ocorre durante a adipogênese, estudos recentes relataram que ela pode ter papéis essenciais no metabolismo adipócito, particularmente sob condições obesogênicas49.
The authors have nothing to disclose.
Gostaríamos de agradecer a Yuan Tian, Ph.D. (tian.yuan@ucl.ac.uk) por estar disponível para responder a todas as dúvidas sobre o pacote ChAMP. Agradecemos também a Guilherme Telles, msc. por sua contribuição tanto para as questões técnicas quanto científicas deste artigo; fez considerações importantes sobre epigenética e técnicas de captura e formatação de vídeo (guilherme.telles@usp.br). Financiamento de Materiais De Consumo: Fundação de Pesquisa de São Paulo (FAPESP) (nº 2018/24069-3) e Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq: #408292/2018-0). Financiamento pessoal: (FAPESP: nº 2014/16740-6) e Programa de Excelência Acadêmica da Coordenação de Desenvolvimento de Pessoal de Ensino Superior (CAPES:88882.180020/2018-01). Os dados serão disponibilizados publicamente e livremente sem restrições. Endereço correspondência para NYN (e-mail: nataliayumi@usp.br) ou CBN (e-mail: carla@fmrp.usp.br).
Absolute ethanol | J.T. Baker | B5924-03 | |
Agarose gel | Kasvi | K9-9100 | |
Electric bioimpedance | Quantum BIA 450 Q – RJL System | ||
Ethylenediaminetetraacetic acid (EDTA) | Corning | 46-000-CI | |
EZ DNA Methylation-Gold kit | ZymoResearch, Irvine, CA, USA | D5001 | |
Formamide | Sigma | F9037 | |
FMS—Fragmentation solution | Illumina | 11203428 | Supplied Reagents |
HumanMethylation450 BeadChip | Illumina | ||
Maxwell Instrument | Promega, Brazil | AS4500 | |
MA1—Multi-Sample Amplification 1 Mix | Illumina | 11202880 | Supplied Reagents |
MicroAmp Optical Adhesive Film | Thermo Fisher Scientific | 201703982 | |
MSM—Multi-Sample Amplification Master Mix | Illumina | 11203410 | Supplied Reagents |
NaOH | F. MAIA | 114700 | |
PB1—Reagent used to prepare BeadChips for hybridization | Illumina | 11291245 | Supplied Reagents |
PB2—Humidifying buffer used during hybridization | Illumina | 11191130 | Supplied Reagents |
2-propanol | Emsure | 10,96,34,01,000 | |
RA1—Resuspension, hybridization, and wash solution | Illumina | 11292441 | Supplied Reagents |
RPM—Random Primer Mix | Illumina | 15010230 | Supplied Reagents |
STM—Superior Two-Color Master Mix | Illumina | 11288046 | Supplied Reagents |
TEM—Two-Color Extension Master Mix | Illumina | 11208309 | Supplied Reagents |
Ultrapure EDTA | Invitrogen | 155576-028 | |
96-Well Reaction Plate with Barcode (0.1mL) | ByoSystems | 4346906 | |
96-Well Reaction Plate with Barcode (0.8mL) | Thermo Fisher Scientific | AB-0859 | |
XC1—XStain BeadChip solution 1 | Illumina | 11208288 | Supplied Reagents |
XC2—XStain BeadChip solution 2 | Illumina | 11208296 | Supplied Reagents |
XC3—XStain BeadChip solution 3 | Illumina | 11208392 | Supplied Reagents |
XC4—XStain BeadChip solution 4 | Illumina | 11208430 | Supplied Reagents |