シャイニーアプリケーションまたはRコンソールを通じて経路協会研究ツール(PAST)を実行することにより、研究者は関連する代謝経路を調査することによって、ゲノム全体の関連研究(GWAS)の結果の生物学的意味をより深く理解することができます。
近年、代謝経路解析を用いたゲノムワイド関連解析(GWAS)データの解釈に関する新たな実装が開発され、発表された。経路協会スタディツール(PAST)は、ユーザーの使いやすさと遅い分析の懸念に対処するために開発されました。この新しいユーザーフレンドリーなツールは、バイオコンダクターとGithubでリリースされました。テストでは、PASTは以前は24時間以上必要な分析を1時間以内に実行しました。この記事では、書き込みアプリケーションまたは R コンソールを使用して PAST を実行するためのプロトコルを紹介します。
ゲノムワイド関連研究(GWAS)は、複雑な形質とそれらに関連するゲノム領域を1、2、3に関連するゲノム領域を研究する一般的な方法である。このタイプの研究では、数十万個の一塩基多型(SNP)マーカーが形質との関連についてテストされ、関連の有意性が評価される。誤検出率 (FDR) のしきい値 (またはその他の種類の有意性しきい値) を満たすマーカー特性アソシエーションは、調査のために保持されますが、真の関連付けは除外される場合があります。複雑なポリジェニック形質の場合、各遺伝子の効果は小さく(したがって除外される)可能性があり、一部の対立遺伝子は研究3に存在しないかもしれない特定の条件でのみ発現される。したがって、多くのSNPsは形質に関連付けられているように保持されるかもしれませんが、それぞれが非常に小さな効果を有する可能性があります。あまりにも多くのSNP呼び出しが欠落し、形質の生物学的意味と遺伝的アーキテクチャの解釈が不完全で混乱する可能性があります。代謝経路解析は、生物学的機能4、5、6に従ってグループ化された遺伝子の複合効果に焦点を当てることで、これらの問題のいくつかに対処するのに役立ちます。
この記事で説明したメソッドの以前の実装を使用して、いくつかの調査が完了しました。アフラトキシン蓄積7、コーンミミズ耐性8、及び油生合成9 はいずれも、以前の実施で検討した。これらの解析は成功しましたが、分析ツールは R、Perl、Bash の組み合わせで作成され、パイプラインは自動化されていないため、分析プロセスは複雑で時間がかかり、面倒でした。解析ごとにこの方法を変更するために必要な専門的な知識のため、他の研究者と共有できる新しい方法が開発されました。
経路関連スタディツール(PAST)10 は、プログラミング言語の知識を減らし、より短い期間で分析を実行することで、以前の方法の欠点に対処するように設計されました。この方法はトウモロコシでテストされましたが、PASTは種固有の仮定をしません。PASTは、シャイニーアプリとしてRコンソールを介して実行することができ、オンラインバージョンはまもなくMaizeGDBで利用可能になると予想されます。
PASTの主な目標は、GWASデータの代謝経路分析を、特に非ヒトおよび非動物生物に対してより多くの聴衆に持ち込むことである。PAST の代替方法は、多くの場合、人間や動物に焦点を当てたコマンドラインプログラムです。ユーザーフレンドリさは、光沢のあるアプリケーションを開発することを選択することと、Rとバイオコンダクターを使用してアプリケーションをリリースするという点の両方で、PASTの開発における主要な目標でした。ユーザーは PAST を使用するためにプログラムをコンパイルする方法を学ぶ必要はありません。
ほとんどのタイプの解析ソフトウェアと同様に、PAST の結果は入力データと同じ結果にすぎません。入力データにエラーがある場合や、形式が誤っている場合、PAST は実行に失敗するか、または情報が得られない結果を生成します。GWAS データ、LD データ、アノテーション、およびパス・ファイルが正しくフォーマットされていることを確認することは、PAST から正しい出力を受け取るうえで重要です。PAST は、バイアラリック マーカーのみを分析し、入力データのセットごとに 1 つの特性のみを実行できます。さらに、遺伝子型入力が不十分、誤った、または不正確な型定義によって生成されたGWASデータは、明確または再現可能な結果を生み出す可能性は低い。PASTはGWASの結果の生物学的解釈に役立ちますが、環境変動、実験的エラー、または人口構造が適切に考慮されなかった場合、混沌としたデータセットを明確にすることはほとんどありません。
ユーザーは、シャイニーアプリケーションと、それらのパラメータをRコンソールのPASTの関数に渡すことによって、分析の一部のパラメータを変更することができます。これらのパラメータは PAST によって報告される結果を変更する可能性があり、ユーザーはデフォルトからこれらの結果を変更する際に注意する必要があります。LDはユーザによって測定されるので、通常はGWASでも使用されていたのと同じマーカーデータセットを使用するため、LD測定値は母集団に固有である。すべての研究、特にトウモロコシ以外の種(特に自己受粉、多発性、または非常に異種種)については、デフォルトの変化が保証される可能性があります。
The authors have nothing to disclose.
何一つ。
Computer | NA | NA | Any computer with 8GB RAM should be sufficient |
R | R Project | NA | R 3.6 or greater is required to install from Bioconductor |