Summary

系統解析を使用して真核生物遺伝子の起源を調査するには

Published: August 14, 2018
doi:

Summary

原核生物から真核生物と SemiSWEETs からお菓子の配列相同性に基づいて系統樹を構築する方法を説明します。系統解析は、異なる生物のグループから相同タンパク質や遺伝子の進化的関連性を説明するための便利なツールです。

Abstract

系統解析分子進化の関係別分類 (分類単位) を表示するツリーを構築するヌクレオチドまたはアミノ酸配列またはドメイン配列や立体構造など、その他のパラメーターを使用して、レベル。相当受けている生物形態および生理学でも研究員不足のために化石の証拠のための変更のために特にも、系統解析を使用個々 の分類群内でのドメインの関係を調査することができます、生物の長い進化の歴史や化石化の欠乏。

Clustal オメガと後続の系統樹を用いた両方最大尤度 (ML) の分子進化遺伝学を使用してアミノ酸配列アラインメントを含む系統のメソッドを使用してこのテキストの詳しいプロトコルを紹介します。分析 (メガ) とベイズ推定 MrBayes を介して。真核生物の糖が最終的にトランスポーターのエクスポートをする(甘口) 遺伝子の起源を調べるためには、単細胞真核生物から 35 甘い蛋白質と原核生物から 57 の少し甘味がある蛋白質を含む 228 お菓子を行った。興味深いことに、SemiSWEETs が原で発見されたが、お菓子は真核生物で発見されました。理論的に異なるメソッドを使用して 2 つの系統樹は一貫して最初の真核生物の遺伝子を甘い可能性があります細菌の少し甘味がある遺伝子と古細菌甘味遺伝子の融合に由来することを示唆しています。それは慎重な困難または実験的手段によって識別することは不可能である、異なる分類群の基になる関係を説明するために便利ですが系統解析のみに基づいて結論を出すべきということは注目に値する.

Introduction

DNA や RNA 配列は、生理学的・生化学的方法を分析または形態および化石の証拠を観察できる基になる表現型の遺伝情報を運ぶ。ある意味で、遺伝情報は前者後者の基礎となるので、外部の表現型を評価するよりもより信頼性の高いです。進化の研究では、化石の証拠は非常に直接、説得力のあります。ただし、微生物などの多くの生物は、長い地質時代の化石を形成する機会がほとんど します。したがって、現存する生物の関連からアミノ酸配列と塩基配列などの分子情報が進化の関係1を探索するための値。本研究では独自に系統樹を構築する必要がある新規参入者の系統の基本的な知識と学ぶ簡単なプロトコルの簡単な紹介を行いました。

相同遺伝子、細胞小器官、または2も生物間の系統関係を推論する DNA (ヌクレオチド) とタンパク質 (アミノ酸) の両方を使用できます。DNA シーケンスは、進化の過程での変更によって影響を受ける可能性が高い。対照的に、アミノ酸配列はかなり安定して同義変異塩基配列がアミノ酸配列の変異を発生しないことを考える。結果として、DNA 配列、アミノ酸配列、遠縁の生物3から相同遺伝子の適切な密接に関連有機体から相同遺伝子の比較に役立ちます。

系統解析から始まるアミノ酸の配置またはヌクレオチド シーケンス4注釈付きヒトゲノム データベース5から取得表示 FASTA 形式、すなわち推定または表現される蛋白質シーケンス、RNA シーケンス、または DNA 配列。それは分析のための高品質のシーケンスを収集することが重要だけ相同配列は系統関係を分析する使用ことができます注目に値するです。多くの異なるプラットフォーム Clustal W、Clustal X、筋肉など MAFFT、T コーヒーをアライメントに使用できます。Clustal オメガ6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/)、オンラインで使用することができますまたは無料でダウンロードすることができますは、最も広く使用される料金。配置ツールには、ユーザーは、配置を開始する前に調整できますが、既定のパラメーターは、ほとんどの場合でうまく動作するさまざまなパラメーターがあります。プロセスの完了後、整列のシーケンスは次のステップの正しい形式に保存ください。彼らを編集する必要があります。 またはメガで系統樹構築 (アミノ酸略語とハイフンを含む長さが等しいするシーケンスを必要とするため BioEdit などの編集ソフトウェアを使用してトリミングします。整列順序アミノ酸またはヌクレオチドなしの任意の位置はハイフンで表されます”-“)。一般的に、突出のアミノ酸またはヌクレオチド配置のどちらかの端のすべて削除する必要があります。さらに、ほとんどの貴重な情報を伝えるため、時々 混乱したり、偽情報3を与えることができるので、線形の不揃いシーケンスを含んでいる列を削除できます。この時または後のツリー建設段階で、1 つ以上のハイフンが含まれる列を削除できます。また、系統樹の計算に使用できます。配列アラインメントとトリミングを完了すると、一直線に並べられたシーケンスは FASTA 形式、または後で使用するため、目的の形式で保存必要があります。

多くのソフトウェア プラットフォームは、さまざまな方法またはアルゴリズムを使用してツリー構造の機能を提供します。一般的に、メソッドは、距離行列法または離散データのメソッドのいずれかに分類できます。距離行列法は、シンプル、高速離散データのメソッドが複雑で時間がかかる、計算します。アミノ酸またはヌクレオチド シーケンス id、距離行列法の共有度の高い非常に密接に関連種のため (隣人への参加: ニュージャージー;算術平均と加重対グループ法: UPGMA) 適切な;遠縁のイチイ、離散データ メソッドの (最大尤度: ML;最大の節約: MP;ベイズの推論) は、最適な3,8です。本研究では ML メガ (6.0.6) とベイズ推論 (MrBayes 3.2) の9系統樹を構築に適用しました。理想的には、適切なモデルとパラメーターを使用すると、異なる方法から得られた結果は、一貫性のあるかもしれないし、彼らより信頼性の高い、説得力のあります。

手法はメガ10ML 系統樹のプログラムに FASTA 形式で一直線に並べられたシーケンス ファイルをアップロードする必要があります。まず、アップロードされたデータの最適な代替モデルを選択することです。アップロードされたシーケンスに基づいてすべての利用可能な代替モデルを比較し、最終スコアが結果テーブルに表示されます。(表の最初に表示) 最小ベイズ情報基準 (BIC) のスコアを持つモデルを選択、推奨モデルによると ML パラメーターを設定し、計算を開始します。計算時間は、数分から読み込まれたデータ (シーケンスとイチイの数の長さ) の複雑さと、プログラムを実行するコンピューターのパフォーマンスに応じて、いくつかの日によって異なります。計算が完了したら、系統樹は新しいウィンドウに表示されます。”FileName.mat”としてファイルを保存します。ツリーの外観を指定するためのパラメーターを設定した後もう一度保存します。メガは、このメソッドを使用して、パブリケーション グレード系統樹図を生成できます。

MrBayes11木構築の最初のステップは、nexus 形式 (ファイルの種類として .nex) に FASTA 形式に通常記載されている整列のシーケンスを変換するためです。メガで FASTA ファイルをネクサスの形式に変換を処理できます。次に、nexus 形式で整列のシーケンスは、MrBayes にアップロードできます。ファイルが正常にアップロードされると、ツリーの計算の詳細なパラメーターを指定します。これらのパラメーターは、カップリング、ngen 数アミノ酸置換モデル、変化率、マルコフ連鎖モンテカルロ法 (MCMC) のチェイン ・ ナンバーなどの詳細を含める、分割周波数の標準偏差の平均、などなど。これらのパラメーターを指定すると後、は、計算を開始します。最後に、ASC II コード、1 つ示すクレード信頼性および他の示す枝長の 2 つのツリー図は、画面に表示されます。

ツリーの結果は、「FileName.nex.con」として自動的に保存されます。このツリーのファイルを開くおよびフィグツリー、編集できます、フィグツリーに表示される図は、文書により適切にさらに変更できます。

この研究では、単細胞真核生物から 35 お菓子など、原核生物から 57 SemiSWEETs 228 の甘い蛋白質は例として分析されました。お菓子と SemiSWEETs の両方は、膜12,13でブドウ糖や果糖、ショ糖トランスポーターとして特徴づけられた.系統解析では、細菌 SemiSWEET ・始原14進化融合由来のお菓子を含む 2 つの MtN3/唾ドメイン可能性がありますを示唆しています。

Protocol

1. アライメント 真核生物と原核生物 SemiSWEET 別々 のドキュメントでのアミノ酸配列を収集し、FASTA 形式でそれらを一覧表示します。基本的なローカル配置検索ツール (ブラスト) ツールと類似検索で国立センターから DDBJ データベースの DNA データバンク、欧州分子生物学研究所 (EMBL) 生物工学情報 (NCBI) のためのシーケンスをダウンロードします。 例ファイルで?…

Representative Results

系統発生の木は、すべての 35 の甘いシーケンスの最初の MtN3/唾ドメインが 1 つのクレードと別のクレードとしてクラスター化甘いシーケンスの 2 番目の MtN3/唾ドメインとしてクラスター化することを表示します。さらに、お菓子や SemiSWEETs の配置結果表示 α プロテオ バクテリアからいくつかの SemiSWEETs が甘いシーケンスの最初の MtN3/唾ドメインと揃っている 2 番目?…

Discussion

ヌクレオチドまたはアミノ酸シーケンス8に基づいて系統樹を作ることは生物学的研究にますます人気になっています。一般的に、配列アラインメント、適切なメソッドやアルゴリズムとアラインメントの評価と系統樹として計算結果の可視化を含む練習の 3 つの重要な段階があります。提示の研究では、アライメントの 3 つのラウンドを行った: 最初に、最初と 2 番目の MtN…

Disclosures

The authors have nothing to disclose.

Acknowledgements

この作品は、江蘇省、中国 (BK20151424) の自然科学基金、中国三峡大学 (2016KBC04)、バイオ テクノロジー研究センター中国の国家自然科学基金 (31371596) によって支えられました。

Materials

Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4GB memory, Core 2 or above CPU. Windows 7, Windows 10

References

  1. Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Play Video

Cite This Article
Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

View Video