Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin

Dechun Zhang; Xianzhao Kan; Sarah Elizabeth Huss; Lan Jiang; Li-Qing Chen; Yibing Hu

doi:10.3791/56684

JoVE Journal > Immunology and Infection

Please note that all translations are automatically generated. Click here for the English version.

Immunologie und Infektion

Mit der phylogenetischen Analyse zu eukaryotischen Gens Herkunft untersuchen

Published: August 14, 2018

doi:

10.3791/56684

Dechun Zhang*¹, Xianzhao Kan*², Sarah Elizabeth Huss³, Lan Jiang², Li-Qing Chen³, Yibing Hu⁴

¹Key Laboratory of Three Gorges Regional Plant Genetics and Germplasm Enhancement (CTGU)/Biotechnology Research Center,China Three Gorges University, ²The Institute of Bioinformatics, College of Life Sciences,Anhui Normal University, ³Department of Plant Biology,University of Illinois at Urbana-Champaign, ⁴College of Resources & Environmental Sciences,Nanjing Agricultural University

Summary

Eine Methode des Konstruierens einer phylogenetischen Stammbaum basierend auf Sequenzhomologie von Süßigkeiten von Eukaryoten und SemiSWEETs von Prokaryoten wird beschrieben. Phylogenetische Analyse ist ein nützliches Werkzeug für die Erklärung der evolutionären Verwandtschaft zwischen Homologen Proteine oder Gene aus verschiedenen Organismengruppen.

Abstract

Phylogenetische Analyse verwendet Nucleotid- oder Aminosäuresequenzen oder andere Parameter, wie Domain-Sequenzen und dreidimensionale Struktur, um einen Baum um zu zeigen, die evolutionäre Beziehung zwischen den verschiedenen Taxa (Klassifizierung Einheiten) in der molekularen konstruieren Ebene. Phylogenetische Analyse kann auch zu untersuchen, Domänen-Verhältnisse innerhalb einer einzelnen Taxon verwendet werden, vor allem für Organismen, die erhebliche unterzogen wurden zu ändern, in der Morphologie und Physiologie, sondern für die Forscher fossile Beweise fehlen die Organismen langen evolutionären Geschichte oder Knappheit der Versteinerung.

In diesem Text wird ein detailliertes Protokoll beschrieben nach der phylogenetischen Methode, einschließlich der Aminosäure Sequenzalignment mit Clustal Omega und anschließende phylogenetischen Baum Bau verwenden beide maximale Wahrscheinlichkeit (ML) der molekularen Evolutionäre Genetik Analyse (MEGA) und Bayesian Inference über MrBayes. Um den Ursprung der eukaryotic Zucker wird schließlich Transporter exportiert werden (SÜß) Gene zu untersuchen, wurden 228 Süßigkeiten einschließlich 35 süße aus einzelligen Eukaryoten und 57 halbsüß Proteine von Prokaryoten analysiert. Interessanterweise fanden sich SemiSWEETs in Prokaryoten, aber Süßigkeiten fanden sich in den Eukaryotes. Zwei Stammbäumen mit theoretisch unterschiedliche Methoden konstruiert haben durchweg vorgeschlagen, dass das erste eukaryotische süße gen aus der Verschmelzung von einer bakteriellen halbsüß gen und eine Archaeen halbsüß gen stammen könnte. Es ist erwähnenswert, dass man eine phylogenetische Analyse nur anhand Schluss zu ziehen, obwohl es empfiehlt sich, erklären die grundlegende Beziehung zwischen verschiedenen Taxa, die schwierig oder sogar unmöglich zu erkennen, mit experimentellen Mitteln ist vorsichtig sein sollte .

Introduction

DNA- oder RNA-Sequenzen tragen genetischen Information für zugrunde liegende Phänotypen, die durch physiologische und biochemische Methoden analysiert oder durch morphologische und fossilen Beweise beobachtet werden kann. In gewisser Weise ist genetischer Information zuverlässiger als externe Phänotypen zu bewerten, da erstere die Grundlage für Letzteres ist. In evolutionären Studie ist Fossilien sehr direkt und überzeugend. Jedoch haben viele Organismen, wie z. B. Mikroorganismen, kaum eine Chance, ein Fossil in langen geologischen Zeitaltern zu bilden. Daher molekularer Informationen wie Nukleotidsequenzen und Aminosäure-Sequenzen von verwandten extant Organismen sind von Wert für die Erkundung evolutionären Beziehungen¹. In der vorliegenden Studie lieferte eine einfache Einführung phylogenetische Grundkenntnisse und ein einfach zu erlernendes Protokoll für Neulinge, die einen phylogenetischen Stammbaum auf eigene Faust zu konstruieren müssen.

DNA (Nukleotide) und Proteinsequenzen (Aminosäure) können zur phylogenetische Beziehungen zwischen homologen Gene, Organellen oder sogar Organismen²ableiten. DNA-Sequenzen sind eher im Laufe der Evolution von Änderungen betroffen sein. Im Gegensatz dazu sind Aminosäure-Sequenzen wesentlich stabiler, da die Synonyme Mutationen im Nukleotidsequenzen in Aminosäuresequenzen keine Mutationen verursachen. Dadurch eignen sich DNA-Sequenzen zum Vergleich homologer Gene von eng verwandten Organismen, während Aminosäuresequenzen für Homologe Gene von weitläufig verwandten Organismen³geeignet sind.

Eine phylogenetische Analyse beginnt mit der Ausrichtung der Aminosäure oder Nukleotid-Sequenzen⁴ abgerufen aus einer kommentierten Genom Sequenzierung Datenbank⁵ aufgeführt im FASTA-Format, d. h., vermeintliche oder exprimierten Protein-Sequenzen, RNA-Sequenzen , oder DNA-Sequenzen. Es ist erwähnenswert, dass es entscheidend für qualitativ hochwertige Sequenzen für die Analyse zu sammeln, und nur homologe Sequenzen können zur phylogenetische Beziehungen zu analysieren. Viele verschiedene Plattformen wie Clustal W, Clustal X, Muskel, T-Coffee, MAFFT, eignet sich für Sequenzalignment. Die am weitesten verbreitete Clustal Omega⁶^,⁷ (http://www.ebi.ac.uk/Tools/msa/clustalo/), die online verwendet werden oder kann kostenlos heruntergeladen werden ist kostenlos. Das Alignment-Tool hat viele Parameter, die der Benutzer kann vor dem Start der Ausrichtung anpassen, sondern die Standardparameter arbeiten in den meisten Fällen gut. Nachdem der Vorgang abgeschlossen ist, sollte die ausgerichteten Sequenzen in das richtige Format für den nächsten Schritt gespeichert werden. Sie sollten dann bearbeitet werden oder getrimmt mit einem Bildbearbeitungs-Software, wie z. B. BioEdit, weil phylogenetischen Baum Bau von MEGA die Sequenzen erfordert von gleicher Länge (einschließlich Aminosäure Abkürzungen und Bindestriche. In der abgestimmten Reihenfolge jeder Position ohne eine Aminosäure oder ein Nukleotid ist vertreten durch einen Bindestrich “-“). Im Allgemeinen sollten alle hervorstehenden Aminosäuren oder Nukleotide an beiden Enden der Achse entfernt werden. Darüber hinaus können Spalten mit schlecht ausgerichtete Sequenzen in der Achse gelöscht werden, da sie wenig wertvolle Informationen zu vermitteln, und manchmal verwirrend oder falsche Informationen³geben können. Die Spalten, in denen ein oder mehrere Bindestriche können zu diesem Zeitpunkt oder in der späteren Bauphase Baum gelöscht werden. Alternativ können sie für die phylogenetische Berechnung verwendet werden. Wenn Sequenzalignment und Trimmen ist beendet, sollte die ausgerichteten Sequenzen im FASTA-Format oder das gewünschte Format für die spätere Verwendung gespeichert werden.

Viele Software-Plattformen bieten Baum Bau Funktionen mit unterschiedlichen Methoden und Algorithmen. Die Methoden können in der Regel als Distance Matrix-Methoden oder diskrete Datenmethoden klassifiziert werden. Distance Matrix-Methoden sind einfach und schnell zu berechnen, während diskrete Datenmethoden kompliziert und zeitaufwändig sind. Für sehr eng verwandten Taxa mit ein hohes Maß an Austausch der Aminosäure- oder Nukleotid-Sequenz Identität, eine Distance Matrix-Methode (Nachbar Beitritt: NJ; Ungewichtete paar Gruppe Methode mit arithmetisches Mittel: UPGMA) ist angebracht; für weitläufig verwandten Taxa, eine diskrete Daten-Methode (Maximum Likelihood: ML; Maximale Sparsamkeit: MP; Bayesian Inference) ist optimale³^,⁸. In dieser Studie wurden die ML-Methoden in MEGA (6.0.6) und Bayesian Inference (MrBayes 3.2) angewendet, um Stammbäumen⁹zu konstruieren. Ideal, wenn das richtige Modell und die Parameter verwendet werden, die Ergebnisse aus den unterschiedlichen Verfahren abgeleitet möglicherweise konsistent, und sie sind so zuverlässig und überzeugend.

Für ML phylogenetischen Baum mit MEGA¹⁰konstruiert muss die ausgerichteten Sequenz Datei im FASTA-Format in das Programm hochgeladen werden. Der erste Schritt ist dann der optimale Ersatz-Modell für die hochgeladenen Daten auswählen. Alle verfügbaren Ersatz-Modelle sind anhand der hochgeladenen Sequenzen verglichen, und ihre endgültige Ergebnisse in einer Ergebnistabelle angezeigt werden. Wählen Sie das Modell mit dem kleinsten Bayes-Kriterium (BIC)-Score (zuerst in der Tabelle aufgeführt), stellen Sie ML-Parameter nach dem empfohlenen Modell ein und starten Sie die Berechnung. Die Berechnungszeit hängt von einigen Minuten bis zu mehreren Tagen, abhängig von der Komplexität der geladenen Daten (Länge der Sequenzen und Anzahl der Taxa) und die Leistung des Computers, auf dem die Programme ausgeführt werden. Wenn die Berechnung beendet ist, wird ein phylogenetischer Baum in einem neuen Fenster angezeigt. Speichern Sie die Datei als “FileName.mat”. Nach dem Einstellen der Parameter für das Erscheinungsbild des Baumes festzulegen, einmal mehr sparen. Mit dieser Methode kann MEGA Publikation Grade phylogenetischen Stammbaum Zahlen generieren.

Für Baum Bau mit MrBayes¹¹ist der erste Schritt zur Nexus-Format (.nex als Dateityp) ausgerichtete Sequenz, die in der Regel im FASTA-Format aufgeführt ist, verwandeln. Nexus-Format FASTA Dateien verwandeln kann in MEGA verarbeitet werden. Als nächstes kann die abgestimmte Sequenz im Nexus-Format in MrBayes hochgeladen werden. Wenn die Datei erfolgreich hochgeladen wurde, geben Sie detaillierte Parameter für die Berechnung der Baum. Diese Parameter umfassen Details wie Aminosäure-Substitution Modell, Variante Raten, Anzahl der Kette für Markov Chain Monte Carlo (MCMC) Kupplung, Ngen Anzahl, durchschnittliche Standardabweichung der geteilten Frequenzen und so weiter. Nachdem diese Parameter angegeben haben, starten Sie die Berechnung. Am Ende zwei Baum-Figuren im ASC II-Code, eine Vorführung Clade Glaubwürdigkeit und die andere zeigt Zweig Längen, erscheint auf dem Bildschirm.

Das Baum-Ergebnis wird automatisch als “FileName.nex.con” gespeichert werden. Dieser Baum-Datei kann geöffnet und bearbeitet von Volksheiligen und in Volksheiligen angezeigte Zahl weiter um es besser geeignet für die Veröffentlichung geändert werden kann.

In dieser Studie wurden 228 süße Proteine, einschließlich 35 Süßigkeiten aus einzelligen Eukaryoten und 57 SemiSWEETs von Prokaryoten, exemplarisch analysiert. Die Süßigkeiten und SemiSWEETs zeichneten sich als Glukose, Fruktose oder Saccharose Transporter über Membranen¹²^,¹³. Phylogenetische Analyse deutet darauf hin, dass die beiden MtN3/Speichel-Domänen mit Süßigkeiten aus eine evolutionäre Mischung aus einer bakteriellen SemiSWEET und ein Archaeon¹⁴abgeleitet werden könnte.

Protocol

(1) Sequenzalignment Aminosäure-Sequenzen von eukaryotischen SÜß und prokaryotischen SemiSWEET in separaten Dokumenten zu sammeln und in der Liste im FASTA-Format. Sequenzen von National Center für Biotechnology Information (NCBI), European Molecular Biology Laboratory (EMBL) und der DNA Data Bank of Japan (DDBJ) Datenbanken durch Ähnlichkeitssuche mit dem Tool grundlegende lokale Alignment Search Tool (BLAST) herunterladen. In der Beispiel-Dateien sammeln Sie 228 vermeintliche …

Representative Results

Phylogenetische Bäume zeigen, dass alle ersten MtN3/Speichel Domänen der 35 süße Sequenzen als ein Clade und die zweite MtN3/Speichel-Domänen der süßen Sequenzen zusammengefasst als ein anderes Clade gruppierten. Darüber hinaus zeigen ausrichtergebnisse an Süßigkeiten und SemiSWEETs, dass einige SemiSWEETs aus α-Proteobakterien abgestimmt auf die erste MtN3/Speichel-Domäne der süßen Sequenzen, während SemiSWEETs von Methanobacteria (Archaea) mit dem zweiten MtN3/Speichel au…

Discussion

Es wird in der biologischen Forschung einen Phylogenetischen Baum ausgehend von Nukleotid oder Aminosäure-Sequenzen⁸immer beliebter. Generell gibt es drei wichtige Phasen der Übung einschließlich Sequenzalignment, Bewertung der ausgerichteten Sequenzen mit der richtigen Methode oder Algorithmus und Visualisierung von das rechnerische Ergebnis als phylogenetischer Baum. In der vorliegenden Studie wurden drei Runden von Sequenzalignment durchgeführt: Zunächst waren die süßen Proteinsequenzen,…

Offenlegungen

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wurde von der National Natural Science Foundation of China (31371596), Bio-Technology Research Center, China drei-Schluchten-Universität (2016KBC04) und die naturwissenschaftlichen Grundlage der Provinz Jiangsu, China (BK20151424) unterstützt.

Materials

Adobe Illustration			a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit			a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega			a package for making multiple sequence alignments of amino acid or nucleotide sequences. http://www.clustal.org/
CorelDRAW			a graphic design software. Copyright © 2017 Corel Corporation
FigTree			a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA			MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes			an Bayesian phylogenetic inference tool
NVIDIA			a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP			Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop			a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM			a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM			a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter			4GB memory, Core 2 or above CPU. Windows 7, Windows 10

Referenzen

Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Diesen Artikel zitieren

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

Mit der phylogenetischen Analyse zu eukaryotischen Gens Herkunft untersuchen

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Offenlegungen

Acknowledgements

Materials

Referenzen

Tags

Play Video

Diesen Artikel zitieren

View Video

Mit der phylogenetischen Analyse zu eukaryotischen Gens Herkunft untersuchen

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Offenlegungen

Acknowledgements

Materials

Referenzen

Tags

Play Video

Diesen Artikel zitieren

View Video

✖

To prove you're not a robot, please enter the text in the image below