Summary

Использование филогенетический анализ расследовать эукариотический геном происхождения

Published: August 14, 2018
doi:

Summary

Описан метод построения филогенетическое дерево, основанный на последовательности гомологии сладостей от эукариот и SemiSWEETs от прокариот. Филогенетический анализ является полезным инструментом для объяснения эволюционное родство между гомологичных белки или гены из организма различных групп.

Abstract

Филогенетический анализ использует нуклеотидных и аминокислотных последовательностей или другие параметры, такие как домен последовательности и трехмерную структуру, чтобы построить дерево Показать постепеновское отношение среди различных таксонам (классификационные единицы) на молекулярной уровне. Филогенетический анализ может также использоваться для расследования доменных связей в рамках отдельных Таксон, особенно для организмов, которые претерпели существенные изменения в морфологии и физиологии, но для которых исследователи не имеют ископаемые свидетельства из-за организмов долго эволюционной истории или нехватка окаменения.

В этом тексте подробный протокол описан с помощью метода филогенетических, включая аминокислоты выравнивание последовательностей с использованием Clustal Омега и последующего филогенетическое дерево строительство с использованием как максимальная вероятность (мл) молекулярной эволюционной генетики Анализ (мега) и выводы Байеза через MrBayes. Чтобы исследовать происхождение генов эукариот Сахара будет в конечном итоге быть экспортированы транспортеры (SWEET), были проанализированы 228 сладости, включая 35 сладкий белки от одноклеточных эукариот и 57 полусладкое белков прокариот. Интересно, что SemiSWEETs были найдены в прокариотах, но сладости были найдены у эукариот. Два филогенетических деревьев, построенный с помощью теоретически различных методов последовательно предложено, что первый эукариотических сладкий ген может вытекать из синтез бактериальный ген полусладкое и архей полусладкое гена. Стоит отметить, что надо быть осторожным, чтобы сделать вывод только на основе филогенетического анализа, хотя это полезно объяснить базовые отношения между различными таксонов, которые трудно или даже невозможно различить экспериментальным путем .

Introduction

Последовательности ДНК или РНК нести генетическую информацию для базового фенотипов, которые могут быть проанализированы через физиологические и биохимические методы или наблюдается через морфологических и ископаемые свидетельства. В некотором смысле генетическая информация является более надежным, чем оценки внешних фенотипов, потому что первый является основой для последнего. В исследовании, эволюционной ископаемые свидетельства очень прямой и убедительными. Однако многих организмов, таких как микроорганизмы, имеют мало шансов сформировать ископаемых во время долго геологического возраста. Таким образом молекулярной информации такие последовательности нуклеотидных и аминокислотных последовательностей от смежных сохранившиеся организмов представляют ценность для изучения эволюции отношения1. В настоящем исследовании простое введение базовых знаний филогенетический и легко научиться протокола была предоставлена для новичков, которые нужно построить филогенетическое дерево на своих собственных.

ДНК (нуклеотидов) и белки (аминокислоты) последовательности может использоваться для выведения Филогенетические отношения между гомологичных генов, органеллы или даже организмов2. Последовательностей ДНК, скорее всего, будут затронуты изменения в ходе эволюции. В отличие от аминокислотных последовательностей гораздо более стабильной, учитывая, что синонимом мутации в нуклеотидных последовательностей не вызывают мутации в аминокислотных последовательностях. В результате последовательности ДНК полезны для сравнения гомологичных генов от близкородственных организмов, тогда как аминокислотных последовательностей являются подходящими для гомологичных генов от отдаленно похожие организмов3.

Филогенетический анализ начинается с выравниванием амино кислоты или нуклеотидных последовательностей4 извлекается из аннотированной генома, секвенирование базы данных5 , перечисленных в формат FASTA, т.е., предполагаемые или выраженной белка последовательности, РНК последовательности , или последовательностей ДНК. Стоит отметить, что очень важно для сбора высококачественных последовательностей для анализа, и только гомологичных последовательности может использоваться для анализа Филогенетические отношения. Много различных платформ Clustal W, Clustal X, мышцы, T-кофе, MAFFT, может использоваться для выравнивания последовательности. Наиболее широко используется Clustal Омега6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/), который может быть использован онлайн или может быть загружен бесплатно бесплатно. Инструмент выравнивания имеет множество параметров, которые пользователь может настроить перед началом выравнивания, но параметры по умолчанию хорошо работать в большинстве случаев. После завершения процесса, соответствие последовательности должны сохраняться в правильный формат для следующего шага. Они должны затем редактироваться или обрезается, используя программное обеспечение для редактирования, такие как BioEdit, потому что филогенетическое дерево строительство мега требует последовательности, чтобы быть одинаковой длины, (включая аминокислоты аббревиатуры и дефисы. В соответствие последовательности, любой позиции без аминокислот или нуклеотидов представлена дефис «-»). Как правило следует удалить все выступающие аминокислоты или нуклеотидов на любом конце выравнивание. Кроме того столбцы, содержащие плохо выровненных последовательностей в выравнивание могут быть удалены, потому что они передают мало ценную информацию и может иногда дать заблуждение или ложной информации3. Столбцы, содержащие один или несколько переносов могут быть удалены в настоящее время или в более поздней стадии строительства дерево. Кроме того они могут использоваться для филогенетических вычислений. По завершении последовательности выравнивание и обрезки, соответствие последовательности должны сохраняться в формате FASTA, или требуемый формат, для последующего использования.

Многие программные платформы обеспечивают дерево строительство функции с использованием различных методов и алгоритмов. В целом методы могут быть классифицированы как расстояние матричные методы или методы дискретных данных. Расстояние матричные методы являются простой и быстрый для вычисления, в то время как дискретные данные методы являются сложным и трудоемким. Для очень тесно связанных таксонов с высокой степенью распределения аминокислоты нуклеотидной последовательности индивидуальности, метод матрицы расстояние (сосед присоединения: NJ; Невзвешенные метод группы пара с арифметическое: UPGMA) является целесообразным; для отдаленно связанные таксоны, метод дискретных данных (максимального правдоподобия: мл; Максимальная экономичность: MP; Выводы Байеза) является оптимальным3,8. В этом исследовании для построения филогенетических деревьев9применялись методы мл Мега (6.0.6) и выводы Байеза (MrBayes 3.2). В идеале при использовании правильной модели и параметры, результаты, полученные от различных методов может быть последовательным, и они, таким образом, более надежные и убедительные.

Для мл филогенетическое дерево, построенный с помощью мега10соответствие последовательности файлов в формате FASTA должен быть загружен в программу. Первым шагом является затем выбрать оптимальную замену модель для загруженных данных. Все доступные замены модели сравниваются на основе загруженных последовательностей, и их окончательные результаты будут показаны в таблице результатов. Выберите модель с наименьшим Оценка информации критерий Байеса (BIC) (сначала перечислены в таблице), задать параметры ML согласно Рекомендуемые модели и начать вычисления. Время вычисления варьируется от нескольких минут до нескольких дней, в зависимости от сложности загруженных данных (длина последовательности и количество таксонов) и производительности компьютера, на котором выполняются программы. По завершении вычисления филогенетическое дерево будет показан в новом окне. Сохраните файл как «FileName.mat». После установки параметров, чтобы задать внешний вид дерева, сохраните еще раз. С помощью этого метода, мега можно создавать публикации класс филогенетическое дерево фигур.

Для строительства дерево с MrBayes11первым шагом является соответствие последовательности, которая обычно отображается в формате FASTA, превратить nexus формат (.nex как тип файла). Преобразования nexus формат FASTA файлы могут быть обработаны в мега. Далее соответствие последовательности в формате nexus могут быть загружены в MrBayes. Когда файл успешно загружен, укажите подробные параметры для вычисления дерева. Эти параметры включают такие сведения, как аминокислоты замены модель, колебания ставок, цепь номер марковской цепи Монте-Карло (MCMC) муфты, номер ngen, среднее, стандартное отклонение частоты Сплит и так далее. После того, как эти параметры были заданы, начните вычисления. В конце концов два дерева фигур в код ASC II, один показ клады авторитет и другие длины филиал показываю, будет отображаться на экране.

В результате дерево будут сохранены автоматически как «FileName.nex.con». Этот файл дерево может быть открыт и под редакцией FigTree, и может быть изменен рисунок, отображается в FigTree далее, чтобы сделать его более подходящим для публикации.

В этом исследовании 228 сладкий белков, включая 35 сладости от одноклеточных эукариот и 57 SemiSWEETs от прокариот, были проанализированы в качестве примера. Сладости и SemiSWEETs были охарактеризованы как глюкоза, фруктоза или сахароза перевозчиков через мембраны12,13. Филогенетический анализ свидетельствует о том, что два MtN3/слюны доменов, содержащих конфеты может быть производным от эволюционного синтеза бактериального SemiSWEET и archaeon14.

Protocol

1. последовательность выравнивание Собирать аминокислотных последовательностей эукариотических сладкий и прокариот SemiSWEET в отдельных документах и перечислить их в формате FASTA. Скачайте последовательности от национального центра для биотехнологии информации (NCBI), Европейск…

Representative Results

Филогенетические деревья показывают, что все домены первого MtN3/слюны 35 сладкий последовательностей кластеры как один клады и доменов второго MtN3/слюны сладкий последовательностей, сгруппированы как другой клады. Кроме того результаты выравнивания сладости и SemiSWEETs по…

Discussion

Она становится все более популярным в биологических исследованиях сделать филогенетическое дерево, основанное на нуклеотидных и аминокислотных последовательностей8. Как правило есть три критических этапах практики, включая выравнивание последовательностей, оценки выр?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Эта работа была поддержана Фонд национального естественных наук Китая (31371596), исследовательский центр био технологии, Китай три ущелья университет (2016KBC04) и фонд естественных наук провинции Цзянсу, Китай (BK20151424).

Materials

Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4GB memory, Core 2 or above CPU. Windows 7, Windows 10

References

  1. Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Play Video

Cite This Article
Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

View Video