The ITS2 Database

Benjamin Merget; Christian Koetschan; Thomas Hackl; Frank F&#246;rster; Thomas Dandekar; Tobias M&#252;ller; J&#246;rg Schultz; Matthias Wolf

doi:10.3791/3806

JoVE Journal > Biology

Biology

O Banco de Dados ITS2

Published: March 12, 2012

doi:

10.3791/3806

Benjamin Merget^1,2, Christian Koetschan¹, Thomas Hackl¹, Frank Förster¹, Thomas Dandekar¹, Tobias Müller¹, Jörg Schultz¹, Matthias Wolf¹

¹Department of Bioinformatics, Biocenter,University of Würzburg, ²Institute of Pharmacy and Food Chemistry,University of Würzburg

Summary

O Banco de Dados ITS2 é uma seqüência de bancada para inferência filogenética e, simultaneamente, considerando a estrutura secundária do espaçador interno transcrito 2. Isto inclui a coleta de dados com anotações precisas, a previsão de estrutura, alinhamento de sequências-estrutura múltipla e cálculo árvore rápido. Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a alguns cliques.

Abstract

O espaçador interno transcrito 2 (ITS2) tem sido utilizado como um marcador filogenética para mais de duas décadas. Como ITS2 pesquisa voltada principalmente para a seqüência ITS2 muito variável, confinado este marcador de baixo nível filogenética apenas. No entanto, a combinação da sequência ITS2 ea sua estrutura altamente conservada secundário melhora a resolução filogenética ¹ e permite inferência filogenética em fileiras múltiplas taxonómicos, incluindo espécies de delimitação ^2-8.

O Banco de Dados ITS2 ⁹ apresenta um conjunto de dados exaustivo de espaçadores internos transcritos 2 seqüências do NCBI GenBank ¹¹ precisão reannotated ^10. Após uma anotação por Modelos Hidden Markov perfil (HMMs), a estrutura secundária de cada sequência é previsto. Primeiro, ele é testado se um mínimo de energia com base vezes ¹² (vezes direta) resulta em uma correta conformação hélice, quatro. Se este não for o caso, a estrutura épredita por modelagem homologia ^13. Em modelagem de homologia, uma estrutura já conhecida secundário é transferido para outra sequência de ITS2, cuja estrutura secundária não foi capaz de dobrar correctamente numa dobra directa.

O Banco de Dados ITS2 não é apenas um banco de dados para armazenamento e recuperação de ITS2 seqüência-estruturas. Ele também fornece várias ferramentas para processar as suas próprias sequências de ITS2, incluindo previsão, anotação estrutural, detecção e motivo de pesquisa BLAST ¹⁴ no combinadas informações de seqüência-estrutura. Além disso, integra as versões cortadas dos 4SALE ^15,16 e ProfDistS ¹⁷ para cálculo alinhamento múltiplo de seqüência-estrutura e vizinho Unindo ¹⁸ reconstrução da árvore. Juntos, eles formam um gasoduto análise coerente de um conjunto inicial de seqüências de uma filogenia baseada na seqüência e estrutura secundária.

Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a apenasalguns cliques do mouse, enquanto que, adicionalmente, fornecendo ferramentas e dados para abrangentes análises em larga escala.

Protocol

1. Anotação correta de ITS2 Sequence Acesse a bancada filogenia ITS2 banco de dados aqui: http://its2.bioapps.biozentrum.uni-wuerzburg.de Comece sua análise clicando no botão "Anotar" ícone na seção "Ferramentas". Em seguida, digite ou cole a sua seqüência no editor de seqüência no topo do site. O editor de seqüência verifica automaticamente, se as suas sequências de ITS2 são válidos. Escolha um modelo HMM adequado às suas sequências (por exemplo Viridiplantae para as plantas). Inicie o processo clicando em "Anotar". Passando o mouse sobre o ícone "Combine", você pode ver uma imagem do 5.8S e 28S rRNA híbrido como uma confirmação de precisão a anotação do HMM. Clique no sinal de adição verde da seqüência resultante ITS2 para selecionar o seu modo de predição de estrutura secundária: Para prever a estrutura sem templat conhecidoe, clique em "Prever estrutura." Se você quiser usar o seu próprio modelo para a modelagem de homologia, clique em "estrutura do modelo." 2. Previsão de Estrutura Secundária Predizer A seqüência ITS2 anotada é automaticamente colado no editor de seqüência. Para iniciar a previsão de estrutura secundária com as configurações padrão, clique em "Prever estruturas" botão. Salvar a seqüência ITS2 resultante, incluindo a estrutura modelada secundário no conjunto de dados, clicando no sinal de mais verde e, em seguida, "Adicionar à piscina." Alternativamente, você pode adicioná-lo à sua reserva de dados através de drag and drop (Figura 1). Se a seqüência não poderia dobrar diretamente, os melhores resultados da modelagem de homologia são mostradas. Salve o mais adequado seqüência-estrutura através de arrastar e soltar para o conjunto de dados. Como alternativa, salve a seqüência-estrutura para o conjunto de dados com um clique direito e depois um clique em "Adicionar ao pool." Modelagem Personalizada Escreva ou cole modelos de um ou múltiplos (com estrutura conhecida) para o editor seqüência superior. Escreva ou cole uma ou várias sequências alvo (sem estrutura) para o editor seqüência inferior. Clique em "Prever o melhor modelo (s)" para iniciar a modelagem de homologia com as configurações padrão. As melhores modelo alvo combinações são mostrados na lista resultante. Salve o modelado seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool." 3. Pesquisa Motif Digite ou cole a seqüência de consulta (s) no editor de seqüência no topo do site. Escolha o modelo HMM correta (por exemplo Viridiplantae para as plantas). 3,3. Clique em "busca do motivo" para iniciar o processo. ITS2 sequências com motivos, destacam-se illustrated na parte inferior do site. Clique no ícone ao lado do cabeçalho sequência, para apresentar os motivos destacados na estrutura secundária. 4. Pesquise e navegue Pesquisar Digite um nome de táxon ou um identificador GenBank (GI) no campo de pesquisa no topo do site. Uma busca pelo nome taxon é apoiado por uma caixa de aparecer ao vivo de pesquisa. Você pode realizar uma busca múltipla por vírgula separando as suas dúvidas. Clique no botão "Procurar" para executar a pesquisa. Os resultados aparecerão listados em uma nova aba. Clique no nome de uma coluna para classificar os resultados de acordo com a coluna particular. Você também pode adicionar ou remover colunas de sua escolha com o menu da coluna. O menu da coluna pode ser inserido com um clique no ícone da seta que aparece dentro de um nome de coluna. Clique em "Mostrar detalhes" para ver os detalhes de uma sequência-estrutura. </ Li> Salvar a seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool." Para salvar os resultados para um arquivo externo, clique em "Salvar seleção" ou "Salvar tudo". Procurar Navegar na Base de Dados ITS2 navegando pela estrutura de árvore à esquerda do site. Clique em uma mais-sinal para ver a taxa um nível inferior. Clique no nome de um taxon para abrir uma nova guia contendo cada seqüência-estrutura do taxon. Clique em "Mostrar detalhes" para ver os detalhes de um par de seqüência-estrutura. Salvar a seqüência-estrutura (s) de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e clique em "Adicionar ao pool." Para salvar os resultados para um arquivo externo, clique em "Salvar seleção" ou "Salvar tudo". 5. Explosão ITS2 Digite ou cole uma ou várias seqüências de consulta para o editor seqüência. Suas seqüências podem ser tanto simples sequências de nucleótidos ou seqüência-estrutura pares. Você também pode digitar várias estruturas secundárias abaixo uma seqüência. Ao marcar a caixa "Serialize seqüências XXFASTA" estas estruturas são usadas posteriormente como consultas individuais. Para iniciar o BLAST com as configurações padrão, clique em "Blast". Dependendo da natureza da sua consulta, quer BLASTN um comum ou no ITS2 BLAST sequência-estrutura é executada. A sub-aba é aberta para cada seqüência de consulta dentro dos que aparecem na guia "Resultados explosão", bem como uma visão geral das pesquisas realizadas. Clique em "Alinhamentos Mostrar" para ver os alinhamentos BLAST calculados. Salve os hits BLAST de sua escolha, quer através de arrastar e soltar para o conjunto de dados ou por um clique direito e um clique em "Adicionar ao pool." Para salvar os resultados para um arquivo externo, clique em "Salvar seleção"Ou" Salvar tudo ". 6. Alinhamento de seqüências-estrutura múltipla Dê uma olhada no seu conjunto de dados, clicando em "Gerenciar conjunto de dados" e, em seguida, o símbolo da lupa ao lado do número de seqüências em sua piscina. Alternativamente, você pode clicar no sinal de pool de dados na parte inferior esquerda do site. Clique em um par de seqüência-estrutura em seu conjunto de dados para exibir seus detalhes. Para criar um alinhamento de sequências-estrutura múltipla de todos os pares seqüência-estrutura em sua piscina, clique em "conjunto de dados Analisar" e depois "Seqüência e Estrutura". Agora é-lhe pedido para seleccionar o modo gráfico do seu alinhamento. Se o seu alinhamento contém apenas algumas seqüências, recusar o modo fino, clicando em "Não" Caso contrário, escolha o modo fino gráfico clicando em "Sim". Em alguns momentos, o seu alinhamento é mostrado em uma nova aba (Figura 2). Além disso, ele é salvo automaticamente para o conjunto de dados. Para salvar o seualinhamento para um arquivo externo, clique em "Salvar alinhamento." 7. Árvore filogenética Para calcular uma seqüência de Neighbor-estrutura baseada em Unir em árvore do seu alinhamento múltiplo, clique em "Dataset Analisar" e depois "Neighbor Unir". A árvore resultante é ilustrado em uma nova aba (Figura 3). Escale a sua árvore livremente com a barra de rolagem "árvore Zoom". Reroot sua árvore clicando em um nó ou folha da árvore e, em seguida, "Reroot neste nó." Se você quiser remover um taxon de seu conjunto de dados, clique na folha e escolha "Remover este nó de piscina." Agora você pode recalcular o seu alinhamento e árvore com a amostragem taxon reduzida. Clique em "árvore Save" para salvar sua árvore filogenética como um resultado final de sua análise para um arquivo Newick externo. 8. Software adicional Clique em "Sobre este site" – "Ferramentas" para encontrar adicional informarção sobre o 4SALE ferramentas stand-alone e ProfDistS. Ao lado do alinhamento e função Vizinho Juntando fornecido pela interface ITS2 banco de dados web, agora você pode acessar várias funções novas, a delimitação das espécies por exemplo, com base nas alterações de base de compensação (CBCS). 9. Os resultados representativos O fluxo de trabalho, como descrito acima foi utilizada com sucesso em vários inquéritos de acesso aberto 3,4. Exemplos podem ser vistos através dos seguintes links: http://www.plosone.org/article/info%% 3Adoi 2F10.1371% 2Fjournal.pone.0016931 http://www.biomedcentral.com/1756-0500/3/320 Nestes estudos de grande escala, nós fomos capazes de resolver a filogenia de Chlorophyta, bem como Hypnales (Bryophyta) wom alta resolução. Em ambos os casos, uma amostragem taxon exaustiva foi recolhida a partir do banco de dados ITS2 9, automaticamente alinhado com 4SALE 15,16 e finalmente processada por ProfDistS 17 em uma árvore filogenética. Em todos estes passos, a sequência e estrutura de informação foram utilizados simultaneamente. Suporte Bootstrap para a espinha dorsal filogenética foi conseguida utilizando Vizinho perfil de união (PNJ) 19, que está disponível na versão autónoma do ProfDistS. Para um conjunto menor de seqüência-estrutura pares, figuras 1 a 3 descrevem os principais passos deste fluxo de trabalho automatizado 5 diretamente na bancada banco de dados novo ITS2: amostragem taxonômica, o alinhamento da seqüência de estrutura de múltiplas e, eventualmente, o cálculo árvore filogenética. Figura 1. Amostragem Taxon por arrastar e soltar. Em qualquer seqüência de tempo ou seqüência estru- pares de e podem ser adicionados ao conjunto de dados, por exemplo através de arrastar e gota. Aqui uma sequência-estrutura é adicionado usando a função arrastar e soltar depois de predição de estrutura secundária. A elipse azul marca a área onde a seqüência de estrutura é jogada na piscina de dados. Clique aqui para ver a versão completa do tamanho desta imagem. Figura 2. Alinhamento da seqüência-estrutura múltipla no modo gráfico completo. Para as sequências de poucos no conjunto de dados, o modo completo gráfico foi escolhido. Bases são coloridos; pares de bases podem ser destacados com círculos vermelhos clicando em uma base ou suporte de um par de base. Clique aqui para ver a versão completa do tamanho desta imagem. "Alt =" 3.jpg Figura 3 "/> Figura 3. Vizinho Sequence-estrutura Juntando árvore. A árvore livremente escalável calculado de sete táxons alinhamento da seqüência de estrutura de múltiplas podem ser salvos no formato Newick.

Discussion

O Banco de Dados ITS2 é uma bancada completa e totalmente funcional para espaçadores internos transcritos 2 seqüência-estrutura-base filogenética. O site pode ser operado muito rápida e intuitiva. Enquanto outras bancadas baseados na web como filogenia ARB ²⁰ ou ²¹ Mobyle só são capazes de trabalhar em seqüência e / ou informação sobre a estrutura de consenso, o banco de dados ITS2 ⁹ considera seqüências e estruturas secundárias individuais para cada taxon simultaneamente. No entanto, devido a limitações na capacidade computacional do servidor web, é altamente recomendável usar as ferramentas stand-alone para alinhamento múltiplo e Neighbor Unindo ¹⁸ cálculo, 4SALE ^15,16 e ProfDistS ^17, respectivamente, para grandes conjuntos de dados. Além do básico de fluxo de trabalho filogenia ITS2 sequência ^estrutura-5, essas ferramentas apresentam várias funções adicionais, como calcular bootstrap repetições, vizinho Perfil Unir (PNJ) ¹⁹ ou espéciedelimitação s com base nas alterações de base de compensação (CBCS) ^8. Eles podem ser acessados através do "Sobre este site" – seção "Ferramentas" para download e informações mais detalhadas. Para usar 4SALE e ProfDistS, é necessário sempre trazer os arquivos para o formato correto. Um táxon de amostragem para serem processados pelo 4SALE deve ter o final. Fasta ou. Txt, enquanto que o alinhamento da seqüência-estrutura como uma entrada para ProfDistS deve terminar com. Xfasta.

Estamos presentemente a implementação métodos alternativos para reconstrução filogenética árvore no banco de dados ITS2, bem como nas ferramentas relacionadas. Assim, métodos como seqüência-estrutura baseada em Máxima Parcimônia ²² e / ou máxima verossimilhança ^{23 estarão} acessíveis no futuro.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Nós cordialmente agradecer ao grupo ITS2, centro biológico, da Universidade de Würzburg, para o feedback rico e valioso. Agradecemos também o Deutsche Forschungsgemeinschaft (DFG; concessão Mu-2831/1-1) para financiamento.

Materials

Name of the reagent	Company	Comments
Internet access		Preferably high-speed
ITS2 Database⁹	Department of Bioinformatics, University of Würzburg	Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE^15,16	Department of Bioinformatics, University of Würzburg	Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS¹⁷	Department of Bioinformatics, University of Würzburg	Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

References

Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE – A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
Ludwig, W. o. l. f. g. a. n. g. ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

Automatically Generated

O Banco de Dados ITS2

Summary

Abstract

Protocol

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Automatically Generated

O Banco de Dados ITS2

Summary

Abstract

Protocol

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below