Summary

Il ITS2 Database

Published: March 12, 2012
doi:

Summary

Il database ITS2 è un banco di lavoro per la sequenza di inferenza filogenetica simultaneamente e considerando la struttura secondaria del spaziatore interno trascritto 2. Ciò include la raccolta di dati con annotazioni accurate, predizione della struttura, di sequenze multiple-struttura di allineamento e di calcolo albero veloce. In poche parole, questo banco di lavoro semplifica analisi filogenetiche primi pochi click.

Abstract

Lo spaziatore interno trascritto 2 (ITS2) è stato utilizzato come marcatore filogenetica per più di due decenni. Come ITS2 ricerca principalmente focalizzata sulla sequenza ITS2 molto variabile, ha limitato questo indicatore a basso livello solo filogenesi. Tuttavia, la combinazione della sequenza ITS2 e la sua struttura altamente conservata secondaria migliora la risoluzione filogenetica 1 e permette inferenza filogenetica a ranghi tassonomici multipli, comprese le specie delimitazione 2-8.

Il ITS2 Database 9 presenta un set di dati esaustiva di interni trascritti distanziali 2 sequenze da NCBI GenBank 11 precisione reannotated 10. A seguito di un'annotazione profilo Models Hidden Markov (HMM), la struttura secondaria di ciascuna sequenza è previsto. In primo luogo, viene testato se un minimo di energia basata volte 12 (diretta volte) i risultati in una corretta, conformazione elica quattro. Se questo non è il caso, la struttura èprevisto dalla modellazione omologia 13. Nella modellazione omologia, una struttura già noto secondaria viene trasferita ad un'altra sequenza ITS2, la cui struttura secondaria non era in grado di piegare correttamente in una piega diretta.

Il database ITS2 non è solo un database per l'archiviazione e il recupero di ITS2 sequenza-strutture. Inoltre fornisce diversi strumenti per elaborare le proprie ITS2 sequenze, tra cui l'annotazione, la previsione strutturale, individuazione dei motivi e BLAST 14 ricerca sul combinato sequenza-struttura informativa. Inoltre, integra le versioni tagliate di 4SALE ProfDistS 15,16 e 17 per sequenze multiple-struttura calcolo di allineamento e Neighbor Joining 18 ricostruzione albero. Insieme formano un pipeline coerente analisi da una prima serie di sequenze di una filogenia basata sulla sequenza e struttura secondaria.

In poche parole, questo banco di lavoro semplifica analisi filogenetiche primi solopochi clic del mouse, mentre fornisce inoltre strumenti e dati completi per analisi su vasta scala.

Protocol

1. Annotazione corretta di Sequence ITS2 Accedi al banco di lavoro ITS2 filogenesi Database qui: http://its2.bioapps.biozentrum.uni-wuerzburg.de Iniziate la vostra analisi facendo clic sull'icona "annotazione" nella sezione "Strumenti". Quindi, digitare o incollare la sequenza nell'editor di sequenza nella parte superiore del sito. L'editor di sequenza controlla automaticamente, se i vostri sequenze ITS2 sono validi. Scegli un modello HMM adatto per le sequenze (ad esempio Viridiplantae per le piante). Avviare il processo facendo clic su "Annota". Posizionando il mouse sopra l'icona "ibridazione" è possibile visualizzare un'immagine del 5.8S e 28S rRNA ibrida come una conferma di precisione l'annotazione di HMM. Fare clic sul segno più verde della risultante ITS2 sequenza per selezionare il modo di predizione della struttura secondaria: Per prevedere la struttura senza templat notae, cliccare su "Indovina struttura". Se si desidera utilizzare un modello personalizzato per l'omologia Modeling, fare clic su "struttura modello". 2. Structure Prediction secondaria Predire La sequenza ITS2 annotato viene automaticamente incollato nell'editor sequenza. Per avviare la previsione della struttura secondaria con le impostazioni predefinite, fare clic sul pulsante "Predict strutture". Salvare la sequenza ITS2 risultante compresa la struttura modellata secondaria nel pool di dati facendo clic sul segno più di colore verde e poi "Aggiungi alla piscina." In alternativa, è possibile aggiungerlo alla tua riserva di dati tramite drag and drop (Figura 1). Se la sequenza non poteva piegare direttamente, i migliori risultati della modellazione omologia sono mostrati. Salvare il più adatto sequenza-struttura di via drag and drop per il pool di dati. In alternativa, salvare la sequenza-struttura in piscina dati con un click destro e poi un clic su "Aggiungi al pool." Modeling personalizzato Digita o incolla uno o più modelli (con struttura nota) nell'editor sequenza superiori. Digita o incolla sequenze bersaglio uno o più (senza struttura) nell'editor sequenza inferiore. Clicca su "Predict migliori template (s)" per avviare la Modeling omologia con le impostazioni predefinite. I migliori template bersaglio combinazioni sono mostrati nella lista risultante. Salvare la sequenza di modellato-struttura (s) di vostra scelta sia via drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool." 3. Motif Search Digitare o incollare la sequenza query (s) nell'editor sequenza nella parte superiore del sito. Scegli il modello corretto HMM (ad esempio Viridiplantae per le piante). 3,3. Clicca su "search Motif" per avviare il processo. ITS2 sequenze con motivi evidenziate sono le illustrazioniTed sul fondo del sito. Fare clic sull'icona accanto alla sequenza di intestazione per visualizzare i motivi evidenziati nella struttura secondaria. 4. Cerca e Consulta Cerca Digitare il nome di un taxon o di un identificatore GenBank (GI) nel campo di ricerca nella parte superiore del sito. Una ricerca per nome taxon è supportato da uno che appare live-search box. È possibile eseguire una ricerca multipla da una virgola di separazione vostre domande. Fare clic sul pulsante "Cerca" per eseguire la ricerca. I risultati appaiono elencati in una nuova scheda. Fare clic su un nome della colonna per ordinare i risultati in base alla particolare colonna. È inoltre possibile aggiungere o rimuovere colonne di vostra scelta con il menu della colonna. Il menu della colonna è possibile inserire con un clic sulla freccia che appare all'interno di un nome di colonna. Clicca su "Visualizza dettagli" per visualizzare i dettagli di una sequenza-struttura. </ Li> Salvare la sequenza-struttura (s) di vostra scelta o tramite drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool." Per salvare i risultati in un file esterno, fare clic su "Salva selezione" o "Salva tutto". Sfogliare Sfoglia il database ITS2 navigando attraverso la struttura ad albero a sinistra del sito. Fare clic sul segno più per visualizzare i taxa di un livello inferiore. Clicca sul nome taxon per aprire una nuova scheda contenente ogni sequenza-struttura del taxon. Clicca su "Visualizza dettagli" per visualizzare i dettagli di una sequenza-struttura di coppia. Salvare la sequenza-struttura (s) di vostra scelta o tramite drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool." Per salvare i risultati in un file esterno, fare clic su "Salva selezione" o "Salva tutto". 5. ITS2 Blast Digitare o incollare le sequenze di uno o più di query nell'editor di sequenza. Le sequenze possono essere sia semplici sequenze nucleotidiche o sequenza-struttura coppie. È inoltre possibile digitare diverse strutture secondarie di seguito una sequenza. Selezionando la casella "Serialize sequenze XXFASTA" queste strutture sono utilizzate in seguito come singole query. Per iniziare BLAST con le impostazioni predefinite, fare clic su "Blast". A seconda della natura della query, o un BLASTN comune o la sequenza di ITS2 struttura BLAST viene eseguita. Un sub-scheda è aperto per ogni sequenza query all'interno del appaiono scheda "Risultati BLAST", nonché una panoramica delle ricerche eseguite. Clicca su "Allineamenti Mostra" per visualizzare gli allineamenti BLAST calcolati. Salva i colpi BLAST di vostra scelta o tramite drag and drop per il pool di dati o da un tasto destro del mouse e un clic su "Aggiungi al pool." Per salvare i risultati in un file esterno, fare clic su "Salva selezione"O" Salva tutto ". 6. Sequenze multiple-struttura di allineamento Date un'occhiata al vostro pool di dati facendo clic su "Gestione dataset" e poi il simbolo della lente d'ingrandimento accanto al numero di sequenze in piscina. In alternativa, è possibile fare clic sul segno pool di dati in basso a sinistra del sito. Fare clic su una sequenza di struttura coppia in pool di dati per visualizzarne i dettagli. Per creare un multiplo di sequenza-struttura di allineamento di tutte le coppie sequenza-struttura nella piscina, fare clic su "Analizza dataset" e poi "Sequenza e struttura". Ora vi viene chiesto di selezionare la modalità grafica del proprio allineamento. Se il vostro allineamento contiene solo alcune sequenze, rifiutare il modo sottile facendo clic su "No" In caso contrario, scegliere la modalità grafica snella facendo clic su "Sì". In pochi istanti, l'allineamento viene visualizzato in una nuova scheda (Figura 2). Inoltre, viene automaticamente salvato nella pool di dati. Per salvare ill'allineamento in un file esterno, fare clic su "Salva l'allineamento". 7. Albero filogenetico Per calcolare una sequenza-struttura approssimati basati Partecipare ad albero del vostro allineamento multiplo, clicca su "Analizza Dataset" e poi "prossimo Joining". La struttura risultante è illustrata in una nuova scheda (Figura 3). Scalare il vostro albero liberamente con la barra di scorrimento "albero Zoom". Reroot il vostro albero facendo clic su un nodo o foglia dell'albero e poi "Reroot a questo nodo." Se si desidera rimuovere un taxon dal pool di dati, fare clic sulla foglia e scegliere "Rimuovi questo nodo dalla piscina". Ora è possibile ricalcolare l'allineamento e l'albero con il campionamento taxon ridotta. Clicca su "albero Save" per salvare l'albero filogenetico come risultato finale della sua analisi in un file esterno NEWICK. 8. Software aggiuntivo Clicca su "Informazioni su questo sito" – "Strumenti" per trovare ulteriori informarezione per la stand-alone 4SALE strumenti e ProfDistS. Oltre l'allineamento e la funzione prossimo Partecipare fornita dall'interfaccia web ITS2 Database, è ora possibile accedere a diverse nuove funzioni, la delimitazione delle specie ad esempio, sulla base delle variazioni compensative di base (CBC). 9. Risultati rappresentativi Il flusso di lavoro come descritto sopra è stata applicata con successo in una serie di indagini ad accesso aperto 3,4. Gli esempi possono essere visti attraverso i seguenti link: http://www.plosone.org/article/info%%% 3Adoi 2F10.1371 2Fjournal.pone.0016931 http://www.biomedcentral.com/1756-0500/3/320 In questi studi su larga scala, siamo stati in grado di risolvere la filogenesi di Chlorophyta così come Hypnales (Bryophyta) wesimo alta risoluzione. In entrambi i casi, un campionamento taxon esaustivo è stato raccolto dal Database ITS2 9, automaticamente allineato con 4SALE 15,16 e infine trattati da ProfDistS 17 in un albero filogenetico. In tutti questi passaggi, la sequenza e le informazioni della struttura sono stati utilizzati contemporaneamente. Bootstrap sostegno per la spina dorsale filogenetica è stata ottenuta utilizzando prossimo Profilo di giunzione (PNJ) 19, che è disponibile in versione stand-alone di ProfDistS. Per un insieme ridotto di sequenza-struttura coppie, figure da 1 a 3 descritte le fasi principali di questo flusso di lavoro automatizzato 5 direttamente sul nuovo ITS2 workbench Database: campionamento taxon, il multiplo di sequenza-struttura di allineamento e, infine, il calcolo albero filogenetico. Figura 1. Taxon di campionamento per il drag and drop. In tutte le sequenze temporali o sequenza di strut- coppie di e può essere aggiunto al pool di dati, ad esempio tramite drag and drop. Qui una sequenza-struttura viene aggiunto utilizzando il drag and drop dopo la predizione di struttura secondaria. L'azzurro segna ellisse l'area in cui è caduto la sequenza-struttura nel pool di dati. Clicca qui per vedere la versione full-size di questa immagine. Figura 2. Multipla sequenza-struttura di allineamento in modalità completamente grafica. Per le sequenze pochi nel pool di dati, la modalità di un elemento grafico è stato scelto. Le basi sono colorati; coppie di basi può essere evidenziato con cerchi rossi cliccando su una base o staffa di una coppia di basi. Clicca qui per vedere la versione full-size di questa immagine. 3.jpg "alt =" Figura 3 "/> Figura 3. Sequenza-struttura di Neighbor Joining albero. L'albero liberamente scalabile calcolato di un taxa sette sequenze multiple-struttura di allineamento possono essere salvati nel formato NEWICK.

Discussion

Il Database ITS2 è un banco di lavoro completo e pienamente funzionale per interni trascritti spacer 2 sequenza-struttura-base di filogenesi. Il sito web può essere utilizzato molto veloce e intuitivo. Mentre gli altri web-based banchi filogenesi come ARB Mobyle 20 o 21 sono solo in grado di lavorare su sequenza e / o struttura informativa consenso, il ITS2 Database 9 considera le singole sequenze e strutture secondarie per ogni taxon simultaneamente. Tuttavia, a causa delle limitazioni nella capacità di calcolo del server web, si raccomanda di utilizzare gli strumenti stand-alone per l'allineamento multiplo e Neighbor Joining 18 calcolo, 4SALE ProfDistS 15,16 e 17, rispettivamente, per grandi dataset. Accanto alla base ITS2 sequenza-struttura del flusso di lavoro filogenesi 5, questi strumenti dispongono di numerose funzioni aggiuntive, come il calcolo bootstrap replica, Neighbor Joining Profile (PNJ) 19 o speciedelimitazione s sulla base delle variazioni compensative di base (CBC) 8. È possibile accedere attraverso la "Informazioni su questo sito" – sezione "Tools" per il download e informazioni dettagliate. Per utilizzare 4SALE e ProfDistS, è necessario portare sempre con file nel formato corretto. Un taxon campionamento per essere trattati da 4SALE deve avere il finale. Fasta o. Txt, mentre la sequenza-struttura di allineamento come input per ProfDistS deve terminare con. Xfasta.

Si stanno applicando metodi alternativi per la ricostruzione albero filogenetico nel database ITS2 nonché nei relativi strumenti. Così, metodi come la sequenza-struttura-based massima parsimonia 22 e / o Maximum Likelihood 23 sarà accessibile in futuro.

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

Siamo lieti di ringraziare il gruppo ITS2, Biocenter, Università di Würzburg, per il feedback ricca e preziosa. Ringraziamo anche la Deutsche Forschungsgemeinschaft (DFG; sovvenzione Mu-2831/1-1) per il finanziamento.

Materials

Name of the reagent Company Comments
Internet access   Preferably high-speed
ITS2 Database9 Department of Bioinformatics, University of Würzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 Department of Bioinformatics, University of Würzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 Department of Bioinformatics, University of Würzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

Referencias

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE – A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. o. l. f. g. a. n. g. ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Play Video

Citar este artículo
Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

View Video