Summary

Den ITS2 Database

Published: March 12, 2012
doi:

Summary

Den ITS2 Database er en arbeidsbenk for fylogenetisk slutning samtidig vurderer sekvens og sekundær struktur av den interne transkribert spacer to. Dette inkluderer datainnsamling med nøyaktig merknader, struktur prediksjon, multiple sekvens-struktur justering og rask tre beregning. I et nøtteskall, forenkler denne arbeidsbenken første fylogenetiske analyser til noen få klikk.

Abstract

Den interne transkribert spacer 2 (ITS2) har blitt brukt som en fylogenetisk markør for mer enn to tiår. Som ITS2 forskning i hovedsak fokusert på den veldig variabel ITS2 sekvens, begrenset det denne markøren til lavnivå fylogeni bare. Imidlertid forbedrer kombinasjonen av ITS2 sekvensen og den svært konservert sekundær struktur fylogenetisk oppløsning 1 og lar fylogenetisk slutning på flere taksonomiske gradene, herunder avgrensning av arter 2-8.

Den ITS2 Database 9 presenterer en uttømmende datasett av interne transkriberte spacer 2 sekvenser fra NCBI GenBank 11 nøyaktig reannotated 10. Etter en merknad av profil Hidden Markov Models (HMM), er den sekundære strukturen i hver sekvens spådd. Først blir det testet hvorvidt et minimum energi basert fold 12 (direkte fold) resultater i en riktig, fire helix eksteriør. Hvis dette ikke er tilfelle, er strukturenspådd av homologi modellering 13. I homologi modellering, er en allerede kjent sekundær struktur overført til en annen ITS2 sekvens, var som sekundær struktur ikke i stand til å kaste riktig i en direkte fold.

Den ITS2 Database er ikke bare en database for lagring og gjenfinning av ITS2 sekvens-strukturer. Det gir også flere verktøy for å behandle dine egne ITS2 sekvenser, inkludert merknader, strukturelle prediksjon, motiv deteksjon og BLAST 14 søk på kombinert sekvens-struktur informasjon. Dessuten integrerer den klippede versjoner av 4SALE 15,16 og ProfDistS 17 for flere sekvens-struktur justering beregning og Neighbor Delta 18 tre ​​gjenoppbygging. Sammen danner de en sammenhengende analyse rørledning fra et første sett av sekvenser til en fylogeni basert på sekvens og sekundær struktur.

I et nøtteskall, forenkler denne arbeidsbenken første fylogenetiske analyser for å barenoen museklikk, mens i tillegg tilby verktøy og data for omfattende storskala analyser.

Protocol

1. Riktig annotering av ITS2 Sequence Åpne ITS2 Database fylogeni arbeidsbenk her: http://its2.bioapps.biozentrum.uni-wuerzburg.de Begynn analyse ved å klikke på "Annotate"-ikonet i avsnittet "Tools". Deretter skriver eller limer du sekvens i sekvensen redaktør øverst på nettsiden. Sekvensen redaktør sjekker automatisk, hvorvidt dine ITS2 sekvenser er gyldige. Velg en HMM modell som passer for dine sekvenser (f.eks Viridiplantae for planter). Begynn prosessen ved å klikke på "Annotate." Ved svever over "hybridize"-ikonet kan du vise et bilde av 5.8S og 28S rRNA hybrid som en bekreftelse av HMM merknadens nøyaktighet. Klikk på den grønne plusstegnet på resultatfilen ITS2 sekvensen for å velge din måte sekundær struktur prediksjon: å forutsi strukturen uten en kjent template, klikk på "Tippe struktur." Hvis du vil bruke din egen mal for homologi modellering, klikk på "modell struktur." 2. Sekundær struktur Prediction Forutsi The Annotated ITS2 sekvensen blir automatisk limt inn i sekvensen redaktør. Slik starter den sekundære strukturen prediksjon med standardinnstillingene, klikker du på "Tippe strukturer"-knappen. Lagre den resulterende ITS2 sekvensen inkludert modellert sekundær struktur i data bassenget ved å klikke på det grønne plusstegnet og deretter "Legg til bassenget." Alternativt kan du legge det til din data bassenget via dra-og slipp (Figur 1). Hvis sekvensen ikke kunne kaste direkte, er de beste resultatene av homologi modellering vist. Lagre den mest passende sekvens-struktur ved å dra og slippe til data bassenget. Alternativt lagre sekvens-struktur i data bassenget med et høyreklikk og deretter et klikk på "Legg til bassenget." Custom Modeling Skriv eller lim inn en eller flere maler (med kjent struktur) i den øvre sekvensen redaktør. Skriv eller lim inn ett eller flere mål sekvenser (uten struktur) inn i den nedre sekvensen redaktør. Klikk på "Tippe beste mal (s)" å starte homologi modellering med standardinnstillinger. De beste mal-målet kombinasjoner er vist i den resulterende listen. Lagre modellert sekvens-struktur (r) av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget." 3. Motif Søk Skriv eller lim inn spørringen sekvens (e) inn i sekvensen redaktør øverst på nettsiden. Velg riktig HMM-modellen (f.eks Viridiplantae for planter). 3.3. Klikk på "Motif søk" for å starte prosessen. ITS2 sekvenser med uthevede motivene er illustrasjonented nederst på nettsiden. Klikk på ikonet ved siden av sekvensen overskriften for å vise motivene fremhevet i den sekundære strukturen. 4. Søk og Bla Søk Skriv enten en taxon navn eller en GenBank Identifier (GI) i søkefeltet øverst på nettsiden. Et søk etter taxon navn er støttet av en vises live-søkeboks. Du kan utføre en multippel søk etter komma skille dine spørsmål. Klikk på "Søk" knappen for å utføre søket. Dine resultater vises oppført i en ny fane. Klikk på en kolonne for å sortere resultatene i henhold til den aktuelle kolonnen. Du kan også legge til eller fjerne kolonner med ditt valg med kolonnen menyen. Kolonnen menyen kan legges inn med et klikk på den vises pilikonet innenfor en kolonne navn. Klikk på "Vis detaljer" for å vise detaljene for en sekvens-struktur. </ Li> Lagre sekvens-struktur (r) av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget." Hvis du vil lagre resultatene dine til en ekstern fil, klikk på "Lagre valg" eller "Lagre alle." Bla Bla gjennom ITS2 Database ved å navigere gjennom trestruktur til venstre på nettsiden. Klikk på et pluss-tegn for å vise taxa ett nivå lavere. Klikk på en taxon navn for å åpne en ny fane som inneholder hver sekvens-struktur taxon. Klikk på "Vis detaljer" for å vise detaljene for en sekvens-struktur par. Lagre sekvens-struktur (r) av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget." Hvis du vil lagre resultatene dine til en ekstern fil, klikk på "Lagre valg" eller "Lagre alle." 5. ITS2 Blast Skriv eller lim en eller flere spørringer sekvenser inn i sekvensen redaktør. Dine sekvenser kan enten være rene nukleotidsekvenser eller sekvens-struktur par. Du kan også skrive flere sekundære strukturer under en sekvens. Ved å krysse av i boksen "serialiserer XXFASTA sekvenser" disse strukturene blir brukt senere som individuelle spørringer. Slik starter BLAST med standardinnstillingene, klikker du på "Blast". Avhengig av art i søket, enten en vanlig BLASTN eller ITS2 sekvens-struktur BLAST er utført. En sub-fane åpnes for hver spørring sekvens innenfor de dukker kategorien "blast Resultater," samt en oversikt over utførte søk. Klikk på "Vis Alignments" for å vise de beregnede BLAST justeringer. Lagre BLAST treff av ditt valg, enten ved å dra og slippe til data bassenget eller ved et høyreklikk og et klikk på "Legg til bassenget." Hvis du vil lagre resultatene dine til en ekstern fil, klikk på "Lagre valg"Eller" Lagre alle. " 6. Flere Sequence-struktur Alignment Ta en titt på din data pool ved å klikke på "Manage datasett" og deretter forstørrelsesglasset symbolet rett ved siden av antall sekvenser i bassenget. Alternativt kan du klikke på data bassenget skiltet nederst til venstre på nettsiden. Klikk på en sekvens-struktur par i din data bassenget for å vise detaljer. For å opprette en multippel sekvens-struktur justering av alle sekvens-struktur pairer i bassenget, klikk på "Analyser datasett" og deretter "Sekvens & Structure". Nå blir du bedt om å velge den grafiske modus for justering din. Hvis justeringen inneholder bare noen få sekvenser, avslår slanke modus ved å klikke "Nei" Ellers velger den slanke grafisk modus ved å klikke "Ja." I noen få øyeblikk, er justeringen vist i en ny fane (Figur 2). Dessuten lagres den automatisk til data bassenget. Hvis du vil lagrejustering til en ekstern fil, klikk på "Lagre justering." 7. Fylogenetisk tre For å beregne en sekvens-struktur basert Naboen Delta tre av multippel alignment, klikk på "Analyser datasett" og deretter "Neighbor Delta." Den resulterende treet er illustrert i en ny fane (figur 3). Skalere treet fritt med rullefeltet "Zoom treet." Reroot treet ved å klikke på en node eller blad av treet og deretter "Reroot på denne noden." Hvis du vil fjerne en taxon fra data pool, klikk på blad og velg "Fjern denne noden from pool". Nå kan du rekalkulere din innretting og tre med redusert taxon prøvetaking. Klikk på "Lagre treet" for å lagre fylogenetisk tre som et endelig resultat av analysen din til en ekstern Newick fil. 8. Ekstra programvare Klikk på "Om denne nettsiden" – "Verktøy" for å finne ytterligere informereasjon om frittstående verktøy 4SALE og ProfDistS. Ved siden av innretting og Neighbor Bli funksjon fra ITS2 Database web-grensesnittet, kan du nå få tilgang til flere nye funksjoner, for eksempel avgrensning av arter basert på kompenserende grunnleggende endringer (cbcs). 9. Representative Resultater Arbeidsflyten som beskrevet ovenfor har med hell blitt brukt i flere open access undersøkelser 3,4. Eksempler kan ses gjennom følgende linker: http://www.plosone.org/article/info% 3Adoi% 2F10.1371% 2Fjournal.pone.0016931 http://www.biomedcentral.com/1756-0500/3/320 I disse store studiene, kunne vi løse fylogeni av Chlorophyta samt Hypnales (Bryophyta) wed høy oppløsning. I begge tilfellene ble en uttømmende taxon prøvetaking hentet fra ITS2 Database 9, automatisk justert med 4SALE 15,16 og til slutt behandles av ProfDistS 17 inn i et fylogenetisk tre. I alle disse trinnene, ble sekvens og struktur informasjon som brukes samtidig. Bootstrap støtte for fylogenetisk ryggraden ble oppnådd ved hjelp Profile Neighbor Delta (PNJ) 19, som er tilgjengelig i den frittstående versjonen av ProfDistS. For et mindre sett av sekvens-struktur par, tallene 1 til 3 beskriver de viktigste trinnene i denne automatisert arbeidsflyt 5 direkte på den nye ITS2 Database arbeidsbenk: taxon prøvetaking, med flere sekvens-struktur justering og til slutt fylogenetisk tre beregningen. Figur 1. Taxon sampling per dra og slipp. Til enhver tid sekvenser eller sekvens-Struktur e parene kan legges til data bassenget, for eksempel ved å dra og slipp. Her er en sekvens-struktur er lagt hjelp av dra og slipp etter sekundær struktur prediksjon. Den blå ellipsen markerer området der sekvens-strukturen er utelatt i data bassenget. Klikk her for å vise i full størrelse versjon av dette bildet. Figur 2. Multippel sekvens-struktur justering i full grafisk modus. For de få sekvensene i data bassenget, ble full grafikk modus valgt. Baser er farget; basepar kan bli markert med røde sirkler ved å klikke på en base eller brakett av en base par. Klikk her for å vise i full størrelse versjon av dette bildet. 3.jpg "alt =" Figur 3 "/> Figur 3. Sequence-struktur Naboen Bli treet. Den fritt skalerbare tre beregnet av en syv taxa flere sekvens-struktur justering kan lagres i Newick format.

Discussion

Den ITS2 Database er en komplett og fullt funksjonell arbeidsbenk for interne transkriberte spacer 2 sekvens-struktur-baserte fylogeni. Nettstedet kan betjenes svært raskt og intuitivt. Mens andre web-baserte fylogeni arbeidsbenker som ARB 20 eller Mobyle 21 er bare i stand til å arbeide på sekvens og / eller konsensus strukturere informasjon, vurderer ITS2 Database 9 sekvenser og individuelle sekundære strukturer for hver taxon samtidig. Men på grunn av begrensninger i regnekapasitet av web server, er det sterkt anbefalt å bruke de frittstående verktøy for flersekvenssammenstilling og nabo Delta 18 beregningen, 15,16 4SALE og ProfDistS 17, henholdsvis for store datasett. Ved siden av grunnleggende ITS2 sekvens-struktur fylogeni arbeidsflyt 5, disse verktøyene har flere tilleggsfunksjoner, som beregning bootstrap gjentak, Profile Neighbor Delta (PNJ) 19 eller species avgrensing basert på kompenserende grunnleggende endringer (cbcs) 8. De kan nås via "Om denne nettsiden" – "Verktøy"-delen for nedlasting og detaljert informasjon. Slik bruker 4SALE og ProfDistS, å det er nødvendig alltid bringe filer til riktig format. En art prøvetaking skal behandles av 4SALE må ha slutt. Fasta eller. Txt, må mens sekvens-struktur justering som en inngang for ProfDistS ender med. Xfasta.

Vi er for tiden å implementere alternative metoder for fylogenetisk tre gjenoppbygging i ITS2 databasen så vel som i de relaterte verktøy. Dermed vil metoder som sekvens-struktur-baserte Maksimal parsimony 22 og / eller Maksimum Likelihood 23 være tilgjengelig i fremtiden.

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

Vi hjertelig takker ITS2 gruppen, Biocenter, Universitetet i Würzburg, for rike og verdifulle tilbakemeldinger. Vi takker også Deutsche Forschungsgemeinschaft (DFG, tilskudd Mu-2831/1-1) for finansiering.

Materials

Name of the reagent Company Comments
Internet access   Preferably high-speed
ITS2 Database9 Department of Bioinformatics, University of Würzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 Department of Bioinformatics, University of Würzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 Department of Bioinformatics, University of Würzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

Referencias

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE – A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. o. l. f. g. a. n. g. ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Play Video

Citar este artículo
Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

View Video