Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
Een van de belangrijkste vragen in de microbiële ecologie is "wie is daar?" Deze vraag kan worden beantwoord met behulp van verschillende instrumenten, maar een van de langdurige gouden standaard is om 16S ribosomaal RNA (rRNA) gen ampliconen gegenereerd door domain-niveau PCR sequencen reacties amplificeren van genomisch DNA. Traditioneel werd dit uitgevoerd door klonen en Sanger (capillaire elektroforese) sequencing van PCR amplicons. De komst van de next-generation sequencing is enorm vereenvoudigd en vergroot de sequencing diepte voor 16S rRNA-gen sequencing. De introductie van tafelmodel sequencers maakt het nu kleine labs hun 16S rRNA-sequencing in-house uit te voeren in een kwestie van dagen. Hier is een aanpak voor het 16S rRNA-gen amplicon sequencing met behulp van een tafelmodel volgende generatie sequencer gedetailleerd. De milieu DNA wordt eerst geamplificeerd met PCR met gebruik van primers die sequencing adapters en barcodes bevatten. Zij worden dan gekoppeld met bolvormige deeltjes via emulsie PCR. De deeltjes zijn loaded op een wegwerp chip en de chip is in de sequentiemachine waarna de sequencing wordt uitgevoerd geplaatst. De sequenties worden opgehaald FASTQ formaat, gefiltreerd en barcodes gebruikt om het monster lidmaatschap bepalen van de leest. De gefilterde en weggegooid leest worden vervolgens verder geanalyseerd met behulp van publiek beschikbare gereedschappen. Een voorbeeld analyse waar het leest werden ingedeeld met een-taxonomie vinden algoritme binnen het softwarepakket Mothur wordt gegeven. De methode die hier wordt beschreven is eenvoudig, goedkoop en eenvoudig en zou moeten helpen kleinere labo's om te profiteren van de voortgaande genomische revolutie.
Metagenomic sequencing is een zeer krachtige technologie, en richt het geheel van de genetische informatie in een milieumonster. Er zijn verschillende smaken van metagenomic sequencing, waaronder shotgun sequencing, grote inserts bibliotheken en amplicon sequencing. Amplicon sequencing biedt het voordeel dat relatief goedkoop, snel en kan produceren leest uit een genomisch gebied dat algemeen kan worden uitgelijnd. Bovendien wordt de gegevensanalyse workflow amplicon sequencing meestal gestandaardiseerd. Echter, omdat deze is gebaseerd op PCR heeft de vooroordelen betrekking op de onvolledige specificiteit onvolledig zijn en primer spant 1,2, die het de semi-kwantitatieve hoogstens maakt. Verschillende genomische gebieden worden gericht voor amplicon sequencing waaronder functionele genen, maar de meest populaire opties zijn merkergenen zoals het 16S rRNA gen gebruiken om een community profiel genereren. Traditioneel, 16S rRNA-gen amplicon Sequencing werd uitgevoerd middels arbeidsintensieve technieken die klonering in E. coli, kolonieselectie en plasmide-extractie gevolgd door Sanger sequentiebepaling van de geïsoleerde plasmiden, en dus de meeste studies geanalyseerd minder dan 100 klonen per monster. Next-generation sequencing bracht twee belangrijke ontwikkelingen: massieve parallellisatie van de sequencing reacties en, belangrijker nog, klonale scheiding van templates, zonder de noodzaak om de gen fragmenten in te voegen in een gastheer. Dit heeft enorm vereenvoudigd de volgorde van 16S rRNA gen amplicons, die nu terug als routine kenmerk van veel Environmental Microbiology studies, resulterend in een "Renaissance" voor 16S rRNA gen amplicon sequencing 3.
Sinds de komst van Roche 454 sequencing in 2005 4, zijn er verschillende andere next-generation sequencing technologieën op de markt verschenen (bijvoorbeeld Illumina, Solid, PacBio). Meer recent, de invoering van de bench-top sequencers gebracht om kleine labs de sequencing capaciteit ooit exclusief voor grote sequencing centers. Vijf tafelmodel machines zijn momenteel beschikbaar: de 454 GS Junior, de Ion Torrent Personal Genome Machine (PGM) en Proton, en de Illumina MiSeq en NextSeq 500 Terwijl al deze sequencers bieden minder leest per run en minder bases per dollar dan de meeste full- schaal sequencers, zijn ze meer flexibel, snel, en hun lage aanschaf en run kosten maakt ze betaalbaar voor kleine academische laboratoria. Tafelmodel sequencers zijn bijzonder goed geschikt voor amplicon, klein genoom en lage complexiteit metagenoom sequencing in ecologische microbiologie studies, omdat deze vorm van studies over het algemeen niet een extreme diepte van sequencing vereisen. Bijvoorbeeld wordt algemeen aanvaard dat voor 16S rRNA gensequentie bestudeert het aantal leest per monster is niet cruciaal, zo ~ 1000 leest kan dezelfde patronen genereren multi-miljoen leest datasets 5. Dat gezegd hebbende, tafelmodel next-generatio n sequencers nog steeds het genereren van grote hoeveelheden sequence data, met een maximale opbrengst van ~ 35 Mbp (454 GS Junior), ~ 2 GBP (Ion Torrent PGM), ~ 10-15 GBP (Ion Torrent Proton), ~ 10 GBP (Illumina MiSeq) en ~ 100 GBP (Illumina Volgende Seq 500), wat meer dan genoeg voor de meeste natuurlijke microbiologie studies.
Next-generation sequencing van 16S rRNA amplicons gebruikt benchtop sequencers is onlangs toegepast op een grote verscheidenheid van omgevingen. Zo heeft de Ion Torrent PGM is gebruikt voor de gemeenschap analyses van uranium mijnafval dat bijzonder hoge pH en lage permeabiliteit 6 had, gerecirculeerd aquacultuursystemen 7, van koolwaterstof-verontreinigde bodems Arctic 8,9, van oliezandoperatie beïnvloed sedimenten en biofilms van de Athabasca River 10,11, van de rhizosfeer van wilgen geplant in vervuilde bodems 12, van het menselijk en dierlijk lichaam 13-16 en van anaërobe vergisters 17.
jove_content "> In deze bijdrage hebben we detail onze benadering van 16S rRNA-gen ampliconen in-house te sequencen met behulp van een tafelmodel volgende generatie sequencer (de Ion Torrent PGM). Na DNA-extractie, 16S rRNA genen worden versterkt met behulp van domain-niveau bacteriële primers die bevatten sequencing adapters en unieke, sample-specifieke sequenties (barcodes). worden de amplicons gezuiverd, gekwantificeerd en samengevoegd in een equimolaire verhouding. De gepoolde monsters worden vervolgens klonaal versterkt in een emulsie PCR en gesequenced. resulteren sequenties geanalyseerd met behulp van publiek beschikbare bioinformatica ( bv Mothur).De hier gepresenteerde methode is eenvoudig en goedkoop, en moet het mogelijk maken vele laboratoria om de kracht van metagenomic sequencing. Hoewel afhankelijk van de sequencing platform gebruikt, zodra de bibliotheken geconstrueerd weinig hands-on tijd nodig, met de meeste werkwijze worden geautomatiseerd. Voor de sequencing platform hier gebruikt (Ion Torrent PGM), kan de volledige procedure worden uitgevoerd binnen de twee dagen van het werk. Op het moment van schrijven (september 2013), het reagens kosten voor het bovenstaande voorbeeld beschreven is als volgt: PCR-amplificatie van 36 monsters: $ 25, gelzuivering en PicoGreen DNA kwantificering van 36 monsters: $ 125, emulsie PCR voor een samengevoegd amplicon sample : $ 150 en sequentiebepalingsreagentia: $ 250, voor een totaal van $ 550 of $ 15 per monster of $ 0,0015 per kwaliteit gefilterd lezen. Deze prijs is instrument servicecontract, afschrijvingen instrument, technicus salaris en laboratoriumruimte gebruik bevatten.
tent "> Een van de belangrijkste stappen is voor de producten bundelen in een equimolaire verhouding, teneinde soortgelijke aantal halen van leest voor elk van de monsters. PicoGreen kwantificering werd hier gebruikt, maar andere methoden kunnen geschikt, maar minder nauwkeurig (bijvoorbeeld UV kwantificering-gel kwantificering). Zelfs doende de kwantificatie en pooling, er enige variabiliteit in het aantal leest per monster en in typische run in tabel 2, het varieert van 4.380 tot 32.750 leest, met een gemiddelde van 10.338 leest. Indien voor groot aantal monsters (meer dan 40-50), kunnen enkele kolom gel zuivering vervangen door gel zuivering in plaat of zuivering met korrels met een strenge maat cutoff (bijvoorbeeld AMPure korrels) .Tot op heden, de meest gebruikte next-generation sequencing technologie voor de 16S rRNA-gen is 454 De Ion Torrent sequencing technologie die wordt gebruikt in dit protocol is conceptueel zeer vergelijkbaar454 en beide technieken zijn gevoelig voor dezelfde soort sequencingfouten. Vanzelfsprekend werd aangetoond dat Ion Torrent sequencing geleid sequencing resultaten vergelijkbaar met 454 sequencing 10. Recent hebben vele onderzoekers het gebruik van Illumina technologie 16S rRNA gen amplicon sequencing 18,19 onderzocht. In ieder geval zou het gemakkelijk zijn om het huidige protocol voor andere stationaire sequencers zoals de Illumina MiSeq of 454 GS Junior aangepast door het veranderen van de fusie primer sequenties van de adapters en barcodes nodig voor deze sequentietechnologieën passen, zoals in de werkwijze recent beschreven voor de Illumina MiSeq 19. Als alternatief zou de onderzoekers volgen de stappen 1 en 2 van het protocol hier beschreven en stuur de gepoolde amplicons een sequencing centrum waar de emulsie PCR en sequencing zou worden uitgevoerd.
De 16S rRNA gen leest werden geknipt en geclassificeerd middels Mothur, maar veel andere analyses kunnen worden uitgevoerd op16S rRNA gen amplicons. Zo kunnen beta diversiteit worden geëvalueerd door het berekenen van de afstand tussen elk Unifrac monsterparen volgens de procedure beschreven in http://unifrac.colorado.edu/ 20. Alpha diversiteit indices en aantal operationele taxonomische eenheden van elk monster kan worden berekend met gereedschappen in QIIME zoals AmpliconNoise 21 of volgens de procedure Huse et al. 22 en die binnen Mothur geschetst.
De hier gebruikte primers geamplificeerd de variabele gebieden 3 en 4 van het 16S rRNA gen, maar veel andere gebieden kunnen worden aangewezen. In dit onderzoek werden 16S rRNA genen geamplificeerd uit plantaardig materiaal en de keuze van primer werd aan amplificatie van chloroplast 16S rRNA gen 23,24 vermijden. Er is een grote verscheidenheid van andere primers beschikbaar die verschillen in termen van de productlengte, taxonomische kracht en nut 25,26. Echter, in alle gevallen 200-400 bp leest van het 16S rRNA-gen niet betrouwbaar kan worden aangemerkt op het niveau van soorten, en de analyses worden beperkt tot het geslacht en hogere taxonomische niveaus. Andere genen zou beter zijn dat soortniveau informatie nodig, zoals cpn60 en rpoB-genen 27,28. Toekomstige drastische dalingen van de kosten van sequencing en verhogingen van de kracht van analyse-instrumenten zou kunnen maken het mogelijk om 16S rRNA-gen sequencing vervangen door shotgun metagenomica, maar tot die tijd 16S rRNA-gen sequencing blijft de gouden standaard van Environmental Microbiology.
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Reagent | Company | Catalog Number |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 |
Primers and probes | IDT | NA |
Qiaquick Gel Extraction Kit | Qiagen | 28704 |
BSA 20 mg/ml | Roche | 10,711,454,001 |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |