Summary

Faag phenomics: Fysiologische Approaches te karakteriseren Novel virale eiwitten

Published: June 11, 2015
doi:

Summary

Here, we present phenomic approaches for the functional characterization of putative phage genes. Techniques include a developed assay capable of monitoring host anabolic metabolism, the Multi-phenotype Assay Plates (MAPs), in addition to the established method of metabolomics, capable of measuring effects to catabolic metabolism.

Abstract

Lopende onderzoeken in faag-gastheer interacties zijn afhankelijk van het extrapoleren van de kennis van (meta) genoom. Interessant 60-95% van faag sequenties delen geen homologie bij lopende geannoteerde eiwitten. Dientengevolge, een groot deel van faag genen geannoteerd als hypothetisch. Deze realiteit sterk van invloed op de annotatie van zowel structurele en hulpstoffen metabole genen. Hier presenteren we phenomic die zijn ontworpen met de fysiologische reactie (s) van een geselecteerde gastheercellen bij de expressie van een van deze onbekende faaggenen vangen. Multi-fenotype testplaten (MAP's) worden gebruikt om de diversiteit van vreemde drager gebruik en daaropvolgende vorming van biomassa te monitoren, terwijl metabolomics biedt bijproduct analyse door monitoring metaboliet overvloed en diversiteit. Beide modellen worden tegelijkertijd gebruikt om een ​​fenotypische profiel geassocieerd met expressie van een vermeende faag enkele open leeskader (ORF) te verschaffen. Representatieve resultaten voor beide methoden worden vergeleken, highlighting de fenotypische verschillen profiel van een gastheer dragen ofwel vermeende structurele of metabole faaggenen. Bovendien zijn de visualisatietechnieken en high throughput computational pijpleidingen experimentele analyse vergemakkelijkt gepresenteerd.

Introduction

Virussen die bacteriën (aka bacteriofaag of fagen) infecteren schatting bestaan ​​meer dan 10 31 virusachtige deeltjes (VLP's) globaal en overtreffen alle andere organismen in een omgeving 1,2. De eerste metagenomic onderzoek naar de virale gemeenschappen in verband met het mariene milieu gericht op het kwantificeren van de diversiteit gezien binnen het virale fractie 3. Bovendien Breitbart en collega's vonden dat meer dan 65% van de virale sequenties gedeeld door geen homologie geven sequenties in publieke databanken. Latere metagenomic studies gevonden vergelijkbaar bewijs: metagenomes uit mariene sedimenten in San Diego, Californië bevatten 75% onbekende virale sequenties 4; metagenomes van zoute meren in de Salton Sea bevatten 98% onbekende virale sequenties 5; en koraal geassocieerd metagenomes bevatten 95-98% onbekende virale sequenties 6. Deze opeenstapeling van unannotated informatie heeft geleidfaag genetisch materiaal dat "de donkere materie van de biologische universum" 7.

Genomische karakterisering van faag baseert zich op het identificeren van sequentie-overeenkomst door vergelijking tegen bestaande nucleïnezuur en eiwit databases. Door faag gecodeerde genetische informatie is hoofdzakelijk bekend, homologie-gebaseerde methoden zijn niet effectief. Binnen hun genoom, fagen coderen gewoonlijk drie belangrijke genen types: transcriptie en replicatie genen metabole genen en structurele genen. De transcriptie en replicatie genen (klasse I / II genen 8) omvatten polymerasen, primases, endo / exo-nucleasen en kinases. Deze genen zijn sterk geconserveerd vanwege hun belang in de faag infectie, transcriberen en repliceren faag genetisch materiaal. Faag polymerasen worden gemakkelijk geïdentificeerd volgens traditionele sequentiehomologie methoden wegens hun wereldwijde bescherming 9 en is aangetoond als effectieve fylogenetische markers 10 dienen.Daarentegen faag metabole en structurele genen (klasse II / III genen 8) steeds divergent vaak geannoteerd als hypothetisch genen.

Faag metabole genen van invloed op de metabole capaciteit van de gastheer en zijn niet per se nodig zijn voor virale replicatie. Deze genen, vaak aangeduid als aanvullende metabole genen 11 (AMG), blijken gastheer metabolisme moduleren en zorgen voor een optimale progressie van de infectie en het succes van virion rijping. AMG zijn geassocieerd met het gebruik en toepassing van beperkende nutriënten of energieproductie trajecten. Voorbeelden zijn fotosysteem genen in het genoom van verschillende cyanophage 12-16, genen verbonden met en geregeld door fosfaatmetabolisme 17,18, en het gebruik van de pentose fosfaat route voor faag dNTP biosynthese 18,19. In vergelijking, structurele genen behoren tot de midden tot late genen die tijdens infectie en variëren in verschillende fagen-host systemen. De productie van structurele eiwitten zijn afhankelijk van de beschikbaarheid van virale dNTP en energie pools hun transcriptie, translatie en assemblage 8. De capside en staartvezel structurele eiwitten worden beschouwd als de meest uiteenlopende van viraal eiwit coderende genen en zijn nodig voor een succesvolle virion productie. Hun verschil wordt meestal toegeschreven aan de actieve rol die zij spelen in het vormgeven van virus-gastheer coevolution 20. Afwijkende eiwitten, ongeacht het gen klasse, worden gemakkelijk vergeten bij gebruik van traditionele homologie en sequence alignment technieken. Een poging om te corrigeren voor de beperkingen waargenomen strenge sequentievergelijkingen heeft geleid bioinformatica hulpmiddelen die gebruikt sequentiekenmerken Association, zoals kunstmatige neurale netwerken 21 bepalen. Kunstmatige neurale netwerken (ANNs) maken voor het voorspellen van de structurele en metabole genen, vereisen echter downstream experimentele validatie om direct te karakteriserengenfunctie.

Het doel van dit manuscript is phenomic protocollen voor de controle zowel katabole en anabole metabolisme van een gastheer bacterie tijdens de expressie van een nieuw faaggen verschaffen, functioneel voorspeld door middel ANNs. Het veld van phenomics, de biologie in verband met cellulaire fenotypes, is goed ingeburgerd in systeembiologie om te helpen bij het onderzoek naar eiwitten met onbekende of pleiotrope functie. Phenomic tools worden gebruikt om fenotypische informatie te koppelen aan genotypische informatie. We veronderstellen voor vermeende faag genen die hun functie (s) kunnen worden bepaald met inachtneming van ontvangst fysiologische effecten tijdens faag genexpressie. Om deze hypothese te onderzoeken, werden twee kwantitatieve methoden gekozen. Multi-fenotype testplaten (MAP's) gebruikt om vreemde drager gebruik en de daaropvolgende vorming van biomassa te controleren terwijl metabolomics gemeten diversiteit gastheer metaboliet en relatieve aanwezigheid tijdens de groei in bepaalde environpsychische aandoeningen. Vermeende structurele en metabole eiwitten werden tot overexpressie gebracht in Escherichia coli en representatieve resultaten van beide experimenten worden vergeleken. Tal van visuele technieken en high throughput verwerking pijpleidingen worden gepresenteerd aan de experimentele replicatie te vergemakkelijken. Ten slotte is de reproduceerbaarheid en de nauwkeurigheid van de gepresenteerde methoden worden besproken in de context van de verwachte fysiologische effecten van een geannoteerde capside-eiwit en faag metabolische eiwit thioredoxine, plus twee vermeende AMG.

Protocol

1. Voorbereiding van de Multi-fenotype Assay Plate (MAP) Substrates, Basale Media, Pre-groei Media en Buffer Maak 50 ml van 1,0-1,25% substraat voorraden. Los 1,0-1,25% (w / v) vast substraat in steriel water (warmte indien nodig). Filter steriliseren oplossingen met een 0,22 pm filter unit en de voorraden op te slaan bij RT. Voorbeelden van substraten die in deze experimenten zijn in Tabel 2. Voeg 250 ml 3x basale media voor alle klassen substraat (koolstof, stikstof, zwavel en fosfor). De MOPS (3-morpholinopropane-1-sulfonaat) gebaseerde basale media 22 bevat het volgende: 1x MOPS (40 mM MOPS + 10 mM Tricine), 0,4% glycerol *, 9,5 mM NH4 Cl *, 0,25 mM naso 4 *, 1,0 mM MgSO 4 *, 1,32 mM K 2 HPO 4 *, 10 mM KCI, 0,5 pM CaCl2, 5 mM NaCl, 6 pM FeCl3 en 0,1% (w / v) L-arabinose ** (tabellen 1 en 2) . Opmerking: * Deze verbindingen zijn niet afhankelijk van de basale media. Bijvoorbeeld wordt 0,4% glycerol niet gebruikt in de basale media koolstof- en zwavel basale media 1,0 mM MgSO 4 wordt vervangen door 1,0 mM MgCl2. ** L-arabinose is specifiek voor de inductie van pBAD promotor vector, pEMB11, die werd omgezet in een ara – E. coli K-12 stam (BW 27784) 23. Voeg elke component van het basale media een steriele kolf en breng oplossing volume. Meng goed. Met een 0,22 urn filtereenheid, filter gesteriliseerd elk basale media in een steriele fles. Voeg 500 ml MOPS pre-groeimedia. MOPS based pre-kweekmedium 22 omvat het volgende: 1 x MOPS (40 mM MOPS + 10 mM Tricine), 0,4% glycerol, 9,5 mM NH 4 Cl, 0,25 mM naso 4, 1,0 mM MgSO 4, 1,32 mM K 2 HPO 4, 10 mM KCI, 0,5 pM CaCl2, 5 mM NaCl en 6 pM FeCl3. Voeg elkecomponent van de pre-groeimedium een ​​steriele kolf en breng het volume. Filter gesteriliseerd met een 0,22 urn filtereenheid, voeg ampicilline in een eindconcentratie van 100 ug / ml. WINKEL oplossing bij 4 ° C. Voeg 500 ml 0,5x Luria-Bertani (LB) agarplaten. Om een ​​steriele fles, voeg LB componenten tot een 0.5x concentratie (1,25 g gistextract, 2,5 g NaCl, 2,5 g trypton, 7,5 g agar) te maken. Meng goed en de autoclaaf te steriliseren. Cool agar, voeg dan 100 ug / ml ampicilline antibioticum onder mengen. Giet ~ 25 ml agar in petrischalen, laten stellen, en bewaar bij 4 ° C totdat het nodig is. Voeg 250 ml van 10 mM Tris (pH 7,4) plus 10 mM MgSO 4 bufferoplossing. Filter gesteriliseerd met een 0,22 urn filtereenheid en winkeloplossing bij KT. 2. Voorbereiding van de bacteriële cel-ophanging Bereid verse kolonies. Van 12,5% glycerol bevroren voorraad, plaat verse E. coli clones op 0,5x LB-agar met 100 ug / ml ampicilline. Incubeer bij 37 ° C gedurende 24 uur. Bereid vloeibare culturen: Pipetteer 3 ml pre-kweekmedium bevattende 100 ug / ml ampicilline in kweekbuizen. Voor elke kloon, gebruiken biologische triplo. Inoculeren onafhankelijke kolonies van paragraaf 2.1 in voorbereid cultuur buizen. Incubeer bij 37 ° C onder schudden gedurende 22 uur. Pellet en was bacteriële cellen: Transfer O / N kweken in 1,7 ml microcentrifuge buisjes. Pellet cellen via centrifugeren bij maximale snelheid (16.900 xg) gedurende 2 minuten in een microcentrifuge. Decanteer supernatant en wassen cellen door resuspenderen in 500 pi 10 mM Tris / 10 mM MgSO 4 buffer. Herhaal. Re-pellet cellen, giet supernatant en resuspendeer cellen in 1 ml 10 mM Tris / 10 mM MgSO 4 buffer. Meet celdichtheid en concentreer cellen (indien nodig): Verdunnen cellen uit sectie 2.3.3 10-voudig inde 10 mM Tris / 10 mM MgSO 4 buffer en breng deze verdunning in een cuvet. Meet de optische dichtheid (OD 600 nm) van deze verdunning en opnemen. Concentreer cellen tot een eindconcentratie van 0,07 (OD 600 nm) in de MAP (de cellen wordt verdund 15 voudig indien ze worden toegevoegd aan de MAP derhalve cellen moeten bij een initiële concentratie van OD 600 nm = 1,05) bereikt. Transfer geconcentreerde celsuspensie in een reservoir en op te slaan (bij RT) tot stap 3.5 van MAPs voorbereiding. 3. Voorbereiding van de Multi-fenotype Assay platen (MAP) Label kaarten. Label steriele 96-well micro-titer platen met E. coli kloon identificatienummer en MAP schematische type. Aliquot steriel water in de kaarten. Aseptisch overdracht steriel water in een vloeistof reservoir. Pipetteer 60 ul aan elk putje van de micro-titer platen een multi-channel pipet. Aliquot basale media into kaarten. Aseptisch overdracht 3x basale media in een vloeistof reservoir. Pipetteer 50 ul aan elk putje van de micro-titer platen een multi-channel pipet. Herhaal de stappen 3,2 en 3,3 per basale media in de MAP schema. Aliquot substraten in kaarten. Breng 30 gl van elk substraat in de juiste put van de kaarten. Voeg bacteriële suspensie om de kaarten. Breng 10 gl van bacteriecellen uit paragraaf 2.4.2 in elk putje van het MAP een multi-channel pipet. Wijzig tips voor herintroductie pipet terug in de cultuur voorraad. Cover Maps met zelfklevende folie. Bedek elk bord met een zelfklevende plaat film. Druk de film bovenop de putjes van de plaat en langs de randen om een ​​gelijkmatige en strakke afdichting. Overtollige film van de randen van de micro-titer platen met een steriel scheermesje. Meet de optische dichtheid van KAARTEN: Plaats voorbereid kaarten in de "Input" mouw van een multi-plaat spectrofotometer plaatlezer. Open plaat reader software en maak een protocol dat absorptie (OD 600 nm) om de 30 min, maatregelen voor een totaal van 32 uur, met 60 sec schudden tussen leest. Stel de temperatuur in de inrichting tot 37 ° C. Start protocol eens MAP's hebben in evenwicht gebracht om de temperatuur in te stellen. Na 32 uur, verwijder kaarten uit de "Output" hoes van de plaat lezer. Label elke data tekstbestand op te nemen: de E. coli kloon identificatienummer, datum waarop de MAP liep, en de MAP schema type. 4. Multi-fenotype Assay platen (MAP) Verwerking en parametrering Beoordelen groeicurven behulp van een geautomatiseerd QA proces, bijvoorbeeld, PMAnalyzer 24. Controleer groeicurven hebben OD 600 nm <0,20 in de eerste 2 uur. Gebruik absorptie bij de eerste tijdstip (t 0) in het filter als gevolg van artefacten condensatie, die meestal opgelost int 1 (30 min). Verwijder groeicurven dat QA filter schenden. Sla curve informatie (sample naam, goed nummer, en OD 600 nm waarden) in een aparte uitgang bestand voor toekomstig gebruik. Ga door met de analyse als de groei curve passeert QA filter. Bereken mediaan groeicurven. Met gerepliceerd, per putje, bereken het gemiddelde groeicurve neem het gemiddelde optische dichtheid (OD 600 nm) waarde op elk tijdstip. Neem verkregen mediane groeicurven in een afzonderlijk uitvoerbestand voor later gebruik. Bereken de optimale logistisch model voor elke groeicurve via een aanpassing van de door Zwietering 25 voorgestelde vergelijking. De logistieke vergelijking omvat drie parameters beschrijven de groei van bacteriën: de vertragingstijd, λ (hr), de maximale snelheid van de groei, μ max (OD 600 nm 100 -1), en de uiteindelijke biomassa opbrengst, α (OD 600 nm). Gebruik gegevens op tijdstip = 30 min (y 1) als initiële waarde van de artefacten condensatie. [1] Bereken de maximale groei met behulp van een direct search. Noteer de grootste mate van verandering over een 90 minuten interval binnen de data. [2] Schat de uiteindelijke biomassa opbrengst door te zoeken naar de bovenste asymptotische waarde van de grootste voortschrijdend gemiddelde over een 90 min venster. Specifiek definiëren als de asymptoot van de groeicurve. [3] Met behulp van de μ max en A waarden uit 4.3.1 en 4.3.2, vindt de λ waarde door te proberen alle waarden λ: [4] Gebruik elke λ waarde aan een som van het kwadraat fouten (SSE) te berekenen. Gebruik de laagste SSE is de SSE (λS): /files/ftp_upload/52854/52854eq5.jpg "/> [5] 5. fenotype Analyse van MAP Bereken de groei niveau (GL) voor elke groeicurve aan de totale groei per kloon per substraat te beoordelen. Definieer GL als harmonisch gemiddelde van de verschoven-logistieke aangebracht waarden: [6] Wijs een fenotype elke groeicurve basis van de GL waarden. Hier, de vier fenotypes gebruikte zijn: de verwachte groei, geen groei, winst van functie en verlies van functie. Bepaal fenotypen door vergelijking van groei in alle klonen op een specifiek substraat in termen van standaarddeviaties van het gemiddelde. Gebruik deze statistiek en een minimale groei drempel naar het fenotype door de groeicurve (Figuur 1A, B). Figuur 1C geeft voorbeelden van fenotype opdracht aan te wijzen. Definieer groei GL ≥ 0,4 (Figure 1A, B). Definieer Gain van de functie (figuur 1C, groen) als het hebben van een GL> twee standaarddeviaties boven het gemiddelde en een gemiddelde> de groei drempel. Verlies van functie (figuur 1C, rood) wordt gedefinieerd als hebbende een GL <twee standaarddeviaties onder het gemiddelde en een gemiddelde> groei drempelwaarde. Maak visuele representaties van de dataset op basis van fenotypes en groeicurven. Groei View dynamiek portretteren OD 600 nm waarden kleur snel groeicurven tussen meerdere klonen (figuur 2) te vergelijken. Bekijk fenotypische verdelingen tussen alle klonen gebaseerd op groeiomstandigheden (figuur 3). 6. Het bouwen van de Continuous Cultuur Apparatus Reactor poort bouw (Figuur 4A, B). Boor drie 1/4 in. Gaten, verdeeld 3/4 in. Elkaar, in de dop van de continue cultuur reactor. For port α: schroef een vrouwelijke Luer schroefdraad stijl paneel monteren op 1/16 in weerhaak van de bodem van de kap met de weerhaak omhoog, uit de dop.. Secure weerhaak met een 1/4 in. Panel mount moer. Voor de haven van β: schroef een vrouwelijke Luer schroefdraad stijl paneel monteren op 1/16 in weerhaak met de weerhaak omhoog, uit de dop.. Secure weerhaak met een 1/4 in. Panel mount moer. Voor poort γ: schroef een vrouwelijke Luer schroefdraad stijl paneel monteren op 1/16 in weerhaak van de bodem van de kap zodat de weerhaak wordt omhoog, uit de dop.. Secure weerhaak met 1/4 in. Panel mount moer. Schroef een mannelijke luer lock met integrale ring 1/8 in. Wijde boring slang aan de weerhaak passen aan de binnenkant van de kap. Voor de uitstroom poort: boor een 5/16 in gat in het teken 75 ml van de continue cultuur reactor.. Snij 3/4 in. Off de moer eind van de 1/4 in. Prikkeldraad schot fitting. Draai de 1/4 in. Weerhaken schot fitting (pakking aan de buitenzijde van de fles en de moer aan de binnenkant, FIGUUR 4B). Zuigfles poort bouw (Figuur 4C). Boor twee 1/4 in. Gaten verdeeld 1 in. Apart in de dop van de zuigfles. Voor de haven δ: schroef een vrouwelijke Luer schroefdraad stijl paneel monteren op 1/8 in weerhaak met de weerhaak omhoog, uit de dop.. Secure weerhaak met een 1/4 in. Panel mount moer. Voor de haven ε: schroef een vrouwelijke Luer schroefdraad stijl paneel monteren op 1/16 in weerhaak met de weerhaak omhoog, uit de dop.. Secure weerhaak met een 1/4 in. Panel mount moer. Schroef een mannelijke luer lock met integrale ring 1/8 in. Wijde boring slang aan de weerhaak fitting, aan de binnenkant van de kap. Het voeden van buizen en tube extensies: Snij twee 1 in. Stukken buis (1/8 in. Buitendiameter (OD) x 1/16 in. Binnendiameter (ID)). Fit stukken op havens α en γ van de continue cultuur reactor in paragraaf 5.2. Snij een enkele 1 in. Stukje tubing (1/4 in. OD x 1/8 in. ID). Fit stuk op de haven Β van de continue cultuur reactor. Snij een enkele 3,5 in. Stuk slang (1/8 in. OD x 1/16 in. ID). Breng dit stuk naar de binnenzijde van poort γ, op het mannelijke luer lock met integrale ring 1/8 in. Wijde boring slang. Port γ is de bemonstering poort van de continue cultuur reactor. Snij een enkele 1 in. Stuk slang (1/4 in. OD x 1/8 in. ID). Past dit stuk op de δ haven van de zuigfles. Snij een enkele 11 in. Stuk slang (1/16 in. OD x 1/8 in. ID). Breng dit stuk aan de binnenzijde van poort ε van de zuigfles, op het mannelijke luer lock met integrale ring 1/8 in. Wijde boring slang. Snij twee 18 in. Stukken buis (1/8 in. OD x 1/16 in. ID). Breng een stuk naar de haven ε van de zuigfles. Sla het andere stuk voor sectie 7. 7. Running Continue Cultures for Metabolomics Steriliseren materialen: Autoclave droge materialen voor 30 min. Zorg ervoor om dop van de zuigfles in hoofdstuk 5 in aluminiumfolie wikkelen. Houd bevestigd slangen recht. Wikkel cap van de continue cultuur reactor, gemaakt in hoofdstuk 5, in aluminiumfolie. Houd bevestigd slangen recht. Wikkel 18 in. Slangen gesneden in paragraaf 6.3.5 en de kleinste pompslangen adapter in aluminiumfolie. Houd slangen recht. Autoclaaf gedurende 30 min. Maak 2 L van 0,5x LB bouillon. In de zuigfles, maken 0,5x LB bouillon. Bedek zuigfles met folie. Autoclaaf gedurende 1 uur. Maak 70 ml van 0,5x LB bouillon. Giet bouillon in de continue cultuur reactor. Plaats een roerstaafje in de continue cultuur reactor. Bedek reactor met folie en autoclaaf gedurende 30 min. Continu cultuur set-up: Bacteriële cel-ophanging. Van 12,5% glycerol bevroren voorraad, plaat verse E. coli klonen op 0,5x LB-agar met 100 ug / ml ampicilline. Broedenbij 37 ° C gedurende 24 uur. Inoculeer een enkele kolonie in 3 ml 0,5x LB-bouillon die 100 ug / ml ampicilline. Voor elke kloon use biologisch triplo. Incubeer bij 37 ° C onder schudden gedurende 22 uur. Sluit de onderdelen aan elkaar. Plaats alle geautoclaveerd materialen in een biologische veiligheid kast en zet ultraviolet licht op, terwijl de media afkoelt. Nadat media is afgekoeld, voeg 0,1% L-arabinose en 100 ug / ml ampicilline om alle 0,5x LB-bouillon. Uitpakken continue cultuur reactor dop en schroef op de reactor. Raak de bemonstering buis. Uitpakken van de zuigfles dop en schroef op de zuigfles. Raak de bemonstering buis. Hou de 18 in. Slangen aangesloten op poort ε steriel. Un-wikkel de 18 in. Slangen en pompslangen adapter. Breng een vrij uiteinde van de 18 in. Buizenstelsel op één uiteinde van de peristaltische pomp slang adapter. Plaats het andere uiteinde van de peristaltische pomp slang adapter aande 18 in. slang verbonden aan de haven ε van de zuigfles dop. Schroef 0,22 pm filter units op havens β en δ van de continue cultuur reactor. Schroef een 0,22 pm filter unit op de adapter van de haven α. Om de 0,22 urn filtereenheid, past het vrije uiteinde van de 18 in. Tubing. Start de continue cultuur. In de bioveiligheid kap, enten de continue cultuur reactor met 100 ul van O / N cultuur in paragraaf 7.2.1.1. Sluit het systeem voordat de continue cultuur in een 37 ° C incubator. In de broedmachine hebben een magnetische roerplaat en mini peristaltische pomp opgezet. Monteer de pompslangen adapter in de peristaltische pomp. Buizenstelsel van de zuigfles begint bij het "In" side leidingen waardoor de reactor begint bij de "Out" kant. Stel de peristaltische pomp "FAST". Start de peristaltische pomp door over te gaan R20; FORWARD ". Controleer of de media begint te stromen door de slang. Plaats reactor op magnetische roerplaat en beginnen te mengen. Continue cultuur reactor moet in evenwicht gedurende 24 uur vóór de bemonstering. Bemonstering van de continue cultuur. Schroef een 5 ml Luer lok spuit op de haven γ en trek 4,5 ml van de cultuur. Gebruik 500 pl van de kweek tot de dichtheid (OD 600 nm) te meten. Verdun cellen 4 x 1 ml kweken bij OD 600 nm = 0,35 maken. Aliquot verdund culturen in 1,7 ml microcentrifuge buizen. Herhaal bemonstering elke 12 uur gedurende 4 dagen. Bereid monsters voor GC-TOFMS: Pellet cellen via centrifugeren bij maximale snelheid (16.900 xg) gedurende 2 min. Giet supernatant. Was de cellen met 500 ul fosfaat gebufferde zoutoplossing (PBS). Herhaal deze stap. Giet supernatant een laatste keer, en dan dompel microfugebuizen buizen met gepelleteerde cellen in vloeibare stikstof tot borrelen stopt. Sscheurde stalen in -80 ° C vriezer. 8. Running serial Passage Batch Cultures for Metabolomics Het voorbereiden van bacteriële cel-ophanging. Van 12,5% glycerol bevroren voorraad, plaat verse E. coli klonen op 0,5x LB-agar met 100 ug / ml ampicilline. Incubeer bij 37 ° C gedurende 24 uur. Inoculeer individuele kolonies in 3 ml 0,5x LB-bouillon die 100 ug / ml ampicilline. Gebruik biologische triplo voor elke kloon. Serial passage batch culturen. Subcultuur O / N van 8.1.1 via een 500-voudige verdunning in 3 ml LB-bouillon die 50 ug / ml ampicilline en 0,1% L-arabinose. Subcultuur moet een OD 600 nm <0,005 hebben. Incubeer bij 37 ° C onder schudden. Controleer optische dichtheid (OD 600 nm) en 2 en 2,5 uur. Kweek cellen OD 600 nm bereiken = 0,35. Subcultuur via een 500-voudige dilution in 3 ml LB-bouillon die 50 ug / ml ampicilline en 0,1% L-arabinose. Subcultuur moet een OD 600 nm <0,005 hebben. Controleer optische dichtheid (OD 600 nm) en 2 en 2,5 uur. Kweek cellen OD 600 nm bereiken = 0,35. Sampling seriële passage batch culturen. Met behulp van een steriele tang, plaats een 0,22 urn membraanfilter op een filter verdeelstuk. Aliquot beurt 1 ml fosfaat gebufferde zoutoplossing (PBS) op het filtreerpapier en daarna vacuümpomp. Herhaal toevoeging van 1 ml PBS. Breng 1 ml van subcultuur uit paragraaf 8.2.3 op het filter papier. Vanaf hier, ga snel naar monsters in vloeibare stikstof meteen. Vul dit in 1 min. Aliquot 1 ml PBS op filter papier om monster te wassen. Snel spoelen zonder morsen steekproef over zijden van het filter papier. Herhaal. Met behulp van een steriel pincet plaats filter in een 1,7 ml microfugebuis door voorzichtig vouwen van de filter. Dompel microfugebuis in vloeibare stikstof tot borrelen stopt. Store monster in -80 ° C vriezer. 9. metabolietanalyse & Processing Schip 3 monsters per kloon op droog ijs naar een metabolomics kernfaciliteit voor het monster verwerking, analyse en normalisering van de GC-TOFMS. Voor elk monster te bepalen het gemiddelde, de mediaan, standaardafwijking en de variatiecoëfficiënt over metabolieten, met behulp van data repliceren. Voor statistische analyse, handmatig een QA pijplijn coderen met behulp van voorwaardelijke verklaringen en repetitieve executies 26 tot metabolieten die niet voldoen aan bepaalde voorwaarden te verwijderen. Voor Voorwaarde 1, verwijdert metabolieten waarin meer dan 2 monsters nul overvloed. Verwijder de interne normen van de metabolomic profielen. Voor Voorwaarde 2, verwijder die metabolieten die niet zijn gevonden in de cellen van belang. Hier, verwijder de volgende metabolieten: indool 3-acetaat, dihydroabiet ic acid, nonadecaanzuur, salicylzuur, salicylaldehyde, cholesterol, fenol, 1-monostearine, octadecanol, 1-monopalmitine, dodecaan, dodecanol, 1-hexadecanol, 5-methoxytryptamine, benzoëzuur, pentadecaanzuur, fosforzuur, pelargonzuur, palmitinezuur zuur, caprinezuur, hydroxylamine, stearinezuur, myristinezuur, maleimide, levoglucosan en 4-hydroxyboterzuur. Voor Voorwaarde 3, verwijder die metabolieten wiens coëfficiënt van de variatie is groter dan 1. Capture wereldwijde metabolomics effecten door te kijken naar metaboliet relatieve abundanties. Een visuele weergave van de gemiddelde metaboliet overvloed volgens kloon voor elke metaboliet (figuur 6). Identificeer uitschieters door het observeren kloon-metaboliet pair frequenties. Bereken de Z-score voor elk mediaanwaarde van elke metaboliet in een kloon. Bereken z-scores met behulp van de volgende vergelijking: /52854/52854eq7.jpg "/> [7] Opmerking: Term X MC stelt de overvloed niveau van een specifiek metaboliet een specifieke kloon. Term μ C stelt het gemiddelde van alle klonen van een bepaalde metaboliet. Term σ C de bijbehorende standaarddeviatie. Een visuele weergave van de gegevens die uitschieters zijn gemarkeerd (gegevens niet beschikbaar).

Representative Results

Alle monsters gebruikt om de open reading frames (ORF) is geselecteerd in dit onderzoek vast te stellen werden verzameld van Starbuck Island, Site 7 (STAR7) en Caroline Atoll, Site 9 (CAR9) van de zuidelijke Line-eilanden. Naar schatting 100 L van zeewater van deze sites werd onder het koraal grenslaag met behulp van lenspompen verzameld, zoals eerder 5 beschreven. Inhoud van de pompen werden onderworpen aan fragmentatie met grote poriën filters om kleine eukaryoten te verwijderen en vervolgens geconcentreerd onder toepassing van 100 kDa tangentiële stroming filters waardoor alleen microben en virale deeltjes (VLP's). Om VLP scheiden, werd de resterende zeewater geleid door 0,45 urn filters waardoor de virome. Chloroform werd aan deze virale fractie groei van resterende cellen arrestatie en bewaard bij 4 ° C. VLP's werden gezuiverd met de cesiumchloridewerkwijze, waarbij dichtheidsgradiënten scheiden door middel van centrifugatie en het oog op het herstel van virionen bij ~ 1,35 g / ml tot 1,5 g / ml 3. Viraal DNA werd geëxtraheerd onder toepassing van een CTAB / fenol: chloroform protocol en geamplificeerd via meerdere verdringing amplificatie middels Phi29 reagentia. Sequencing van de virome werd bewerkstelligd met commercieel verkrijgbaar pyrosequencing technologie. Bioinformatica die bij de verwerking en selectie van virale ORF's voor deze studie zijn de volgende. Drie stappen pre-processing werden gebruikt op de CAR9 en STAR7 virale metagenomes. Eerst werd openbaar software waarmee tag sequenties die het gevolg van amplificatie van het virale DNA voorafgaand aan sequencing 27 verwijderen. Ten tweede, gemeenschappelijke sequencing artefacten zoals opeenvolging duplicaten en lage aantal kopieën werden gefilterd uit de dataset via een extra bioinformatica-programma 28. Tot slot, het verwijderen van buitenlandse opeenvolging verontreiniging 29 werd uitgevoerd voor die sequenties die ≥ 90% dekking en ≥ 94% identiteit met sequenties in de volgende databases had: RefSeq virus genomen; Human – Reference GRCh37; Human – Celera Genomics; Human – Craig Venter (HuRef); Human – Seong-Jin Kim (Koreaans); Human – Chromosome 7 versie 2 (TCAG); en Human – James Watson, Yanhuang (YH; Aziatische), Yoruba (NA18507; Afrikaanse) referentie-sequenties 21. Naar aanleiding van deze processen, sequenties uit de CAR9 monsters bedroeg 591.600 en STAR7 sequenties bedroeg 939.311. Deze sequenties werden geüpload naar MGRAST en gemonteerd via assembler software met de standaardinstellingen. Contigs werden omgezet in 6 reading frames en vermeende open reading frames (pORFs) werden geïdentificeerd via scripts, zoals eerder beschreven 21. Om onbekende ORF een aantal gelijkenis gebaseerd zoekopdrachten werden uitgevoerd om ORF van bekende functie te verwijderen identificeren. In het kort werden de volgende zoekopdrachten die met hun overeenkomstige zoeken criteria 21: Aanzienlijke gelijkenis van ≥ 95% identiteit dan ≥40 basenparen (bp) van MGRAST BLAT in M5NR database. Aanzienlijke gelijkenis (e-waarde ≤ 0.001) door TBLASTN tegen alle openbare metagenomes Mijn metagenoom Database Resource. Aanzienlijke gelijkenis (e-waarde ≤ 0.001) door BLASTP en TBLASTN tegen NR database. Aanzienlijke gelijkenis (e-waarde ≤ 0.001) door RPS-BLAST tegen de Behouden Domain Database. Eiwit vertalingen uit een select fractie van elke dataset vergeleken opgelost eiwitstructuren in de Protein Data Bank. Berekening van dinucleotide frequenties met Dinucleotide Handtekeningen pakket. De resulterende pORFs zijn ontworpen voor expressie in E. coli met behulp van publiek beschikbare gen design software. Back-translatie van de aminozuursequenties gebruik gemaakt van een Universal Codon Usage Table ontworpen om tegemoet expressie in E. coli met een minimum verbruik drempel van 2%. Restrictie-enzym herkenningssequenties voor BamHI en HindIII werden uit de sequenties uitgesloten klonering. Een extern bedrijf gesynthetiseerd de gemanipuleerde gen sequenties 30 en vervolgens ORF's werden gekloond in een medium-copy number pBAD promotor vector, pEMB11, via standaard restrictie-enzym klonen. Alle klonen werden getransformeerd in E. coli K-12 stam BW 27784 23. Multi-fenotype Assay platen (MAP) Een hoge doorvoer en robuuste software pijplijn werd ingezet voor de analyse van de kaarten, de PMAnalyzer 24. De pijpleiding werd ontwikkeld in een Linux-server-omgeving en voert verschillende stappen, waaronder: parsing van optische dichtheid van bestanden, het formatteren van gegevens in leesbare tekst bestanden, pre-processing van groeicurven voor de kwaliteitsborging (QA), en het uitvoeren van wiskundige modellering technieken om groeicurven analyseren . De primaire modellering scripts ontwikkeld in Python versie 2.7.5 gebruik van de PyLab module maken. <p class = "jove_content"> MAP reproduceerbaarheid werd bepaald met behulp van de standaard fout (SE) voor het repliceren van gegevens (Figuur 2A). Raw groeikrommen werden vergeleken met logistische groeicurven te bepalen of het programma PMAnalyzer nauwkeurig geparametriseerd en gemodelleerd kloon groei tijdens proeven (gegevens niet getoond). Voor meer informatie over de juistheid en geldigheid van de kaarten en PMAnalyzer zie Cuevas et al. 24 Na validatie van de werkwijze werd MAPs gegevens geanalyseerd met de verschillende parameters, zoals de maximale groeisnelheid (μ max) en groeipeil (GL), door verwerking pijpleiding. Vergelijkende visualisatie van groeicurves wordt vaak gebruikt voor de groei van data interpretatie; echter, het aantal bochten dat kan worden gevisualiseerd op een tijdstip voor de vergelijking heeft beperkingen. Om tal van groeicurven tegelijkertijd te analyseren, werden heat map afgeleid percelen smeekte om te vergelijken tientallen klonen gegroeid op een enkele substrate tegen gemiddeld reactie dat de omstandigheden '(figuur 2B). De invloed geplaatst door overexpressie van een nieuwe faag eiwit wordt waargenomen door veranderingen in de curve parameters, in het bijzonder: vertraging fase exponentiële fase en de maximale biomassa opbrengst (asymptoot). Als voorbeeld wordt de klim van opstartfase in exponentiële fase gemodelleerd in de groeicurve voor het capside-eiwit (Figuur 2A) gereproduceerd door een snelle verandering in kleurintensiteit van zwart naar wit voor dezelfde kloon in de dynamische grafiek van figuur 2B . Een algemeen beeld van kloon verdeling over substraten te verkrijgen, werden fenotypische classificaties afgeleid uit de GL gebruikt (figuur 3). Hier zijn de vier fenotypes gescheiden in vier grafieken waarin de hoogte van elke staaf geeft het aantal klonen tonen die fenotype voor een specifiek substraat. Uitschieters in de data worden erkend als klonen vallen in de "winst van functies "of" het verlies van de categorie functie ". Uitschieters kan dan afzonderlijk worden gezocht en onderzocht nauwer experimenteel. Bovendien globale analyse herkent substraat biases in de assay. Substraten zoals fenylalanine, appelzuur en glycine leidde tot een "geen groei" classificatie. Substraten die consequent vallen in de geen groei classificatie, in alle klonen, zijn niet zwaar gewogen in downstream functionele karakterisatie. Metabolomics De katabole producten van klonen die faaggenen onbekend werden geïdentificeerd met behulp van metabolomics. In het kort werden klonen gegroeid onder ofwel een continue cultuur of seriële passage in batch cultuur omgeving alvorens te worden verzonden voor GC-TOFMS analyse op een metabolomics kern faciliteit. Voor meer informatie over het monster verwerking, analyse en normalisatie voor GC-TOFMS geïmplementeerd door de gekozen kernfaciliteit zien Fiehn et al. 31 Briefly, 1 ml koude extractie-oplosmiddel wordt aan elk monster toegevoegd, waarna monsters gewerveld en gesonificeerd in een koud bad gedurende 5 minuten. De monsters worden tenslotte gecentrifugeerd en de helft van het monster wordt gedecanteerd en neer gedroogd voor analyse. Extracten zijn gezuiverd en verrijkt met interne retentie index markers voor op de gaschromatograaf worden geladen en dan vervolgens overgebracht naar de massaspectrometer. De gegevens van elk monster geanalyseerd zodanig dat signaal intensiteit voor alle gedetecteerde signalen in het chromatogram worden gerapporteerd. Voor de normalisatie, is de overvloed van pieken voor elk monster opgeteld en de totale piek abundanties zijn gemiddeld tussen alle monsters in de set. Metaboliet abundanties per monster worden gedeeld door het monster piek overvloed en vervolgens vermenigvuldigd met de gemiddelde piek overvloed aan de sample set. De resulterende gegevens worden gebruikt voor de analyse van metabolomics in het onderzoek besproken. Validatie van metabolomics reproduceerbaarheid was nodig omhet bepalen van de juiste steekproefomvang voor elke kweken methode. Om de precisie gezien binnen monsters en de variatie gezien in het monster te detecteren maten de standaardafwijking van het gemiddelde (S M) voor zowel n = 3 en n = 6 datasets werden beoordeeld (Figuur 5B). Ongeacht de continue kweek (CC) monstergrootte, minder dan 1% van de gegevens hadden S M ≤ 1,5. Mediane S M s waren 221 en 300, en waarden varieerde van respectievelijk 0 tot 7,55 x 10 5 en 3,74 x 10 5 voor n = 3 en n = 6. S M s werden ook berekend voor elke set van het monster repliceert in de methode seriële cultuur (SC). Nogmaals, minder dan 1% van de gegevens had een S M ≤ 1,5, een mediane S M van 137, en een scala 0-3,51 x 10 5. Om de S M distributies tussen elke sample set (CC n = 3 vs vergelijken . CC n = 6, n = 3 CC vs. SC n = 3, en CC n = 6 vs. SC n = 3) een permutatie test werd uitgevoerd. De distribution hetzij continukweek S M waarden dataset was niet significant verschillend van de verdeling van de seriële kweek S M waarden (p-waarde = 0,0). De verdeling van de M waarden voor continue kweek n = 3 data significant verschilde van dat van de S M waarden voor de continue kweek n = 6 data (p-waarde = 1,908804 x 10 -49). Ten slotte, de variatiecoëfficiënt per metaboliet werd vergeleken voor en na implementatie van een kwaliteitsborging (QA) stap (figuur 5C). In totaal werden 210 metabolieten verwijderd na de uitvoering van de QA pipeline (40% van de gegevens). Minder dan 1% van de verwijderde gegevens had metaboliet overvloed aan nul, ~ 2% was interne standaard data, ~ 5% werden gegevens van metabolieten niet eerder waargenomen in E. coli, en de resterende metabolieten (> 30%) een variatiecoëfficiënt groter dan 1. Net als bij de MAP analyse globale observations voorzien in een eerste inzicht in de diepte van informatie metabolomics aanbiedingen. Een globaal beeld te krijgen, werden klonen hiërarchisch gegroepeerd op basis van hun relatieve abundanties metaboliet voorlichting over kloon-metabolietprofielen, potentiële klonen met verwante functies en kloon-metaboliet uitschieters (figuur 6). Om eiwit functies te benadrukken, zijn metabolieten gescheiden en gegroepeerd op basis van gemeenschappelijke metabole routes. Met deze analyse voorlopige resultaten was het duidelijk dat metabolomics kan scheiden genen uit verschillende klassen (figuur 6, gemarkeerd klonen). Bovendien uitbijter identificatie met metabolomics data werd bepaald door standaard scores (z scores) voor elke kloon-metaboliet pair. Om statistische significantie te waarborgen, werden outliers gedefinieerd als een kloon-metaboliet pair met een Z score waarde van 2, goed voor slechts 5 procent van de data (data niet getoond). <p class="jove_content" fo:keep-tog ether.within-page = "always"> Figuur 1. Definities van fenotype classificaties. (A) Verhouding tussen de groei-niveau (GL) en de maximale groeisnelheid. Datapunten rood omcirkeld vertegenwoordigen groeicurves tonen weinig tot geen substraatgebruik. (B) Boxplot vertegenwoordiging definiëren groei drempel gebaseerd op de verdeling van de groeicurven met een minimale groei (<0,15 OD / hr). (C) de variantie en de standaardafwijking van GL wordt berekend substraat D-galactose. Korte stippellijnen vertegenwoordigen twee standaarddeviaties van het gemiddelde. Klik hier om een grotere versie van deze figuur te bekijken. highres.jpg "/> Figuur 2. MAP validatie via precisie en differentiatie. (A) groeicurven voor geannoteerde structurele (capside) en metabole klonen (Thioredoxine), twee nieuwe metabole klonen (EDT2440, EDT2441), en de gemiddelde respons van klonen gekweekt op sucrose, D- galactose en D-mannose in de kaarten. Blauwe lijnen geven de standaardfout waargenomen bij herhaalde gegevens (n ​​= 3). (B) De groeicurves van 47 verschillende klonen worden voorgesteld als warmte map sucrose, D-galactose en D-mannose. De geannoteerde structurele (groene cirkel) en metabole klonen (oranje cirkel), twee nieuwe metabole klonen (donker en licht blauwe cirkels), en de gemiddelde respons (rode cirkel) worden gemarkeerd. Klik hier om een grotere versie van deze figuur te bekijken. Pbelasting / 52.854 / 52854fig3highres.jpg "width =" 700 "/> Figuur 3. Kloon de distributie voor elke fenotype over meerdere ondergronden. Het fenotype-kloon tellen voor 47 klonen over 72 koolstof-specifieke groeiomstandigheden. Tabel geeft direct telt voor elke fenotype. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 4. Schema waarin de constructie van de continue kweek apparaat. (A) stap naar een haven α-γ van de continue kweek reactor bouwen, (B) de stappen gebruikt om de stroompoort van de continue kweek reactor en bouw (C ) de stappen om havens δ en ε van de continue cultuur zuigfles te bouwen. = "Https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg" target = "_ blank"> Klik hier om een ​​grotere versie van deze figuur te bekijken. Figuur 5. Vergelijking van de phenomic werkwijzen gepresenteerd. (A) workflow voor de bereiding van de Multi-fenotype testplaten (MAP), continu kweken en seriële culturen. (B) Het percentage van de standaard fout van de gemiddelde (S M) geldt zowel voor n = 3 en n = 6 steekproefomvang voor de continue cultuur (CC) en seriële cultuur (SC) bereidingswijzen voor metabolomics. De y-as is op logaritmische schaal. (C) De verdelingen van variatiecoëfficiënten (CV) per metaboliet, voor en na de uitvoering van de QA strategie voor de continue kweek (CC) methode.g5highres.jpg "target =" _ blank "> Klik hier om een ​​grotere versie van deze figuur te bekijken. Figuur 6. Metabolomic profielen van klonen gegroeid in continue cultuur. De mediane metaboliet abundanties voor een set van metabolieten worden uitgezet voor 84 klonen gegroeid in continue culturen. Metabolietprofielen voor geannoteerde structurele (Capsid) en metabole klonen (Thioredoxine), twee nieuwe metabole klonen (EDT2440, EDT2441), en de gemiddelde metabole respons zijn gemarkeerd in het rood. Klik hier om een grotere versie van deze figuur te bekijken. Samenstelling Koolstof Stikstof </strong> Zwavel Fosfor Glycerol – 0,40% 0,40% 0,40% Ammoniumchloride 9,5 mM – 9,5 mM 9,5 mM Natriumsulfaat 0,250 mM 0,250 mM – 0,250 mM Magnesiumsulfaat 1,0 mM 1,0 mM – 1,0 mM Kaliumfosfaat 1,32 mM 1,32 mM 1,32 mM – Magnesium chloride – – * – Kaliumchloride 10 mM 10 mM 10 mM 10 mM Calciumchloride 0,5 uM <td> 0,5 uM 0,5 uM 0,5 uM Sodium chloride 5 mM 5 mM 5 mM 5 mM IJzerchloride 6 uM 6 uM 6 uM 6 uM L- arabinose 0,10% 0,10% 0,10% 0,10% MOPS pH 7,4 1x 1x 1x 1x Tabel 1. De verbindingen en concentraties van de verschillende basale media in de MAP. * 1,0 mM magnesiumchloride gesubstitueerd. 1x MOPS = 40 mM MOPS, 4 mM Tricine. Koolstofsubstraten Stikstof substraten Zwavel substraten Phosphorus substraten 2 deoxy-D-ribose 2-deoxy-D-ribose 1-butaan-sulfonzuur adenosine-5-monophoshate 4-hydroxy- fenylazijnzuur aceetamide acetylcysteïne beta-glycerofosfaat azijnzuur adenine D-cysteïne creatinephosphate adenosine-5-monofosfaat adenosine D-methionine D-glucose-6-fosfaat adonitol allantoïne diethyl-dithiofosfaat diethyl-dithiofosfaat alfa-D-glucose beta-fenylethylamine DL-ethionine DL-alpha-glycerofosfaat alfa-D-lactose biureet glutathion kaliumfosfaat alfa-D-melebiose cytidine isethionzuur natriumpyrofosfaat citroenzuur cytosine L-cysteïnezuur natrium thiofosfaat D-alanine D-alanine L-Cysteïne D-arabinose D-asparagine L-djenkolic zuur D-arabitol D-aspartaat L-methionine D-asparagine D-cysteïne magnesiumsulfaat D-aspartaat D-glucosamine methaansulfonzuur D-cellubiose D-glutaminezuur N-acetyl-DL-methionine D-cysteïne DL-a-amino-N-boterzuur N-acetyl-L-cysteine D-fructose D-methionine kalium-tetra-thionate </tr> D-galactose D-serine natriumthiosulfaat D-glucosamine D-valine sulfanic zuur D-glucose gamma-amino-N-boterzuur taurine D-glucose-6-fosfaat glycine taurocholinezuur D-glutamaat guanidine thioureum D-mannose histamine D-raffinose inosine D-ribose L-alanine D-salicine L-arginine D-serine L-asparagine D-trehalose L-citrulline D-xylose L-cysteine dulcitol L-glutaminezuur glycerol L-glutamine glycine L-glutathion i-erythritol L-histidine inosine L-isoleucine L-alanine L-leucine L-arabinose L-lysine L-arabitol L-methionine L-asparagine L-ornithine L-aspartaat L-fenyl- alanine L-cysteïnezuur L-proline L-cysteine L-pyro-glutaminezuur L-fucose L-serine; L-threonine L-glutaminezuur L-tryptofaan L-glutamine L-valine L-isoleucine N-acetyl-D-glucosamine L-leucine putrescine <tr> L-lysine thioureum L-methionine thymidine L-fenylalanine thymine L-pyro-glutaminezuur tyramine L-rhamnose tyrosine L-serine uridine L-sorbose L-threonine L-tryptofaan L-valine L-xylose lactaat lactulose malaat myo-inositol oxaalzuur kaliumsorbaat propionzuur putrescine kinazuur natriumpyruvaat natriumsuccinaat </td> sucrose thymidine xylitol Tabel 2 Lijst van materialen in de MAP experimenten.

Discussion

Hier presenteren we phenomic benaderingen voor de functionele karakterisering van faaggenen vermeende. Technieken omvatten een ontwikkelde assay geschikt gastheer toezicht anabole metabolisme, de multi-fenotype testplaten (MAP), naast de gevestigde werkwijze van metabolomics, kan meten effecten katabole stofwisseling. Wij aanvullende instrumenten om het grote datasets als gevolg van deze technieken beheerst en hun high throughput verwerking en analyse 24. Tot slot, door middel van de vergelijking van een geannoteerde faag capsideproteïne, faag thioredoxine, twee vermeende faaggenen metabole, en de gemiddelde experimentele reactie stellen wij voor verschillende strategieën voor beide datasets en gen klassen te interpreteren, met de nadruk op de identificatie van fenotypische trends en identificatie van uitschieters.

Zoals gezegd, beide benaderingen kwantitatief te meten slechts de helft van ontvangst metabolisme. Om de relatieve werking van de interpretatienieuwe eiwitten in onderzoek, de gegevens van beide methoden is nodig om het bewijs van functie te geven. Hoewel dit niet een focus van onze huidige manuscript, wordt data-uitgangen van elke phenomic methode gebracht door middel van combinatorische analyses die zich richten op clustering technieken zoals willekeurige bos en principale componenten analyse. Bovendien moeten hypothesen gevolg van de gecombineerde analyse vervolgens bevestigd met klassieke genetische werkwijzen.

Tot slot, de methoden gepresenteerd worden sterk beïnvloed door bacteriële fysiologie en volgt dus dezelfde normen. Bij het uitvoeren van beide methoden, moeten overwegingen worden gedaan om onafhankelijke, klonale groepen worden geëxperimenteerd met waarborgen; besmetting wordt voorkomen; één variabele wordt getest; en passende controles worden tegelijkertijd liep. Het niet instaan ​​voor dergelijke punten waardoor onzuivere resultaten, vergelijkbaar met fysiologische assay.

Multi-fenotype testplaten(MAP)

De ontwikkeling van MAP biedt een hoge doorvoer en aanpasbaar assay in vergelijking met technologieën die momenteel beschikbaar zijn (Figuur 5A en tabellen 1,2). De assay maakt gebruik van voorraden, apparatuur en basistechnieken in alle microbiologische laboratoria. De integratie van een computationele pijplijn, PMAnalyzer 24, voor verdere verwerking van gegevens en analyse zorgt voor een snelle data-interpretatie. Bovendien kunnen zowel experimenteel en analytische aspecten van de aanpak gemakkelijk worden afgesteld of afgestemd voor aangepaste doeleinden. Als bijvoorbeeld een groot deel van de gegevens mislukt filteren beschreven in hoofdstuk 4 passen, kan handmatig vinden in de groeicurven om te identificeren. Als het probleem ontstaat als gevolg van strengere filterparameters kunnen aanpassingen aan het script worden. Alternatief, als er problemen geassocieerd met de experimentele werkwijze (bijv verlengde condensatie, onjuist overdracht van bacteriële cells, etc.) zullen aanvullende duplo gemakkelijk worden herhaald.

Zoals beschreven in Cuevas et al. 24, de PMAnalyzer is een enkel bash programma geschreven als een wrapper script dat de parsing en analyse scripts als een samenhangend, geautomatiseerde pijplijn uitvoert. Alle scripts zijn vrij toegankelijk vanuit een Git repository bij 25 Door de mediane waarde voor elk tijdstip tussen drievoud data en vervolgens parameterizes de logistische curve om de vertragingstijd te verkrijgen, maximale groeisnelheid, asymptoot, en een nieuwe term, Growth niveau. De mediaanwaarde is in onze studie om het effect van grote uitbijters te verminderen verkozen boven het gemiddelde, maar het script kan gemakkelijk worden aangepast aan het gemiddelde van duplo te berekenen. Door minder variatie (SE) gezien over herhaalde data (Figuur 2A) behielden we het gebruik van de mediaan in de PMAnalyzer voor bevestiging van een logistische curve. Bovendien, de afgesneden voor groei in deze studie (GL ≥ 0,4) was determined door het vergelijken van hoe gegevens gescheiden over Groei Level en maximale groei (Figuur 1A, B). Afhankelijk van de instrumenten en het model dat wordt gebruikt deze term kan variëren, waarbij herdefiniëring van deze afgesneden waarde.

Een groot voordeel van onze test is het vermogen te vergelijken fenotypes met één kenmerkende parameter totale microbiële groei, die we definiëren als groeipeil (GL). GL is een harmonisch gemiddelde, en vermindert daardoor de effecten van grote uitschieters. Het gebruik van een harmonisch gemiddelde met verschoven-logistieke gemonteerd waarden geven een overzicht van de groei is gekomen door middel van trial and error. Andere methoden geprobeerd om onderscheid groei opgenomen: tijd waarin specifieke curveparameters (half μ max, μ max en draagvermogen), de determinatiecoëfficiënt (R2), en combinaties van de R 2 vermenigvuldigd met specifieke curve parameters bereikt. Met behulp van een harmonisch gemiddelde met verschovenlogistieke-fit waarden voor de GL ontvangen uit zoveel mogelijk bij de evaluatie groei, waardoor werd de werkwijze van keuze. Een overweging te merken is dat dynamische groeicurve patronen hebben het potentieel verloren bij gebruik van een enkele parameter of aangepaste model. Bijvoorbeeld, de afzonderlijke curve parameters van het logistische curve en GL zijn niet in staat vertegenwoordigen bifasische groei. In enige koolstofbron, dit effect op de groei impliceert bemiddeling van het virale eiwit op ofwel de omzetting van het substraat of verschuiving van substraat gebruik. Bijkomende effecten potentieel verloren als niet het overwegen van meerdere groei parameters omvatten: langdurige vertraging, stelt een grotere last van virale machines of producten; snel versnellen exponentiële fase, suggereert virale eiwitten gekoppeld aan de productie van energie trajecten gastheer; of hogere vorming van biomassa, wat impliceert virale ondersteuning opname en anabolisme gastheer nutriënten (data niet getoond). Zo plotten ontluikende groeicurves ( <strong> Figuur 2A, B) geeft informatie over trends in de tijd dat de GL houdt rekening met de belangrijkste variabelen van het logistische model, verschaffen een kwantitatieve getal aan het succes van een kloon vertegenwoordigen.

Worden de verschillende reacties bijgedragen door structurele en metabole genen in de MAP wordt opgemerkt dat de verschillende substraat betrokken klassen de krachtigste bewijs voor eiwitfunctie. Zo zijn metabole eiwitten vaak geassocieerd met het verkrijgen beperken nutriënten die aspecifieke de centrale metabolisme 16,32 gastheer. Voorlopige MAP experimenten blijkt dat klonen vermeende faaggenen metabole hebben een verhoogde vertragingsfase wanneer gegroeid op centraal metabolisme koolstofbronnen (Figuur 2A). Omgekeerd klonen uitvoeren vermeende structurele genen, waarin grote verhoudingen van gastheer energie en dNTP zwembaden vergen, resulteren in een vals positieve reactie op de groei voor central en aminozuurmetabolisme koolstofsubstraten. Dit is waarschijnlijk te wijten aan de accumulatie van onoplosbare eiwitten die in gastheer filamentatie en / of insluitingslichamen, zoals waargenomen via microscopie (figuur 2A en data niet getoond). Terwijl verdere analyse is nodig om deze voorlopige resultaten te valideren, de kaarten zijn in staat om ophalen van fenotypische reacties die correleren met de functies van specifieke faag gen klassen hypothese.

Naast de opheldering van onbekende virale eiwitten, de kaarten zijn een nieuwe bron om de functionele en metabolische diversiteit van een individuele bacterie of door bacteriën te onderzoeken. MAP componenten zijn ontworpen voor eenvoudige wijziging van de groei van verschillende bacteriën te ondersteunen; waaronder marine, auxotrofe en anaërobe bacteriën. Om deze inspanningen gedefinieerde basale pre-kweekmedium vereisen extra of gewijzigde chemische species voor een ander bacterieel genus kunnen worden ondersteund in de MAP vergemakkelijken.Een opmerking in dit gebruik van de kaarten is naar gedefinieerd media te behouden, een verbod op het gebruik van ingrediënten zoals trypton, gistextract en pepton.

Metabolomics

Het gebied van metabolomics is afhankelijk metabolietdatabases, die geïsoleerd metabolieten geïdentificeerd door massaspectrometrie omvatten. De kern faciliteit hier gekozen heeft één van de grootste metabolomics databases. Interessant is dat meer dan de helft van de metabolieten als gevolg van onze experimenten waren identificeerbaar (~ 65%), terwijl andere nooit eerder opgeslagen in de gastheer Escherichia coli (voorbeelden zijn: Indole 3 33 azijnzuur, salicylzuur 34 en dihydroabiëtinezuur 35). Dit feit kan worden toegeschreven aan zowel een sterke neiging van de gegevensbank richting plantenmetabolieten of de specifieke eiwitten onderzocht. Ongeacht, het resultaat een beperkt aantal bekende metabolieten vindt datarepresentatie en analyse. In de futuur, meerdere metabolomics methoden gebruik van verschillende databases zou zorgen voor een grotere metaboliet dekking.

Momenteel bekende en onbekende metabolieten worden gebruikt bij het vergelijken en tegenover elkaar onze nieuwe virale eiwitten. Met deze aanpak, veronderstellen we dat klonen functioneel vergelijkbare eiwitten een verhoogde gelijkenis in hun volledige metabolomic profiel zullen delen. Voorafgaande metabolomics analyse bleek dat terwijl structurele en metabolische genen niet duidelijk van elkaar gescheiden, die genen vertonen soortgelijke effecten op de gastheer wanneer overexpressie correleren (figuur 6). Bijvoorbeeld, de geannoteerde capside-gen clusters samen met het vermeende metabole genen die in deze studie, EDT2440 en EDT2441. Onderzoeken met behulp van een algemeen beschikbare transmembraan topologie en signaalpeptide voorspeller programma toonde bewijs dat beide vermeende metabole genen haven een enkele transmembraandomein. Interessant 5 uit the 9 klonen in de eerste clustergroep (meest linkse gedeelte van het dendrogram) hebben transmembraandomeinen volgens dezelfde topologie programma voorspeld. Verder onderzoek is nodig, maar is het waarschijnlijk dat dit bij de overexpressie van deze klonen metabolieten worden geassocieerd met cellulaire stressrespons gevolg van membraan of structurele lasten. Dit bewijs ondersteunt dat terwijl metabolomics data bezit een verhoogde hoeveelheid ruis, de werkwijze kan benadrukken signalen die algemene gevolgen van genen, zowel binnen als tussen een gen klasse differentiëren. Om te bepalen of de werkwijze kan extraheren uit specifieke informatie genfunctie, metabolieten werden gegroepeerd in specifieke metabole pathways. De hypothese zijn, indien een kloon beïnvloedt metabolieten specifiek voor één traject, dan is de overexpressie gen actief in dat traject. Voorafgaand aan de oprichting van ons metabolomics kwaliteitsborging pijpleiding, voorlopige gegevens blijkt dat meer dan eend ondervertegenwoordigd metabolieten meestal "onbekend", die weinig informatie over de paden waaraan ze zijn gekoppeld (data niet getoond). Voorbewerkte metabolomics data toont echter dat de meeste metabolietprofielen soortgelijk zijn en slechts een beperkt aantal bekende en onbekende metaboliet abundanties variëren tussen klonen, bijvoorbeeld putrescine en uracil (figuur 6). Om hogere resolutie eiwitfunctie inspanningen leveren worden aan de faaggenen nieuwe experimenten vergelijken met bekende faag genen, die kunnen worden gebruikt in de "gaten" metaboliet gebaseerde functionele karakterisering te vullen. Met deze techniek, de toegewezen functie van bekende virale genen verschaft een referentie voor de functie van onbekende genen. Toch is de beperkende factor metabolomic analyse is de omvang en relevantie van de database. Om te corrigeren voor deze beperkingen, metabolomic databases relatable aan dit onderzoek moeten worden ontwikkeld; zodanigals een database van metabolieten en hun abundanties specifiek voor de ASKA verzameling E. coli klonen waarin één enkel ORF tot overexpressie 36. Bewijs voor de noodzaak van dergelijke databases was voorzien in 2013 toen onderzoekers van de Lawerence Berkeley National Laboratory samengesteld de eerste uitgebreide database van metabolieten die specifiek zijn voor hele mutant bibliotheken van model bacteriën 37. Dit onderzoek leverde nieuw inzicht in de genen die nodig zijn voor het gebruik van specifieke metabolieten, het openbaren van de duidelijk verband tussen fenotype en genotype.

Bij het overwegen van metabolomics als hulpmiddel, is het belangrijk om duidelijk af te bakenen verwerking, gevolgd in de kern faciliteit. Een artefact van de meest experimentele procedures is de dag-tot-dag variatie in verband met de instrumenten van het gebruik. Tot op heden zijn alle GC-MS-analyse implementeert het gebruik van interne standaarden die zijn opgenomen in elke analytische run; Echter, de toevoeging van projectspecifieke interne samples </ Em> liep elke dag van experimenten verwijdert extra variantie. Deze overwegingen moet vroeg worden gericht aan normalisering problemen en vooroordelen te voorkomen. Een andere oplossing is om alle monsters te verwerken op een kernfaciliteit op dezelfde machine als los batch, optioneel verkrijgbaar bij elke doorvoer faciliteit.

De verschillende instrumenten zowel geïntroduceerd en opnieuw onderzocht in dit manuscript bieden nieuwe middelen om te screenen en te karakteriseren faaggenen functioneel onbekend. De eenvoud en de aanpasbaarheid van de experimentele technieken de stroomlijn gebruik van computationele leidingen verzekert deze methoden zijn toepasbaar op een breed scala van onderzoek inspanningen en velden. Ons doel is dat de phenomic benaderingen hier gepresenteerde verdere onderzoeken van faageiwitten roman in aanvulling zal helpen om systemen die even functioneel undefined.

Disclosures

The authors have nothing to disclose.

Acknowledgements

We thank Benjamin Knowles, Yan Wei Lim, Andreas Haas, and members of the Viral Dark Matter consortium for their help and constructive input on this manuscript. This research is funded by the National Science Foundation (DEB-1046413) and is part of the Dimensions: Shedding Light on Viral Dark Matter project.

Materials

0.22µm Sterivex Filter Fisher Scientific SVGP01050 Millipore
0.22µm Millex Filters Fisher Scientific SLGV033RS Millipore
0.22µm SteriCap Filter Fisher Scientific SCGPS02RE Millipore
0.22 µm Omnipore membrane filters Millipore JHWP02500 Millipore
96 well micro-titer plates  VWR 82050-764 Standard F-Bottom 96 well Microplates
2 mL 96 well plate Fisher Scientific
Adhesive Seal Plate Film Sigma-Aldrich Z369667
2 L Nalgene square bottles Cole Parmer T-06040-70
125 mL Nalgene square bottles Cole Parmer T-06040-50
1/4inch Panel Mount Lock Nut, black nylon  Cole Parmer EW-45509-04
Female Luer Thread Style Panel Mount to 200 Series Barb  1/16inch  Cole Parmer EW-45500-30
Female Luer Thread Style Panel Mount to 200 Series Barb, 1/8inch Cole Parmer EW-45500-34
Male Luer Integral Lock Ring to 500 Series Barb, 1/16inch ID tubing Cole Parmer EW-45505-31
Male Luer with Lock Ring x Female Luer Coupler Cole Parmer T-45508-80
Barbed Bulkhead Fittings 1/4inch OD  Fisher Scientific 6149-0002
Sanipure Tubing 1/16inch ID x 1/8inch OD  SaniPure AR400002
Sanipure Tubing 1/4inch OD x 1/8inch ID  SaniPure AR400007
Variable Flow Mini Pump (Peristaltic pump) Fisher Scientific 13-876-1
Magnetic Stirrer Velp Scientifica F203A0160
Forceps Fisher Scientific 14-512-141  Millipore* Filter Forceps 
Multi-plate spectrophotometer plate reader Molecular Devices Analyst GT
Filter manifold Fisher Scientific  XX10 025 02
Software:
Python version 2.7.5 http://www.python.org/
PyLab module http://wiki.scipy.org/PyLab
R version 3.0.1  http://www.r-project.org/
reshape2 library http://had.co.nz/reshape
ggplot2 library http://ggplot2.org/
Gene Composer PSI Tech Portal http://www.genecomposer.net
Services:
West Coast Metabolomics Center UC Davis http://metabolomics.ucdavis.edu
DNA 2.0 https://www.dna20.com

References

  1. Wommack, K. E., Colwell, R. R. Virioplankton: Viruses in Aquatic Ecosystems. Microbiology and Molecular Biology Reviews. 64 (1), 69-114 (2000).
  2. Hendrix, R. W. Recoding in Bacteriophages. Recoding: Expansion of decoding rules enriches gene expression. 24, 249-258 (2010).
  3. Breitbart, M., et al. Genomic analysis of uncultured marine viral communities. Proceedings of the National Academy of Sciences. 99 (22), 14250-14255 (2002).
  4. Breitbart, M., et al. Diversity and population structure of a near-shore marine-sediment viral community. Proceedings. Biological sciences / The Royal Society. 271 (1539), 565-574 (2004).
  5. Dinsdale, E. A., et al. Functional metagenomic profiling of nine biomes. Nature. 452 (7187), 629-632 (2008).
  6. Vega Thurber, R. L., et al. Metagenomic analysis indicates that stressors induce production of herpes-like viruses in the coral Porites compressa. Proceedings of the National Academy of Sciences of the United States of America. 105 (47), 18413-18418 (2008).
  7. Pedulla, M. L., et al. Origins of highly mosaic mycobacteriophage genomes. Cell. 113 (2), 171-182 (2003).
  8. Calendar, R., Abedon, S. T. . The bacteriophages. , (2006).
  9. Breitbart, M., Miyake, J. H., Rohwer, F. Global distribution of nearly identical phage-encoded DNA sequences. FEMS microbiology letters. 236 (2), 249-256 (2004).
  10. Klenk, H. -. P., Palm, P., Zillig, W. DNA-Dependent RNA Polymerases as Phylogenetic Marker Molecules. Systematic and Applied Microbiology. 16 (4), 638-647 (1993).
  11. Breitbart, M., Thompson, L., Suttle, C., Sullivan, M. Exploring the Vast Diversity of Marine Viruses. Oceanography. 20 (2), 135-139 (2007).
  12. Mann, N. H., Cook, A., Millard, A., Bailey, S., Clokie, M. Marine ecosystems: bacterial photosynthesis genes in a virus. Nature. 424 (6950), 741 (2003).
  13. Mann, N. H., et al. The genome of S-PM2, a “photosynthetic” T4-type bacteriophage that infects marine Synechococcus strains. Journal of bacteriology. 187 (9), 3188-3200 (2005).
  14. Lindell, D., et al. Transfer of photosynthesis genes to and from Prochlorococcus viruses. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11013-11018 (2004).
  15. Millard, A., Clokie, M. R. J., Shub, D. A., Mann, N. H. Genetic organization of the psbAD region in phages infecting marine Synechococcus strains. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11007-11012 (2004).
  16. Sullivan, M. B., Coleman, M. L., Weigele, P., Rohwer, F., Chisholm, S. W. Three Prochlorococcus cyanophage genomes: signature features and ecological interpretations. PLoS biology. 3 (5), e144 (2005).
  17. Rohwer, F., et al. The complete genomic sequence of the marine phage Roseophage SIOI shares homology with nonmarine phages. Limnology and Oceanography. 45 (2), 408-418 (2000).
  18. Miller, E. S., et al. Complete genome sequence of the broad-host-range vibriophage KVP40: comparative genomics of a T4-related bacteriophage. Journal of bacteriology. 185 (17), 5220-5233 (2003).
  19. Thompson, L. R., et al. Phage auxiliary metabolic genes and the redirection of cyanobacterial host carbon metabolism. Proceedings of the National Academy of Sciences of the United States of America. 108 (39), E757-E764 (2011).
  20. Paterson, S., et al. Antagonistic coevolution accelerates molecular evolution. Nature. 464 (7286), 275-278 (2010).
  21. Seguritan, V., et al. Artificial neural networks trained to detect viral and phage structural proteins. PLoS computational biology. 8 (8), e1002657 (2012).
  22. Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture Medium for Enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
  23. Khlebnikov, A., Datsenko, K. A., Skaug, T., Wanner, B. L., Keasling, J. D. Homogeneous expression of the P(BAD) promoter in Escherichia coli by constitutive expression of the low-affinity high-capacity AraE transporter. Microbiology (Reading, England). 147 (Pt 2), 3241-3247 (2001).
  24. Cuevas, D. A., et al. Elucidating genomic gaps using phenotypic profiles. F1000Research. , (2014).
  25. Zwietering, M. H., Jongenburger, I., Rombouts, F. M., van’t Riet, K. Modeling of the bacterial growth curve. Applied and environmental microbiology. 56 (6), 1875-1881 (1990).
  26. Schmieder, R., Lim, Y. W., Rohwer, F., Edwards, R. TagCleaner: Identification and removal of tag sequences from genomic and metagenomic datasets. BMC bioinformatics. 11, 341 (2010).
  27. Schmieder, R., Edwards, R. Quality control and preprocessing of metagenomic datasets. Bioinformatics (Oxford, England). 27 (6), 863-864 (2011).
  28. Schmieder, R., Edwards, R. Fast identification and removal of sequence contamination from genomic and metagenomic datasets. PloS One. 6 (3), e17288 (2011).
  29. Welch, M., et al. Design parameters to control synthetic gene expression in Escherichia coli. PloS One. 4 (9), e7002 (2009).
  30. Fiehn, O., et al. Quality control for plant metabolomics: reporting MSI-compliant studies. The Plant journal: for cell and molecular biology. 53 (4), 691-704 (2008).
  31. Zeng, Q., Chisholm, S. W. Marine viruses exploit their host’s two-component regulatory system in response to resource limitation. Current biology: CB. 22 (2), 124-128 (2012).
  32. Shindy, W. W., Smith, O. E. Identification of plant hormones from cotton ovules. Plant physiology. 55 (3), 550-554 (1975).
  33. Lee, H. I., Leon, J., Raskin, I. Biosynthesis and metabolism of salicylic acid. Proceedings of the National Academy of Sciences of the United States of America. 92 (10), 4076-4079 (1995).
  34. Chappell, J. The Biochemistry and Molecular Biology of Isoprenoid Metabolism. Plant Physiology. 107 (1), 1-6 (1995).
  35. Kitagawa, M., et al. Complete set of ORF clones of Escherichia coli ASKA library (a complete set of E. coli K-12 ORF archive): unique resources for biological research. DNA research: an international journal for rapid publication of reports on genes and genomes. 12 (5), 291-299 (2005).
  36. Baran, R., et al. Metabolic footprinting of mutant libraries to map metabolite utilization to genotype. ACS chemical biology. 8 (1), 189-199 (2013).

Play Video

Cite This Article
Sanchez, S. E., Cuevas, D. A., Rostron, J. E., Liang, T. Y., Pivaroff, C. G., Haynes, M. R., Nulton, J., Felts, B., Bailey, B. A., Salamon, P., Edwards, R. A., Burgin, A. B., Segall, A. M., Rohwer, F. Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins. J. Vis. Exp. (100), e52854, doi:10.3791/52854 (2015).

View Video