Summary

Fenomica fagi: Approcci fisiologici per caratterizzare Novel virali Proteine

Published: June 11, 2015
doi:

Summary

Here, we present phenomic approaches for the functional characterization of putative phage genes. Techniques include a developed assay capable of monitoring host anabolic metabolism, the Multi-phenotype Assay Plates (MAPs), in addition to the established method of metabolomics, capable of measuring effects to catabolic metabolism.

Abstract

Le ricerche in corso in interazioni fago-ospite dipendono estrapolazione conoscenze da (meta) genomi. È interessante notare che, il 60 – 95% di tutte le sequenze dei fagi condividere alcuna omologia con le proteine ​​annotati attuali. Di conseguenza, gran parte dei geni fago annotati come ipotetico. Questa realtà incide pesantemente l'annotazione di entrambi i geni metabolici strutturali e ausiliari. Qui vi presentiamo metodi Phenomic progettati per catturare la risposta fisiologica (s) di un host selezionato durante espressione di uno di questi geni fago sconosciuti. Multi-fenotipo del saggio Piastre (MAP) vengono utilizzati per monitorare la diversità di utilizzazione del substrato di accoglienza e successiva formazione della biomassa, mentre la metabolomica fornisce un'analisi bi-prodotto attraverso il monitoraggio del metabolita abbondanza e la diversità. Entrambi gli strumenti sono utilizzati simultaneamente per fornire un profilo fenotipica associata con l'espressione di un singolo fago putative open reading frame (ORF). Risultati rappresentativi per entrambi i metodi sono confrontati, highlighting le differenze fenotipiche profilo di un host che trasportano sia putativi geni fago strutturali o metaboliche. Inoltre, le tecniche di visualizzazione e ad alto rendimento condutture computazionali che hanno facilitato l'analisi sperimentale sono presentati.

Introduction

I virus che infettano i batteri (aka batteriofago o fago) sono stimate a esistere da più di 10 31 particelle simili al virus (VLP) a livello globale e più numerosi di tutti gli altri organismi in un ambiente 1,2. Il primo studio metagenomica indagando le comunità virali associati agli ambienti marini incentrata sulla quantificazione della diversità visto all'interno della frazione virale 3. Inoltre, Breitbart e colleghi hanno scoperto che oltre il 65% delle sequenze virali di comunità condivisa omologia di eventuali sequenze disponibili nelle banche dati pubbliche. Studi successivi hanno trovato prove metagenomiche simile: metagenomi da sedimenti marini a San Diego, California contengono il 75% sconosciuti sequenze virali 4; metagenomi dai laghi ipersalini del Salton Sea contengono il 98% sconosciuti sequenze virali 5; e metagenomi corallo associata contengono 95-98% sequenze virali sconosciuti 6. Questo accumulo di informazioni non annotate ha portatomateriale genetico Fago essere "la materia oscura dell'universo biologico" 7.

Caratterizzazione genomica del fago si basa sull'identificazione di similarità di sequenza attraverso il confronto contro banche dati esistenti degli acidi nucleici e proteine. Poiché le informazioni genetiche fago codifica è prevalentemente ignota, metodi basati omologia-sono inefficaci. All'interno del loro genoma, fagi tipicamente codificano tre principali tipi di geni: trascrizione e replicazione dei geni, i geni del metabolismo, e geni strutturali. I geni di trascrizione e replicazione (classe I / II geni 8) includono polimerasi, primases, endo / eso-nucleasi e chinasi. Questi geni sono altamente conservati per la loro importanza in infezione fagi, trascrivendo e replicare materiale genetico fago. Polimerasi dei fagi sono facilmente identificabili con metodi sequenza omologia tradizionali a causa della loro conservazione globale 9 e hanno dimostrato di servire come efficace marcatori filogenetici 10.Al contrario, fago metabolico e geni strutturali (classe II / III geni 8) sono sempre più divergenti e spesso annotato come geni ipotetiche.

Fagi geni metabolici influenzano la capacità metabolica del paese ospitante e non sono necessariamente necessari per la replicazione virale. Questi geni, spesso denominate geni metabolici come ausiliari 11 (AMG), sembrano modulare il metabolismo di accoglienza e consentire la progressione ottimale di infezione e il successo del virione di maturazione. AMG sono stati associati con l'utilizzo e la diffusione delle sostanze nutritive che limitano o in percorsi di produzione di energia. Alcuni esempi includono geni fotosistema presenti nei genomi di varie cyanophage 12-16, geni connesse e regolati da metabolismo del fosfato 17,18, e l'utilizzo della via dei pentoso fosfati per fago dNTP biosintesi 18,19. In confronto, i geni strutturali sono tra la metà e la fine degli anni geni prodotte durante l'infezione e variano tra i diversi fago-hoSistemi di st. La produzione delle proteine ​​strutturali sono subordinati alla disponibilità di dNTP virale, e piscine energia per la loro trascrizione, traduzione e assemblaggio 8. Le proteine ​​del capside e fibra di coda strutturali sono considerati come il più divergente di tutti i geni codificanti proteine ​​virali e sono necessari per la produzione di virion successo. La loro divergenza è tipicamente attribuita al ruolo attivo che ricoprono nella definizione dei virus-ospite coevoluzione 20. Proteine ​​divergenti, indipendentemente dalla classe gene, vengono facilmente trascurati quando utilizzando tecniche di omologia e allineamento di sequenze tradizionali. Uno sforzo per correggere le limitazioni osservati con sequenza comparazioni severe ha comportato strumenti bioinformatici capaci di utilizzare caratteristiche di sequenza per determinare associazione, come le reti neurali artificiali 21. Reti neurali artificiali (ANN) consentono la previsione di geni strutturali e metabolici, tuttavia, richiedono validazione sperimentale a valle di caratterizzare direttamentela funzione del gene.

L'obiettivo di questo manoscritto è quello di fornire i protocolli Phenomic in grado di monitorare sia il metabolismo catabolico e anabolico di un batterio ospite durante l'espressione di un nuovo gene fago, funzionalmente previsto attraverso RNA. Il campo di fenomica, biologia associata a fenotipi cellulari, è ben consolidata in biologia dei sistemi per aiutare nelle indagini di proteine ​​con funzione sconosciuta o pleiotropico. Strumenti Phenomic vengono utilizzati per collegare le informazioni fenotipiche all'informazione genotipica. Ipotizziamo per i geni dei fagi putativi che la loro funzione (s) può essere determinato attraverso l'osservazione di accoglienza effetti fisiologici durante l'espressione del gene fago. Per studiare questa ipotesi, sono stati scelti due metodi quantitativi. Piastre Multi-fenotipo Assay (MAP) sono stati usati per monitorare l'utilizzo del substrato di accoglienza e la conseguente formazione di biomassa, mentre la metabolomica misurate diversità metabolita ospite e relativa abbondanza durante la crescita in ambienti specificicondizioni mentali. Proteine ​​strutturali e metaboliche putativi sono stati overexpressed in Escherichia coli e risultati rappresentativi di entrambi gli esperimenti vengono confrontati. Numerose tecniche visive e condotte di elaborazione high throughput vengono presentati per facilitare la replicazione sperimentale. Infine, la riproducibilità e la precisione dei metodi presentati sono discussi nel contesto degli effetti fisiologici attesi per una proteina capside annotato e fago proteine ​​metabolica, tioredossina, più due AMGs putativi.

Protocol

1. Preparazione di Multi-fenotipo Assay Piatto (MAP) Substrati, basale Media, Pre-crescita media, e Buffer Fate 50 ml di 1,0-1,25% scorte substrato. Sciogliere 1,0-1,25% (w / v) di supporto solido in acqua sterile (calore se necessario). Filtro sterilizzare soluzioni con un gruppo filtro 0,22 micron e le scorte dei negozi a temperatura ambiente. Esempi di substrati utilizzati in questi esperimenti sono riportati nella Tabella 2. Rendere 250 ml di media basale 3x per tutte le classi di substrato (carbonio, azoto, zolfo e fosforo). I MOPS (3 morpholinopropane-1-solfonato) basati mezzi basali 22 contiene i seguenti: 1x MOPS (40 MOPS mm + 10 mm) tricina, 0,4% glicerolo *, 9.5 NH mm 4 Cl *, 0.25 Naso mm 4 *, 1,0 MgSO mM 4 *, 1.32 mM K 2 HPO 4 *, KCl 10 mM, 0,5 mM CaCl 2, 5 mM NaCl, 6 mM FeCl 3, e 0,1% (w / v) L-arabinosio ** (Tabelle 1 e 2) . Nota: * Questi composti non sono inclusi in base al supporto basale. Ad esempio, 0,4% glicerolo non viene utilizzato dai media basali carbonio e zolfo terreni di base 1.0 mM MgSO 4 è sostituito dal 1,0 mM MgCl 2. ** L-arabinosio è specifico per l'induzione della pBAD promotore vettore, pEMB11, che è stato trasformato in un ara – E. coli K-12 ceppo (BW 27784) 23. Aggiungere ogni componente dei media basale in un pallone sterile e portare la soluzione al volume. Mescolare bene. Con un'unità 0,22 micron, filtro sterilizzare ogni supporto basali in una bottiglia sterile. Fate 500 ml di mezzi MOPS pre-crescita. MOPS basato sui media pre-crescita del 22 contiene: 1x MOPS (MOPS 40 mm + 10 mm) Tricine, 0,4% glicerolo, 9,5 mm NH 4 Cl, 0,25 Naso mm 4, 1.0 MgSO mm 4, 1,32 mm K 2 HPO 4, KCl 10 mM, 0,5 mM CaCl 2, 5 mM NaCl e 6 mM FeCl 3. Aggiungere ognicomponente dei mezzi di pre-crescita in una beuta sterile e portare a volume. Filtro sterilizzare con un gruppo filtro di 0,22 micron, quindi aggiungere ampicillina ad una concentrazione finale di 100 mg / ml. Conservare la soluzione a 4 ° C. Fate 500 ml di 0.5x Luria-Bertani (LB) piastre di agar. In un pallone sterile, aggiungere componenti LB per fare una concentrazione 0,5x (1,25 g estratto di lievito, 2,5 g NaCl, 2,5 g triptone, 7,5 g di agar). Mescolare bene e autoclave per la sterilizzazione. Raffreddare agar, poi aggiungere 100 mg / ml di ampicillina antibiotico con miscelazione. Versare ~ 25 ml di agar in piastre di Petri, permettono di impostare, e conservare a 4 ° C fino al momento dell'uso. Rendere 250 ml di Tris 10 mM (pH 7,4) più 10 mM MgSO 4 soluzione tampone. Filtro sterilizzare con una unità di 0,22 micron filtro, e la soluzione di conservare a temperatura ambiente. 2. Preparazione di Bacterial Cell-sospensione Preparare colonie fresche. Da un stock di glicerolo congelato 12,5%, piatto fresco E. coli clones su 0.5x LB agar contenente 100 mg / ml di ampicillina. Incubare a 37 ° C per 24 ore. Preparare colture liquide: Pipettare 3 ml di supporti pre-crescita contenenti 100 mg / ml di ampicillina in provette di coltura. Per ogni clone, utilizzare triplica biologici. Seminare colonie indipendenti di sezione 2.1 in provette di coltura preparati. Incubare a 37 ° C con agitazione per 22 ore. Pellet e lavare le cellule batteriche: Trasferimento O / N culture in 1,7 ml tubi microcentrifuga. Cellule pellet tramite centrifugazione a velocità massima (16.900 xg) per 2 minuti in una microcentrifuga. Decantare il surnatante e lavare le cellule da ri-sospensione in 500 ml di 10 mM Tris / 10 MgSO mm 4 buffer. Ripetizione. Re-pellet cellule surnatante decantare e risospendere le cellule in 1 ml di 10 mM Tris / 10 MgSO mm 4 buffer. Misurare densità cellulare e concentrare le cellule (se necessario): Diluire le cellule dal punto 2.3.3 10 volte inTris mM il 10/10 mM MgSO 4 tampone e trasferire questa diluizione nella cuvetta. Misurare la densità ottica (OD 600 nm) di questa diluizione e registrare. Concentrato cellule per conseguire concentrazione finale di 0.07 (OD 600 nm) nelle mappe (le cellule saranno diluiti 15 volte quando vengono aggiunti alle mappe, quindi le cellule devono essere ad una concentrazione iniziale di OD 600 nm = 1,05). Trasferimento sospensione cellulare concentrata in un serbatoio e salvare (a temperatura ambiente) fino al punto 3.5 del MAP preparazione. 3. Preparazione del Multi-fenotipo Piastre Assay (MAP) Etichetta MAP. Etichetta 96 pozzetti piastre micro-titolazione sterili con un E. coli numero di identificazione clone e tipo di mappa schematica. Aliquota acqua sterile in mappe. Trasferire asetticamente acqua sterile in un serbatoio di liquido. Pipettare 60 microlitri in ciascun pozzetto della piastra di micro-titolazione con una pipetta multicanale. Aliquota dei media basale into mappe. Trasferire asetticamente 3x supporti basali in un serbatoio di liquido. Pipettare 50 microlitri in ciascun pozzetto della piastra di micro-titolazione con una pipetta multicanale. Ripetere i punti 3.2 e 3.3 per ciascun supporto basali utilizzati nel MAP schematico. Substrati Aliquota in mappe. Trasferire 30 ml di ogni substrato nel pozzo appropriata delle mappe. Aggiungi sospensione batterica alle mappe. Trasferimento 10 ml di cellule batteriche da sezione 2.4.2 in ciascun pozzetto del MAP usando una pipetta multicanale. Cambiare suggerimenti prima pipetta reintroduzione di nuovo nella cultura magazzino. Mappe di copertura con pellicola adesiva. Coprire ogni piatto con un unico film targhetta adesiva. Premere saldamente la pellicola cima pozzetti della piastra e lungo i bordi per creare una tenuta uniforme e stretto. Rimuovere la pellicola in eccesso dai bordi della piastra di micro-titolazione con una lama di rasoio sterile. Misurare la densità ottica di MAP: Mettere MAP preparati nella manica "Input" di un Spectro multidiscolettore di piastre fotometro. Aprire la piastrina di software di lettura e creare un protocollo che misura l'assorbanza (OD 600 nm) ogni 30 min, per un totale di 32 ore, con 60 sec di scuotimento tra letture. La temperatura impostata nell'apparecchio a 37 ° C. Inizia protocollo una volta MAP sono equilibrati per impostare la temperatura. Dopo 32 ore, rimuovere le mappe dal manicotto "Uscita" del lettore di piastre. Etichettare ogni file di testo di dati da includere: la E. Numero di identificazione del clone coli, data la MAP corse, e il tipo di schema MAP. 4. Multi-fenotipo del saggio Piastre (MAP) trasformazione e di parametrizzazione Valutare le curve di crescita che utilizzano un processo di QA automatizzato, ad esempio, PMAnalyzer 24. Verificare che le curve di crescita hanno OD 600 nm <0.20 nei primi 2 ore. Non utilizzare assorbanza a punto di tempo iniziale (t 0) nel filtro a causa di artefatti di condensazione, che in genere si risolvono int 1 (30 min). Rimuovere le curve di crescita che violano filtro QA. Salvare le informazioni curva (nome del campione, oltre il numero, e OD 600 nm) dei valori in un file di output separato per riferimento futuro. Continuare con l'analisi se curva di crescita passa filtro QA. Calcolare curve di crescita medi. Utilizzando la replica dei dati, per bene, calcolare la curva di crescita medio prendendo la densità ottica media (OD 600 nm) valore in ogni punto. Record risultante curve di crescita medi in un file di output separato per un utilizzo futuro. Calcolare il modello logistico più adatta per ogni curva di crescita utilizzando un adattamento dell 'equazione proposta da Zwietering 25. L'equazione logistica comprende tre parametri che descrivono la crescita batterica: il tempo di ritardo, λ (ora), il tasso massimo di crescita, la μ max (OD 600 nm 100 -1), e la produzione di biomassa finale, α (OD 600 nm). Utilizzare i dati al tempo = 30 min (y 1) come valore iniziale a causa di artefatti di condensa. [1] Calcolare il tasso di crescita massimo utilizzando una ricerca diretta. Registrare il tasso più grande di cambiamento in un intervallo di 90 minuti all'interno dei dati. [2] Stimare la produzione di biomassa finale ricercando il valore asintotico superiore del più grande media mobile su una finestra di 90 minuti. In particolare, definire l'asintoto della curva di crescita. [3] Utilizzando la μ max e A valori da 4.3.1 e 4.3.2, trovare il valore λ provando tutti i valori di λ: [4] Usare ogni valore λ per calcolare una somma di errori al quadrato (SSE). Utilizzare il più basso SSE è il SSE (Às): /files/ftp_upload/52854/52854eq5.jpg "/> [5] 5. fenotipo analisi di MAP Calcolare il livello di crescita (GL) per ogni curva di crescita per valutare la crescita complessiva, per clone per substrato. Definire GL come la media armonica dei valori logistico-misura spostati: [6] Assegnare un fenotipo ad ogni curva di crescita in base ai valori GL. Qui, i quattro fenotipi utilizzati sono: crescita attesa, nessuna crescita, guadagno di funzione, e perdita di funzione. Determinare fenotipi confrontando crescita in tutti i cloni su un substrato specifico in termini di deviazioni standard dalla media. Utilizzare questa statistica e una soglia minima di crescita per designare il fenotipo presentata dalla curva di crescita (Figura 1A, B). Figura 1C fornisce esempi di assegnazione fenotipo. Definire la crescita come GL ≥ 0.4 (Figure 1A, B). Definire guadagno di funzione (Figura 1C, verde), come avere un GL> due deviazioni standard sopra la media e una media> la soglia di crescita. La perdita di funzione (Figura 1C, rosso) è definito come avere un GL <due deviazioni standard sotto la media e una media> la soglia di crescita. Creare rappresentazioni visive del set di dati in base a fenotipi e curve di crescita. Vista la dinamica di crescita che ritraggono OD 600 nm valori come colore di confrontare rapidamente le curve di crescita tra i più cloni (Figura 2). Visualizza distribuzioni fenotipiche tra tutti i cloni in base alle condizioni di crescita (Figura 3). 6. Costruire la cultura Apparatus continua Costruzione di porti Reactor (4A, B). Praticare tre 1/4. Fori, distanziati da 3/4 in. A parte, nel tappo del reattore coltura continua. Foα port r: vite di un pannello stile femminile filo luer montare a 1/16 in sbavatura dal fondo del tappo con la sbavatura rivolta verso l'alto, fuori dal tappo.. Ardiglione sicuro con un pannello da 1/4 in. Montare il dado di bloccaggio. Per la porta β: avvitare un pannello stile femminile filo luer montare a 1/16 in ardiglione con l'ardiglione rivolta verso l'alto, fuori dal tappo.. Ardiglione sicuro con un pannello da 1/4 in. Montare il dado di bloccaggio. Per la porta γ: Vite un pannello stile femminile filo luer montare a 1/16 in sbavatura dal fondo del tappo così la sbavatura è rivolta verso l'alto, fuori dal tappo.. Sbavatura sicuro con 1/4 in. Montaggio a pannello dado di bloccaggio. Vite di un luer maschio con anello di bloccaggio integrale 1/8. Tubo ampia foro al raccordo sulla parte interna del tappo sbavatura. Per la luce di uscita: praticare un 5/16 in foro al contrassegno 75 ml del reattore coltura continua.. Tagliare 3/4. L'estremità dado del 1/4 in. Spinato montaggio della paratia. Avvitare la 1/4. Paratia spinato raccordo (guarnizione sia all'esterno della bottiglia ed il dado è sulla parte interna, FIGURA 4B). Feeding costruzione porta bottiglia (Figura 4C). Praticare due 1/4. Fori distanziati 1. A parte nel tappo della bottiglia di alimentazione. Per la δ porto: avvitare un pannello stile femminile filo luer montare a 1/8 in ardiglione con l'ardiglione rivolta verso l'alto, fuori dal tappo.. Ardiglione sicuro con un pannello da 1/4 in. Montare il dado di bloccaggio. Per la ε porto: avvitare un pannello stile femminile filo luer montare a 1/16 in ardiglione con l'ardiglione rivolta verso l'alto, fuori dal tappo.. Ardiglione sicuro con un pannello da 1/4 in. Montare il dado di bloccaggio. Vite un Luer maschio con anello di bloccaggio integrale 1/8 in. Tubo largo foro al raccordo a resca, sulla parte interna del tappo. Alimentazione tubi e le estensioni del tubo: Tagliate due 1. Pezzi di tubo (1/8 in. Di diametro esterno (OD) x 1/16 in. Diametro interno (ID)). Pezzi adattarsi su porti α e γ del reattore coltura continua realizzati nella sezione 5.2. Tagliare un singolo 1. Pezzo di tubing (1/4 in. OD x 1/8 in. ID). Fit pezzo sul porto Β del reattore coltura continua. Tagliare un singolo 3.5 in. Pezzo di tubo (1/8 in. OD x 1/16 in. ID). Adatta questo pezzo all'interno di γ portuali, sul luer maschio con anello di bloccaggio integrato a 1/8 in. Tubo foro largo. Port γ è la porta di campionamento del reattore coltura continua. Tagliare un singolo 1. Pezzo di tubo (1/4 in. OD x 1/8 in. ID). Applicare questo pezzo sulla porta δ del biberon. Tagliare un singolo 11. Pezzo di tubo (1/16 in. OD x 1/8 in. ID). Montare questo pezzo all'interno del porto ε del biberon, il luer maschio con anello di bloccaggio integrale 1/8. Tubo foro largo. Tagliate due 18 in. Pezzi di tubo (1/8 in. OD x 1/16 in. ID). Montare un pezzo di porto ε del biberon. Salvare l'altro pezzo per la sezione 7. 7. Esecuzione Culture continui per Metabolomica Sterilizzare i materiali: Autoclave il materiale secco per 30 min. Assicurati di avvolgere tappo del biberon fatta al punto 5 in un foglio di alluminio. Tenere attaccato dritto tubo. Avvolgere tappo del reattore coltura continua, fatta al punto 5, in un foglio di alluminio. Tenere attaccato dritto tubo. Avvolgere 18 in. Tubo tagliato nella sezione 6.3.5 e il più piccolo adattatore di tubo della pompa peristaltica in un foglio di alluminio. Tenere il tubo dritto. Autoclave per 30 min. Fai 2 L di 0,5x LB brodo. Nel biberon, fare 0.5x LB brodo. Coprire con un foglio di biberon. Autoclave per 1 ora. Fate 70 ml di brodo LB 0.5x. Versare il brodo nel reattore coltura continua. Posizionare un ancoretta nel reattore coltura continua. Coprire con un foglio e reattore autoclave per 30 min. Cultura continuo set-up: Batterico cellula-sospensione. Da un stock di glicerolo congelato 12,5%, piatto fresco E. cloni coli su 0.5x LB agar contenente 100 mg / ml di ampicillina. Covarea 37 ° C per 24 ore. Inoculare una singola colonia in 3 ml di 0.5x brodo LB contenenti 100 mg / ml di ampicillina. Per ogni clone utilizzare triplicato biologici. Incubare a 37 ° C con agitazione per 22 ore. Collegare insieme le parti. Mettere tutti i materiali in autoclave in una cappa di sicurezza biologica e accendere la luce ultravioletta su mentre i media si raffredda. Una volta che i media si è raffreddato, aggiungere 0,1% di L-arabinosio e 100 mg / ml di ampicillina a tutti 0.5x LB brodo. Unwrap continuo cap reattore cultura e avvitare al reattore. Evitare di toccare il tubo di campionamento. Svolgere il tappo della bottiglia di alimentazione e avvitare il biberon. Evitare di toccare il tubo di campionamento. Tenere il 18 in. Tubo collegato alla porta ε sterile. Un-avvolgere il 18. Tubo e l'adattatore tubo della pompa peristaltica. Montare una estremità libera 18 in. Tubi su una estremità dell'adattatore tubo della pompa peristaltica. Montare l'altra estremità dell'adattatore tubo della pompa peristaltica ail tubo 18 in. collegato alla porta ε del tappo della bottiglia di alimentazione. Vite 0,22 micron unità filtranti su porti β e δ del reattore coltura continua. Vite un'unità 0,22 micron filtro sull'adattatore di porto α. Per l'unità filtro di 0,22 micron, montare l'estremità libera 18 in. Tubo. Avviare la coltura continua. Nella cappa di biosicurezza, inoculare il reattore cultura continuo con 100 ml di O / N cultura realizzati nella sezione 7.2.1.1. Chiudere il sistema prima di spostare la cultura continua in un incubatore a 37 °. Nel incubatore hanno un piatto mescolare magnetica e mini pompa peristaltica istituito. Inserire l'adattatore tubo della pompa peristaltica nella pompa peristaltica. Tubing dal biberon inizia dalla "In" lato e il tubo che porta al reattore inizia al lato "Out". Impostare la pompa peristaltica a: "FAST". Avviare la pompa peristaltica passando per R20; FORWARD ". Verificare che supporti comincia a fluire attraverso il tubo. Posizionare reattore sulla piastra di agitazione magnetica e iniziare la miscelazione. Reattore cultura continua deve equilibrare per 24 ore prima del campionamento. Il campionamento della cultura continua. Vite a 5 ml siringa luer lok su γ portuali e tirare su 4,5 ml di cultura. Utilizzare 500 ml di coltura per misurare la densità (OD 600 nm). Diluire le cellule per fare 4 x 1 ml culture a OD 600 nm = 0,35. Aliquota culture diluito in 1,7 ml provette microcentrifuga. Ripetere campionamento ogni 12 ore per 4 giorni. Preparare i campioni per GC-TOFMS: Cellule pellet tramite centrifugazione alla massima velocità (16.900 xg) per 2 minuti. Decantare il surnatante. Lavare le cellule con 500 ml di tampone fosfato salino (PBS). Ripetere questo passaggio. Decantare il surnatante un'ultima volta, e poi immergere tubi microcentrifuga con celle in pellet in azoto liquido fino gorgogliare fermate. Sstrappò campioni in -80 ° C freezer. 8. L'esecuzione di passaggio seriale Culture batch per Metabolomica Preparazione batterico cellula-sospensione. Da un stock di glicerolo congelato 12,5%, piatto fresco E. coli cloni su 0.5x LB agar contenenti 100 mg / ml ampicillina. Incubare a 37 ° C per 24 ore. Seminare singole colonie in 3 ml di 0,5x LB brodo contenente 100 mg / ml ampicillina. Utilizzare triplicato biologiche per ogni clone. Culture lotti di passaggio di serie. Sottocultura O / N da 8.1.1 tramite una diluizione di 500 volte in 3 ml di brodo LB contenente 50 ug / ml di ampicillina e 0,1% L-arabinosio. Subculture dovrebbe avere un OD 600 nm <0.005. Incubare a 37 ° C con agitazione. Controllare la densità ottica (OD 600 nm) a 2 e 2,5 ore. Crescere cellule per ottenere OD 600 nm = 0.35. Subculture via 500 volte diluzione in 3 ml di brodo LB contenente 50 ug / ml di ampicillina e 0,1% L-arabinosio. Subculture dovrebbe avere un OD 600 nm <0.005. Controllare la densità ottica (OD 600 nm) a 2 e 2,5 ore. Crescere cellule per ottenere OD 600 nm = 0.35. Campionamento culture lotti di passaggio di serie. Utilizzando pinze sterili, collocare un filtro da 0,22 micron membrana sulla cima di un filtro del collettore. Aliquota 1 ml di tampone fosfato (PBS) sulla carta da filtro e poi accendere pompa a vuoto. Ripetere l'aggiunta di 1 ml di PBS. Trasferire 1 ml di sottocultura dalla sezione 8.2.3 sulla carta da filtro. Da qui, muoversi rapidamente per ottenere campioni in azoto liquido immediatamente. Completa questo in 1 min. Aliquota 1 ml di PBS su carta da filtro per il lavaggio del campione. Lavare rapidamente senza spargimento campione sopra i lati della carta da filtro. Ripetizione. Utilizzando pinza sterile filtro posto in una provetta per microcentrifuga 1,7 ml piegando con cura il filtro. Immergere provetta per microcentrifuga in azoto liquido fino gorgogliare fermate. Conservare campione -80 ° C freezer. 9. Metaboliti Analisi ed elaborazione Nave 3 campioni per clone di ghiaccio secco ad un impianto di base metabolomica per l'elaborazione del campione, l'analisi e la normalizzazione della GC-TOFMS. Per ciascun campione, determinare la media, mediana, deviazione standard e coefficiente di variazione attraverso metaboliti, utilizzando i dati replicati. Per l'analisi statistica, codificare manualmente un oleodotto QA utilizzando istruzioni condizionali e le esecuzioni ripetitive 26 per rimuovere i metaboliti che non seguono determinate condizioni. Per Condizione 1, rimuovere metaboliti in cui più di 2 campioni hanno nulla abbondanza. Rimuovere standard interni dai profili metabolomica. Per Condizione 2, rimuovere quelle metaboliti che non si trovano nelle cellule di interesse. Qui, rimuovere le seguenti metaboliti: indolo 3 acetato, dihydroabiet Acido ic, acido nonadecanoic, acido salicilico, salicylaldehyde, colesterolo, fenolo, 1-Monostearina, ottadecanolo, 1-monopalmitin, dodecano, dodecanolo, 1-esadecanolo, 5-methoxytryptamine, acido benzoico, acido pentadecanoico, acido fosforico, acido pelargonico, palmitico , acido caprico, idrossilammina, acido stearico, acido miristico, maleimmide, levoglucosano e acido 4-idrossibutirrico. Per Condizione 3, rimuovere tali metaboliti il ​​cui coefficiente di variazione è maggiore di 1. Cattura effetti metabolomica globali, cercando in metabolita abbondanze relative. Creare una rappresentazione visiva del metabolita dell'abbondanza mediana per clone per ogni metabolita (Figura 6). Identificare i valori anomali osservando frequenze coppia clone-metabolita. Calcolare il punteggio Z per ogni valore medio di ogni metabolita in un clone. Calcola punteggi z utilizzando la seguente equazione: /52854/52854eq7.jpg "/> [7] Nota: Term X MC rappresenta il livello abbondanza di un metabolita specifico per un clone specifico. Term μ C rappresenta la media di tutti i cloni di un metabolita specifico. Termine σ C è la deviazione standard associata. Crea una rappresentazione visiva dei dati in cui sono evidenziati i valori anomali (dati non forniti).

Representative Results

Tutti i campioni utilizzati per determinare le fasi di lettura aperti (ORF) selezionati in questo studio sono stati raccolti da Starbuck Island, sito 7 (star7) e Caroline Atoll, Site 9 (CAR9) dei meridionali Line Islands. Si stima che circa 100 L di acqua di mare da questi siti è stato raccolto sotto le pompe di sentina strato limite con corallo, come descritto in precedenza 5. Contenuto delle pompe sono stati oggetto di frazionamento attraverso grandi filtri pori per rimuovere piccoli eucarioti e successivamente concentrati usando 100 kDa filtri flusso tangenziale lasciando solo microbi e virali come particelle (VLP). Per separare i VLP, rimanendo l'acqua di mare è stata fatta passare attraverso 0,45 micron filtri conseguente virome. Cloroformio è stato introdotto per questa frazione virale di arrestare la crescita di eventuali cellule rimanenti e conservata a 4 ° C. VLPs sono stati purificati utilizzando il metodo di cloruro di cesio, in cui gradienti di densità separati tramite centrifugazione e consentono il recupero di virioni a ~ 1,35 g / ml a 1,5 g / ml 3. DNA virale è stato estratto utilizzando un CTAB / fenolico: protocollo cloroformio e amplificato tramite diversi amplificazione spostamento utilizzando reagenti Phi29. Il sequenziamento del virome è stato realizzato con la tecnologia disponibile in commercio pirosequenziamento. Bioinformatics utilizzati nella lavorazione e selezione di ORF virali per questo studio sono i seguenti. Tre fasi di pre-processing sono stati utilizzati per le metagenomi virali CAR9 e star7. Innanzitutto, software pubblico è stato utilizzato per rimuovere le sequenze di tag che il risultato di amplificazione del DNA virale prima del sequenziamento 27. In secondo luogo, gli artefatti sequenziamento comuni come duplicati di sequenza e low copy number sono stati filtrati dal set di dati tramite un programma bioinformatica aggiuntivo 28. Infine, la rimozione della contaminazione sequenza straniero 29 è stata effettuata per quelle sequenze che avevano ≥ 90% di copertura e ≥ 94% di identità con le sequenze nei seguenti database: RefSeq vgenomi IRUs; Umana – Riferimento GRCh37; Umana – Celera Genomics; Umana – Craig Venter (HuRef); Umano – Seong-Jin Kim (Corea); Umana – Cromosoma 7 versione 2 (TCAG); e umano – James Watson, Yanhuang (YH, asiatico), yoruba (NA18507; africano) sequenze di riferimento 21. A seguito di questi processi, le sequenze dei campioni CAR9 ammontano a 591.600 e sequenze star7 ammontano a 939.311. Queste sequenze sono stati caricati su MGRAST e assemblati via software assembler utilizzando le impostazioni predefinite. Contigs sono stati tradotti in 6 fasi di lettura e putativi di lettura aperta (pORFs) sono stati identificati utilizzando script, come descritto in precedenza 21. Per identificare ORF sconosciuti una serie di ricerche di somiglianza base sono state eseguite per rimuovere ORF di funzione nota. In sintesi, le seguenti ricerche sono state condotte con i loro criterio di ricerca corrispondenti 21: Somiglianza significativa di ≥ 95% di identità su ≥40 coppia di basi (bp) di MGRAST BLAT database M5NR. Somiglianza significativa (e-valore ≤ 0,001) per TBLASTN contro tutti metagenomi pubblici in My Resource metagenoma database. Somiglianza significativa (e-valore ≤ 0,001) per BLASTP e TBLASTN contro database di NR. Somiglianza significativa (e-valore ≤ 0,001) da RPS-BLAST contro il Database Conserve dominio. Traduzioni di proteine ​​da una frazione di selezione di ogni serie di dati comparati contro strutture proteiche risolte nel Protein Data Bank. Calcolo delle frequenze dinucleotide utilizzando pacchetto Dinucleotide firme. I pORFs risultanti sono stati progettati per l'espressione in E. coli utilizzando pubblicamente disponibile il software di progettazione gene. Back-traduzione delle sequenze amino-acido impiegato una tabella di utilizzo universale Codone progettato per ospitare espressione in E. coli con una soglia minima di utilizzo del 2%. Sequenza di riconoscimento enzima di restriziones per BamHI e HindIII sono stati esclusi dalle sequenze per facilitare la clonazione. Una società esterna ha sintetizzato il gene ingegnerizzato sequenze 30 e poi ORF sono stati clonati in un mezzo-copia promotore numero pBAD vettore, pEMB11, via clonazione enzima di restrizione standard. Tutti i cloni sono stati trasformati in E. coli K-12 ceppo BW 27784 23. Piastre Multi-fenotipo Assay (MAP) Un elevato throughput e software solida pipeline è stato sfruttato per l'analisi delle mappe, il PMAnalyzer 24. Il gasdotto è stato sviluppato in un ambiente server Linux ed esegue varie fasi tra cui: l'analisi dei file di densità ottica, formattazione dei dati in file di testo leggibili, di pre-elaborazione delle curve di crescita per la garanzia della qualità (QA), e che svolgono tecniche di modellazione matematica per analizzare le curve di crescita . Sono stati sviluppati Gli script di modellazione primarie in Python versione 2.7.5 di utilizzare il modulo PyLab. <p class = "jove_content"> MAP riproducibilità è stata valutata utilizzando l'errore standard (SE) per i dati replicati (Figura 2A). Curve di crescita grezzi sono stati confrontati con le curve di crescita logistici per determinare se il programma PMAnalyzer accuratamente parametrizzato e modellato crescita clone durante la sperimentazione (dati non mostrati). Per ulteriori informazioni sulla precisione e la validità delle mappe e PMAnalyzer vedere Cuevas et al. 24 Dopo la convalida del metodo, i dati MAP è stato analizzato utilizzando i parametri multipli, come il tasso di crescita massimo (μ max) e il livello di crescita (GL), forniti dalla pipeline di elaborazione. Visualizzazione comparativa delle curve di crescita è spesso utilizzato per l'interpretazione dei dati di crescita; tuttavia, il numero di curve che può essere visualizzato in un momento per il confronto ha dei limiti. Per analizzare numerose curve di crescita simultaneamente, mappa di calore trame derivati ​​sono stati implorato di confrontare decine di cloni coltivati ​​su un singolo substrate contro risposta media che le condizioni "(Figura 2B). L'influenza posto da sovraespressione di una nuova proteina fago è osservata attraverso i cambiamenti dei parametri della curva, in particolare: lag fase, fase esponenziale e la produzione di biomassa massimo (asintoto). Come esempio, la ripida salita dalla fase di latenza in fase esponenziale modellato nella curva di crescita per la proteina del capside (Figura 2A) è riprodotto da un rapido cambiamento di intensità di colore dal nero al bianco per la stesso clone nella trama dinamica della figura 2B . Per ottenere un quadro globale di distribuzione clone attraverso substrati, classificazioni fenotipiche derivate dal GL sono stati utilizzati (Figura 3). Qui, i quattro fenotipi sono separati in quattro grafici in cui l'altezza di ciascuna barra rappresenta il numero di cloni che mostrano che il fenotipo per un substrato specifico. Valori anomali nei dati sono riconosciuti come i cloni che cadono nel "guadagno di function "o" perdita di funzione categoria ". I valori anomali possono essere ricercati individualmente e hanno studiato più da vicino sperimentalmente. Inoltre, un'analisi globale riconosce polarizzazioni del substrato nel saggio. Substrati come fenilalanina, acido malico, e glicina determinato una classificazione "nessuna crescita". Substrati che costantemente cadono nella classificazione di crescita non, attraverso tutti i cloni, non sono pesantemente ponderazione caratterizzazione funzionale a valle. Metabolomica I prodotti catabolici di cloni che esprimono geni fago sconosciuti sono stati identificati utilizzando metabolomica. In breve, i cloni sono state coltivate sotto o una cultura o un passaggio continuo di serie in lotti ambiente culturale prima di essere inviati per l'analisi GC-TOFMS in un impianto di base metabolomica. Per i dettagli sulla lavorazione del campione, analisi, e la normalizzazione per GC-TOFMS attuate dal core facility prescelta vedere Fiehn et al. 31 BriEfly, 1 ml di solvente di estrazione a freddo vengono aggiunti a ciascun campione, dopo che i campioni sono in agitazione e sonicato in un bagno freddo per 5 min. I campioni vengono centrifugati e infine metà del campione viene travasato e liofilizzati per l'analisi. Gli estratti sono purificati e spillo con indicatori di indice ritenzione interna prima di essere caricati sul gascromatografo e poi successivamente trasferito allo spettrometro di massa. I dati di ogni campione è analizzato tale intensità di segnale per tutti i segnali rilevati nel cromatogramma sono segnalati. Per la normalizzazione, l'abbondanza di picchi per ogni campione si riassume e il totale delle abbondanze di punta sono in media tra tutti i campioni del set. Abbondanze metabolita per campione sono divisi per picco abbondanza del campione e poi moltiplicati per il picco di abbondanza media di campionario. I dati risultanti vengono usati per l'analisi metabolomica nella ricerca discusso. Validazione di metabolomica riproducibilità era tenuto adeterminare la dimensione del campione appropriato per ogni metodo di coltura. Per rilevare la precisione visto all'interno dei campioni e la variazione visto attraverso campione dimensioni l'errore standard della media (M) sia per n = 3 e n = 6 set di dati sono stati esaminati (Figura 5B). Indipendentemente dalle dimensioni del campione coltura continua (CC), meno dell'1% dei dati aveva un S M ≤ 1,5. Mediana S M s erano 221 e 300, ei valori variava 0-7,55 x 10 5 e 3,74 x 10 5, per n = 3 ed n = 6 rispettivamente. S M s sono stati calcolati anche per ogni serie di campioni replicati nel metodo coltura seriale (SC). Anche in questo caso, meno dell'1% dei dati ha avuto un S M ≤ 1,5, una mediana S M di 137, e una gamma di 0-3,51 x 10 5. Per confrontare le distribuzioni S M tra ogni serie campione (CC n = 3 vs . CC n = 6, CC n = 3 vs SC n = 3, e CC n = 6 contro SC n = 3) un test di permutazione è stata eseguita. La distribution di una coltura continua S M Valori set di dati non era significativamente diversa dalla distribuzione dei valori della cultura di serie S M (p-value = 0.0). Tuttavia, la distribuzione dei valori S M per coltura continua n = dati 3 era significativamente diversa da quella dei valori S M per la coltura continua n = 6 dati (p-value = 1,908,804 mila x 10 -49). Infine, il coefficiente di variazione per metabolita è stato confrontato prima e dopo l'attuazione di un controllo della qualità (QA) fase (Figura 5C). In totale, 210 metaboliti sono stati rimossi dopo l'attuazione della condotta QA (40% dei dati). Meno dell'1% dei dati rimossi aveva un'abbondanza metabolita zero, ~ 2% era dati standard interni, ~ 5% è stata dati dai metaboliti mai osservato in E. coli, e le restanti metaboliti (> 30%) avevano un coefficiente di variazione maggiore di 1. Come con l'analisi MAP, observatio globalens fornito una comprensione iniziale della profondità di metabolomica informazione offerte. Per ottenere un quadro globale, cloni sono stati gerarchicamente raggruppati in base al loro abbondanze relative di metaboliti che forniscono informazioni sui profili clone-metabolita, potenziali cloni con funzioni correlate, e valori anomali clone-metabolita (Figura 6). Per evidenziare le funzioni delle proteine, metaboliti sono separati e raggruppati in base a vie metaboliche comuni. Usando questa analisi con risultati preliminari, era evidente che la metabolomica è in grado di separare i geni provenienti da classi diverse (Figura 6, evidenziato cloni). Inoltre, identificazione dei valori anomali con i dati metabolomica è stato determinato calcolando punteggi standard (punteggi z) per ogni coppia clone-metabolita. Per garantire la significatività statistica, valori anomali sono stati definiti come una coppia clone metabolita con un valore di punteggio Z di 2, che rappresentano solo il 5 per cento dei dati (dati non riportati). <p class="jove_content" fo:keep-tog ether.within-page = "always"> Figura 1. Definizioni di classificazioni fenotipo. (A) Rapporto tra il livello di crescita (GL) e tasso di crescita massimo. I punti dati cerchiate in rosso rappresentano le curve di crescita che mostrano poco o nessun utilizzo substrato. (B) la rappresentanza Boxplot definizione soglia di crescita basato sulla distribuzione delle curve di crescita con un tasso di crescita minima (<0,15 OD / ora). (C) La varianza e la deviazione standard di GL è calcolato per substrato D-galattosio. Linee tratteggiate brevi rappresentano due deviazioni standard dalla media. Cliccate qui per vedere una versione più grande di questa figura. highres.jpg "/> Figura 2. MAP convalida via precisione e la differenziazione. (A) curve di crescita per i cloni strutturali (Capside) e metaboliche (annotati thioredoxin), due nuovi cloni metaboliche (EDT2440, EDT2441), e la risposta media di cloni coltivati ​​sul saccarosio, D- galattosio e D-mannosio nelle mappe. Le linee blu indicano l'errore standard visto tra i dati replicati (n = 3). (B) Le curve di crescita per 47 diversi cloni sono rappresentati come mappe di calore per il saccarosio, D-galattosio e D-mannosio. Il strutturale (cerchio verde) annotato e cloni metaboliche (arancione cerchio), due cloni metaboliche romanzo (cerchi blu scuro e luce), e la risposta media (cerchio rosso) sono evidenziati. Cliccate qui per vedere una versione più grande di questa figura. PLOAD / 52854 / 52854fig3highres.jpg "width =" 700 "/> Figura 3. Distribuzione clone per ogni fenotipo su più supporti. Conteggio Il fenotipo-clone per 47 cloni in tutto 72 le condizioni di crescita specifiche emissioni di carbonio. La tabella fornisce i conteggi diretti, per ciascun fenotipo. Clicca qui per vedere una versione più grande di questa figura. Figura 4. Diagramma dettaglio la costruzione dell'apparato coltura continua. (A) Procedura utilizzati per costruire porte α-γ del reattore coltura continua, (B) passaggi utilizzati per realizzare il porto flusso dal reattore coltura continua, e (C ) i passi per costruire porte δ e ε del biberon coltura continua. = "Https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg" target = "_ blank"> Clicca qui per vedere una versione più grande di questa figura. Figura 5. Confronto dei metodi Phenomic presentati. (A) del flusso di lavoro per la preparazione dei piatti multi-fenotipo Assay (MAP), culture continue e culture seriali. (B) La percentuale di errore standard della media (M) conta per entrambi n = 3 e n = 6 dimensioni del campione per la cultura continua (CC) e la cultura di serie (SC) metodi di preparazione per la metabolomica. L'asse y è su una scala logaritmica. (C) Le distribuzioni dei coefficienti di variazione (CV) per metabolita, prima e dopo l'attuazione della conduttura QA per il metodo coltura continua (CC).g5highres.jpg "target =" _ blank "> Clicca qui per vedere una versione più grande di questa figura. Figura 6. Profili metabolomica di cloni coltivati ​​in coltura continua. Le abbondanze metabolita mediano per una serie di metaboliti sono tracciate per 84 cloni cresciuti in culture continui. Profili dei metaboliti di cloni annotati strutturali (Capsid) e metaboliche (tioredoxina), due nuovi cloni metaboliche (EDT2440, EDT2441), e la risposta media metabolica sono evidenziati in rosso. Cliccate qui per vedere una versione più grande di questa figura. Composto Carbonio Azoto </strong> Zolfo Fosforo Glicerina – 0,40% 0,40% 0,40% Cloruro di ammonio 9,5 mm – 9,5 mm 9,5 mm Solfato di sodio 0.250 mM 0.250 mM – 0.250 mM Solfato di magnesio 1,0 mm 1,0 mm – 1,0 mm Fosfato di potassio 1.32 mM 1.32 mM 1.32 mM – Cloruro di magnesio – – * – Cloruro di potassio 10 mM 10 mM 10 mM 10 mM Cloruro di calcio 0,5 micron <td> 0,5 micron 0,5 micron 0,5 micron Cloruro di sodio 5 mM 5 mM 5 mM 5 mM Cloruro ferrico 6 micron 6 micron 6 micron 6 micron Arabinosio L- 0,10% 0,10% 0,10% 0,10% MOPS pH 7,4 1x 1x 1x 1x Tabella 1. I composti e le concentrazioni dei diversi media basale utilizzati nelle mappe. * 1,0 mm di cloruro di magnesio viene sostituita. 1x MOPS = MOPS 40 mm, tricina 4 mm. Substrati di carbonio Substrati di azoto Substrati di zolfo Psubstrati hosphorus 2 deossi-D-ribosio 2-deossi-D-ribosio Acido 1-butano-solfonico adenosina-5-monophoshate Acido acetico al 4 idrossi-fenil acetammide acetil cisteina beta-glicerofosfato acido acetico adenina D-cisteina creatinephosphate adenosina-5-monofosfato adenosina D-metionina D-glucosio-6-fosfato adonitolo allantoina dietil-ditiofosfato dietil-ditiofosfato alfa-D-glucosio beta-feniletilamina DL-ethionine DL-alfa-glicerofosfato alfa-D-lattosio biureto glutatione potassio fosfato alfa-D-melebiose citidina Acido isetionico pirofosfato di sodio acido citrico citosina L'acido L-cisteico tiofosfato sodio D-alanina D-alanina L-cisteina D-arabinosio D-asparagina L'acido L-djenkolic D-arabitolo D-aspartato L-metionina D-asparagina D-cisteina solfato di magnesio D-aspartato D-glucosamina solfonico metano D-cellubiose L'acido D-glutammico N-acetil-DL-metionina D-cisteina Acido DL-alfa-ammino-N-butirrico N-acetil-L-cisteina D-fruttosio D-metionina potassio-tetra-thionate </tr> D-galattosio D-serina tiosolfato di sodio D-glucosamina D-valina Acido sulfanic D-glucosio acido gamma-amino-N-butirrico taurina D-glucosio-6-fosfato glicina Acido taurocolico D-glutammato guanidina tiourea D-mannosio istamina D-raffinosio inosina D-ribosio L-alanina D-salicina L-arginina D-serina L-asparagina D-trealosio L-citrullina D-xilosio L-cisteina dulcitolo Acido L-glutammico glicerina L-glutammina glicina L-glutatione i-eritritolo L-istidina inosina L-isoleucina L-alanina L-leucina L-arabinosio L-lisina L-arabitolo L-metionina L-asparagina L-ornitina L-aspartato L-fenil-alanina L'acido L-cisteico L-prolina L-cisteina Acido L-piro-glutammico L-fucosio L-serina; L-treonina L-glutammico Acid L-triptofano L-glutammina L-valina L-isoleucina N-acetil-D-glucosamina L-leucina putrescina <tr> L-lisina tiourea L-metionina timidina L-fenilalanina timina Acido L-piro-glutammico tiramina L-ramnosio tirosina L-serina uridine L-sorbosio L-treonina L-triptofano L-valina L-xilosio lattato lattulosio malato mio-inositolo acido ossalico sorbato di potassio propionico putrescina Acido quinic piruvato di sodio succinato sodico </td> saccarosio timidina xilitolo Tabella 2. Elenco dei substrati utilizzati nella mappa esperimenti.

Discussion

Qui vi presentiamo approcci Phenomic per la caratterizzazione funzionale dei geni dei fagi putativi. Le tecniche includono un saggio sviluppato capace di metabolismo anabolico monitoraggio host, le piastre Multi-fenotipo Assay (MAP), oltre al metodo stabilito di metabolomica, capace di effetti al metabolismo catabolico misurazione. Abbiamo fornito ulteriori strumenti per la gestione dei grandi insiemi di dati derivanti da queste tecnologie, consentendo l'elaborazione ad alta produttività e analisi 24. Infine, attraverso il confronto di una proteina annotato fago capside, fagi tioredoxina, due geni del metabolismo dei fagi putativi, e la risposta media sperimentale ci proponiamo diverse strategie per interpretare entrambe le serie di dati e le classi di geni, con particolare attenzione alla identificazione delle tendenze fenotipici e l'identificazione dei valori anomali.

Come detto, entrambi gli approcci quantitativamente misurano solo la metà del metabolismo dell'ospite. Per interpretare la relativa funzione di una qualsiasi dellenuove proteine ​​in esame, i dati di entrambi i metodi è tenuto a fornire la prova della funzione. Anche se questo non è un punto focale della nostra manoscritto corrente, uscite dati di ogni metodo Phenomic è messo attraverso analisi combinatorie che si concentrano su tecniche di clustering come la foresta casuale e analisi delle componenti principali. Inoltre, le ipotesi emerse dall'analisi combinata devono essere convalidati da metodologie genetiche tradizionali.

Infine, i metodi presentati sono fortemente influenzate dalla fisiologia batterica e quindi seguire le stesse norme. Nell'avviare entrambi i metodi, le considerazioni devono essere fatte per garantire indipendenti, gruppi clonali sono sperimentato; è impedito contaminazione; una sola variabile è in fase di sperimentazione; e controlli adeguati sono corse contemporaneamente. La mancata per tenere conto di questi punti si tradurrà in risultati non chiari, simile a qualsiasi dosaggio fisiologico.

Multi-fenotipo Piastre Assay(MAP)

Lo sviluppo di MAP fornisce un elevato throughput e dosaggio adattabile rispetto alle tecnologie attualmente disponibili (Figura 5A e Tabelle 1,2). Il test utilizza forniture, attrezzature e le tecniche fondamentali disponibili in tutti i laboratori di microbiologia. L'incorporazione di una pipeline di calcolo, PMAnalyzer 24, per la successiva elaborazione e analisi dei dati assicura una rapida interpretazione dei dati. Inoltre, entrambi gli aspetti sperimentali e analitiche del metodo possono essere facilmente regolati o sintonizzati per scopi personalizzati. Ad esempio, se una gran parte dei dati non riesce a passare filtraggio descritto nella sezione 4, si può vagliare manualmente attraverso le curve di crescita per identificare problemi. Se il problema è legato ai parametri di filtro stringenti, adeguamenti lo script può essere fatto. In alternativa, se i problemi sono associati con il processo sperimentale (cioè, condensazione prolungata; impropria trasferimento di cel battericals, ecc) quindi replicati supplementari possono essere facilmente ripetuti.

Come descritto in Cuevas et al. 24, il PMAnalyzer è un unico programma bash scritto come uno script wrapper che esegue l'analisi e analisi script come una coesa, conduttura automatizzata. Tutti gli script sono liberamente accessibili da un repository Git a 25, prendendo il valore mediano per ogni punto di tempo attraverso i dati triplice copia, e successivamente parametrizza la curva logistica per ottenere il tempo di ritardo, il tasso di crescita massima, asintoto, e un termine romanzo, Livello Crescita. Il valore mediano è stato scelto il media nel nostro studio per ridurre l'effetto di grandi valori anomali, tuttavia, lo script può essere facilmente adattato per calcolare la media dei dati replicati. Grazie alla ridotta variazione (SE) visto attraverso dati replicati (Figura 2A) abbiamo mantenuto l'uso della mediana nel PMAnalyzer per montare una curva logistica. Inoltre, il limite per la crescita in questo studio (GL ≥ 0,4) era determined confrontando come i dati separati attraverso livello di crescita e tasso di crescita massimo (Figura 1A, B). A seconda del modello di sistema strumenti e ha usato questo termine può variare, richiedendo ridefinizione di questo valore di soglia.

Uno dei principali vantaggi della nostra analisi è la possibilità di confrontare fenotipi utilizzando un unico parametro che caratterizza la crescita microbica complessiva, che definiamo come livello di crescita (GL). GL è una media armonica, e mitiga quindi gli effetti di grandi valori anomali nei dati. L'utilizzo di un media armonica con i valori logistici-misura spostati per fornire una sintesi di crescita è arrivato a attraverso tentativi ed errori. Altri metodi hanno cercato di differenziare la crescita incluso: tempo impiegato per raggiungere i parametri specifici della curva (la metà μ max, μ max, e la capacità di carico), il coefficiente di determinazione (R 2), e combinazioni di R 2 moltiplicato per specifici parametri della curva. Utilizzando un media armonica con spostatavalori logistico-fit per il GL fornito la più grande gamma nella valutazione della crescita, quindi è diventato il metodo di scelta. Una considerazione da notare è che i modelli curva di crescita dinamici hanno il potenziale di perdersi quando si utilizza un singolo parametro o di un modello adattato. Per esempio, i singoli parametri della curva della curva logistica e GL sono incapaci di rappresentare crescita bifasico. In un unico ambiente di carbonio, questo effetto sulla crescita implica mediazione della proteina virale su entrambi conversione del substrato o cambiamento di utilizzazione del substrato. Ulteriori effetti potenzialmente persi quando non considerando parametri di crescita più comprendono: ritardo prolungato, proponendo un aumento del carico di macchinari o prodotti virale; rapida accelerazione fase esponenziale, suggerendo proteine ​​virali accoppiati ad ospitare percorsi di produzione di energia; livelli o più alti di formazione della biomassa, che implica il supporto virale in assorbimento dei nutrienti ospite e anabolismo (dati non riportati). Così, tracciare curve di crescita nascenti ( <strong> Figura 2A, B) fornisce informazioni per quanto riguarda le tendenze nel corso del tempo, mentre la GL tiene conto delle principali variabili del modello logistico, fornendo un unico numero quantitativa per rappresentare il successo globale di un clone.

Se si considerano le diverse risposte fornite da geni strutturali e metabolici nelle mappe, si osserva che le diverse classi di substrato in questione forniscono la prova più funzione della proteina. Per esempio, le proteine ​​metaboliche sono spesso associati con l'acquisizione di nutrienti limitanti, che sono non specifico per ospitare centrale metabolismo 16,32. MAP preliminari esperimenti rivelano che i cloni che ospitano putativi geni metabolici dei fagi hanno una maggiore fase di latenza quando coltivate su fonti di carbonio metabolismo centrali (Figura 2A). Al contrario, i cloni che portano geni strutturali putativi, che richiedono grandi proporzioni, di piscine energia ospite e dNTP, provocano una risposta falsi positivi sulla crescita per centosubstrati ral e aminoacidi carbonio metabolismo. Ciò è probabilmente dovuto all'accumulo di proteine ​​insolubili conseguente filamentazione ospitante e / o corpi inclusi, come osservato mediante microscopia (Figura 2A e dati non mostrati). Mentre ulteriori analisi è necessaria per convalidare questi risultati preliminari, le mappe sono in grado di recuperare le risposte fenotipiche che correlano alle ipotizzato funzioni specifiche classi di geni fagi.

Oltre alla spiegazione delle proteine ​​virali sconosciuti, le mappe sono un romanzo risorsa per indagare la diversità funzionale e metabolico di un individuo batterio o una comunità di batteri. I componenti del MAP sono progettati per una facile modifica per sostenere la crescita di una gamma di batteri; compresi marino, auxotrophic e microbi anaerobici. Per facilitare questi sforzi il basale e pre-sviluppo dei media definito richiedono ulteriori o regolate specie chimiche prima di un genere di batteri diverso può essere sostenuto nelle mappe.Una nota in questo uso delle mappe è quello di mantenere i media definiti, che vieta l'uso di ingredienti come triptone, estratto di lievito e peptone.

Metabolomica

Il campo della metabolomica dipende database metaboliti, che comprendono metaboliti isolati identificati mediante spettrometria di massa. La struttura di base scelto qui ha uno dei più grandi database metabolomica. È interessante notare che più della metà dei metaboliti derivanti dalle nostre sperimentazioni erano identificabili (~ 65%), mentre gli altri non erano mai stati registrati nel nostro ospite, Escherichia coli (esempi includono: Indole 3 acido acetico 33, acido salicilico 34, e l'acido dihydroabietic 35). Questo fatto potrebbe essere attribuita a una forte inclinazione del database verso metaboliti di piante, o le proteine ​​specifiche in esame. Indipendentemente, il risultato è un numero limitato di metaboliti noti disponibili per la rappresentazione e l'analisi dei dati. Nella future, diversi metodi di metabolomica con varie banche dati consentirebbe una maggiore copertura metabolita.

Attualmente, sia conosciuto e metaboliti sconosciuti vengono utilizzati quando comparare e confrontare le nostre proteine ​​virali romanzo. Usando questo approccio, ipotizziamo che i cloni che ospitano le proteine ​​funzionalmente simili condivideranno una maggiore somiglianza nel loro profilo metabolomica completo. Analisi metabolomica preliminari hanno rivelato che mentre geni strutturali e metaboliche non si separano chiaramente uno dall'altro, quei geni esibendo effetti simili sul host quando overexpressed non correlare (Figura 6). Ad esempio, i Capside cluster di geni annotati da vicino con i geni metabolici putativi evidenziati in questo studio, EDT2440 e EDT2441. Le indagini che utilizzano una topologia transmembrana e peptide segnale programma predittore a disposizione del pubblico hanno mostrato evidenza che entrambi i geni metabolici putativi porto un singolo dominio transmembrana. Interessante 5 su the 9 cloni del primo gruppo di cluster (più a sinistra parte del dendrogramma) hanno previsto domini transmembrana che utilizzano lo stesso programma topologia. Sono necessari ulteriori studi, tuttavia, è probabile che i metaboliti presenti durante la sovraespressione di questi cloni sono associati a risposta allo stress cellulare risultante dalla membrana o fardelli strutturali. Queste prove sostengono che mentre i dati metabolomics possiede una maggiore quantità di rumore, il metodo è in grado di segnali che differenziano effetti generali di geni, sia all'interno e attraverso una classe gene evidenziando. Per determinare se il metodo è in grado di estrarre le informazioni specifiche della funzione del gene, i metaboliti sono stati raggruppati in specifiche vie metaboliche. L'essere ipotesi, se un clone colpisce metaboliti specifici di un unico percorso, allora il gene overexpressed è attivo in quel percorso. Prima della costituzione della nostra pipeline di garanzia della qualità metabolomica, dati preliminari hanno rivelato che più did metaboliti sottorappresentati erano tipicamente "sconosciuto", che fornisce poche informazioni sui percorsi a cui sono associati (dati non riportati). Dati metabolomica pre-elaborati, tuttavia, rivela che la maggior parte dei profili dei metaboliti sono simili e solo un numero selezionato di sconosciute e conosciute abbondanze metaboliti variano tra i cloni, per esempio putrescina e uracile (Figura 6). Per offrire una maggiore risoluzione degli sforzi di funzione della proteina sono stati fatti per confrontare sperimentalmente i geni dei fagi nuovi contro geni fago noti, che possono essere utilizzati per riempire i "buchi" del metabolita basate caratterizzazione funzionale. Usando questa tecnica, la funzione assegnata di geni virali conosciuti fornisce un riferimento per la funzione dei geni ignoti. Tuttavia, il fattore limitante di analisi metabolomica è la dimensione e la rilevanza del database. Per correggere queste limitazioni, i database metabolomica facilmente riconoscibili per questa ricerca da sviluppare; comecome un database di metaboliti e loro abbondanze specifico alla raccolta ASKA di E. cloni coli in cui un singolo ORF è sovraespresso 36. Le prove per la necessità di tali banche dati è stato fornito nel 2013 quando i ricercatori del Berkeley National Laboratory Lawerence compilato il primo database completo di metaboliti specifici per intere biblioteche mutanti di batteri modello 37. Questa ricerca ha fornito romanzo spaccato geni necessari per l'utilizzo di specifici metaboliti, rivelando la chiara connessione tra fenotipo e genotipo.

Quando si considera metabolomica come strumento, è importante definire il regime di trasformazione seguita al core facility. Un artefatto della maggior parte delle procedure sperimentali è la varianza giorno per giorno associati con gli strumenti di utilizzo. Fino ad oggi tutte le analisi GC-MS implementa l'uso di standard interni che sono inclusi in ogni seduta analitica; tuttavia, l'aggiunta di progetti specifici campioni interni </ Em> corse ogni giorno di sperimentazione rimuove varianza aggiuntivo. Queste considerazioni devono essere indirizzate presto per evitare problemi di normalizzazione e pregiudizi. Un'altra soluzione è di elaborare tutti i campioni in una struttura nucleo sulla stessa macchina e come singolo lotto, un'opzione disponibile presso qualsiasi struttura di base.

I vari strumenti sia introdotto e ri-esplorati in questo manoscritto fornire nuovi mezzi per lo screening e caratterizzare geni fagi funzionalmente sconosciuti. La semplicità e adattabilità delle tecniche sperimentali con l'uso Streamline di condotte computazionali assicura questi metodi sono applicabili ad una vasta gamma di sforzi e campi di ricerca. Il nostro obiettivo è che gli approcci Phenomic qui presentati saranno di aiuto ulteriori indagini di proteine ​​fagi romanzo, oltre a sistemi che sono ugualmente funzionalmente indefinito.

Offenlegungen

The authors have nothing to disclose.

Acknowledgements

We thank Benjamin Knowles, Yan Wei Lim, Andreas Haas, and members of the Viral Dark Matter consortium for their help and constructive input on this manuscript. This research is funded by the National Science Foundation (DEB-1046413) and is part of the Dimensions: Shedding Light on Viral Dark Matter project.

Materials

0.22µm Sterivex Filter Fisher Scientific SVGP01050 Millipore
0.22µm Millex Filters Fisher Scientific SLGV033RS Millipore
0.22µm SteriCap Filter Fisher Scientific SCGPS02RE Millipore
0.22 µm Omnipore membrane filters Millipore JHWP02500 Millipore
96 well micro-titer plates  VWR 82050-764 Standard F-Bottom 96 well Microplates
2 mL 96 well plate Fisher Scientific
Adhesive Seal Plate Film Sigma-Aldrich Z369667
2 L Nalgene square bottles Cole Parmer T-06040-70
125 mL Nalgene square bottles Cole Parmer T-06040-50
1/4inch Panel Mount Lock Nut, black nylon  Cole Parmer EW-45509-04
Female Luer Thread Style Panel Mount to 200 Series Barb  1/16inch  Cole Parmer EW-45500-30
Female Luer Thread Style Panel Mount to 200 Series Barb, 1/8inch Cole Parmer EW-45500-34
Male Luer Integral Lock Ring to 500 Series Barb, 1/16inch ID tubing Cole Parmer EW-45505-31
Male Luer with Lock Ring x Female Luer Coupler Cole Parmer T-45508-80
Barbed Bulkhead Fittings 1/4inch OD  Fisher Scientific 6149-0002
Sanipure Tubing 1/16inch ID x 1/8inch OD  SaniPure AR400002
Sanipure Tubing 1/4inch OD x 1/8inch ID  SaniPure AR400007
Variable Flow Mini Pump (Peristaltic pump) Fisher Scientific 13-876-1
Magnetic Stirrer Velp Scientifica F203A0160
Forceps Fisher Scientific 14-512-141  Millipore* Filter Forceps 
Multi-plate spectrophotometer plate reader Molecular Devices Analyst GT
Filter manifold Fisher Scientific  XX10 025 02
Software:
Python version 2.7.5 http://www.python.org/
PyLab module http://wiki.scipy.org/PyLab
R version 3.0.1  http://www.r-project.org/
reshape2 library http://had.co.nz/reshape
ggplot2 library http://ggplot2.org/
Gene Composer PSI Tech Portal http://www.genecomposer.net
Services:
West Coast Metabolomics Center UC Davis http://metabolomics.ucdavis.edu
DNA 2.0 https://www.dna20.com

Referenzen

  1. Wommack, K. E., Colwell, R. R. Virioplankton: Viruses in Aquatic Ecosystems. Microbiology and Molecular Biology Reviews. 64 (1), 69-114 (2000).
  2. Hendrix, R. W. Recoding in Bacteriophages. Recoding: Expansion of decoding rules enriches gene expression. 24, 249-258 (2010).
  3. Breitbart, M., et al. Genomic analysis of uncultured marine viral communities. Proceedings of the National Academy of Sciences. 99 (22), 14250-14255 (2002).
  4. Breitbart, M., et al. Diversity and population structure of a near-shore marine-sediment viral community. Proceedings. Biological sciences / The Royal Society. 271 (1539), 565-574 (2004).
  5. Dinsdale, E. A., et al. Functional metagenomic profiling of nine biomes. Nature. 452 (7187), 629-632 (2008).
  6. Vega Thurber, R. L., et al. Metagenomic analysis indicates that stressors induce production of herpes-like viruses in the coral Porites compressa. Proceedings of the National Academy of Sciences of the United States of America. 105 (47), 18413-18418 (2008).
  7. Pedulla, M. L., et al. Origins of highly mosaic mycobacteriophage genomes. Cell. 113 (2), 171-182 (2003).
  8. Calendar, R., Abedon, S. T. . The bacteriophages. , (2006).
  9. Breitbart, M., Miyake, J. H., Rohwer, F. Global distribution of nearly identical phage-encoded DNA sequences. FEMS microbiology letters. 236 (2), 249-256 (2004).
  10. Klenk, H. -. P., Palm, P., Zillig, W. DNA-Dependent RNA Polymerases as Phylogenetic Marker Molecules. Systematic and Applied Microbiology. 16 (4), 638-647 (1993).
  11. Breitbart, M., Thompson, L., Suttle, C., Sullivan, M. Exploring the Vast Diversity of Marine Viruses. Oceanography. 20 (2), 135-139 (2007).
  12. Mann, N. H., Cook, A., Millard, A., Bailey, S., Clokie, M. Marine ecosystems: bacterial photosynthesis genes in a virus. Nature. 424 (6950), 741 (2003).
  13. Mann, N. H., et al. The genome of S-PM2, a “photosynthetic” T4-type bacteriophage that infects marine Synechococcus strains. Journal of bacteriology. 187 (9), 3188-3200 (2005).
  14. Lindell, D., et al. Transfer of photosynthesis genes to and from Prochlorococcus viruses. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11013-11018 (2004).
  15. Millard, A., Clokie, M. R. J., Shub, D. A., Mann, N. H. Genetic organization of the psbAD region in phages infecting marine Synechococcus strains. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11007-11012 (2004).
  16. Sullivan, M. B., Coleman, M. L., Weigele, P., Rohwer, F., Chisholm, S. W. Three Prochlorococcus cyanophage genomes: signature features and ecological interpretations. PLoS biology. 3 (5), e144 (2005).
  17. Rohwer, F., et al. The complete genomic sequence of the marine phage Roseophage SIOI shares homology with nonmarine phages. Limnology and Oceanography. 45 (2), 408-418 (2000).
  18. Miller, E. S., et al. Complete genome sequence of the broad-host-range vibriophage KVP40: comparative genomics of a T4-related bacteriophage. Journal of bacteriology. 185 (17), 5220-5233 (2003).
  19. Thompson, L. R., et al. Phage auxiliary metabolic genes and the redirection of cyanobacterial host carbon metabolism. Proceedings of the National Academy of Sciences of the United States of America. 108 (39), E757-E764 (2011).
  20. Paterson, S., et al. Antagonistic coevolution accelerates molecular evolution. Nature. 464 (7286), 275-278 (2010).
  21. Seguritan, V., et al. Artificial neural networks trained to detect viral and phage structural proteins. PLoS computational biology. 8 (8), e1002657 (2012).
  22. Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture Medium for Enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
  23. Khlebnikov, A., Datsenko, K. A., Skaug, T., Wanner, B. L., Keasling, J. D. Homogeneous expression of the P(BAD) promoter in Escherichia coli by constitutive expression of the low-affinity high-capacity AraE transporter. Microbiology (Reading, England). 147 (Pt 2), 3241-3247 (2001).
  24. Cuevas, D. A., et al. Elucidating genomic gaps using phenotypic profiles. F1000Research. , (2014).
  25. Zwietering, M. H., Jongenburger, I., Rombouts, F. M., van’t Riet, K. Modeling of the bacterial growth curve. Applied and environmental microbiology. 56 (6), 1875-1881 (1990).
  26. Schmieder, R., Lim, Y. W., Rohwer, F., Edwards, R. TagCleaner: Identification and removal of tag sequences from genomic and metagenomic datasets. BMC bioinformatics. 11, 341 (2010).
  27. Schmieder, R., Edwards, R. Quality control and preprocessing of metagenomic datasets. Bioinformatics (Oxford, England). 27 (6), 863-864 (2011).
  28. Schmieder, R., Edwards, R. Fast identification and removal of sequence contamination from genomic and metagenomic datasets. PloS One. 6 (3), e17288 (2011).
  29. Welch, M., et al. Design parameters to control synthetic gene expression in Escherichia coli. PloS One. 4 (9), e7002 (2009).
  30. Fiehn, O., et al. Quality control for plant metabolomics: reporting MSI-compliant studies. The Plant journal: for cell and molecular biology. 53 (4), 691-704 (2008).
  31. Zeng, Q., Chisholm, S. W. Marine viruses exploit their host’s two-component regulatory system in response to resource limitation. Current biology: CB. 22 (2), 124-128 (2012).
  32. Shindy, W. W., Smith, O. E. Identification of plant hormones from cotton ovules. Plant physiology. 55 (3), 550-554 (1975).
  33. Lee, H. I., Leon, J., Raskin, I. Biosynthesis and metabolism of salicylic acid. Proceedings of the National Academy of Sciences of the United States of America. 92 (10), 4076-4079 (1995).
  34. Chappell, J. The Biochemistry and Molecular Biology of Isoprenoid Metabolism. Plant Physiology. 107 (1), 1-6 (1995).
  35. Kitagawa, M., et al. Complete set of ORF clones of Escherichia coli ASKA library (a complete set of E. coli K-12 ORF archive): unique resources for biological research. DNA research: an international journal for rapid publication of reports on genes and genomes. 12 (5), 291-299 (2005).
  36. Baran, R., et al. Metabolic footprinting of mutant libraries to map metabolite utilization to genotype. ACS chemical biology. 8 (1), 189-199 (2013).

Play Video

Diesen Artikel zitieren
Sanchez, S. E., Cuevas, D. A., Rostron, J. E., Liang, T. Y., Pivaroff, C. G., Haynes, M. R., Nulton, J., Felts, B., Bailey, B. A., Salamon, P., Edwards, R. A., Burgin, A. B., Segall, A. M., Rohwer, F. Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins. J. Vis. Exp. (100), e52854, doi:10.3791/52854 (2015).

View Video