Qui vi presentiamo un nuovo approccio per identificare virus vegetali con genomi di DNA double-strand. Usiamo metodi standard per estrarre RNA e DNA da foglie infette e svolgere il sequenziamento di nuova generazione. Strumenti bioinformatici assemblare sequenze in contigs, identificano contigs che rappresenta il genoma del virus e assegnano genomi a gruppi tassonomici.
Questo approccio metagenoma viene utilizzato per identificare virus vegetali con genomi di DNA circolari e le loro trascrizioni. Spesso virus a DNA vegetale che si verificano in titoli bassi nel loro ospite o non possono essere inoculati meccanicamente a un altro host sono difficili da propagare per conseguire un titolo maggiore di materiale infettivo. Foglie infette sono macinati in un buffer delicato con pH ottimale e composizione ionica consigliato per la maggior parte dei retrovirus di Para di bacilliform di purificazione. L’urea è utilizzata per rompere in sui corpi di inclusione che intrappolano i virions e dissolvere componenti cellulari. Centrifugazione differenziale fornisce ulteriore separazione dei virions da contaminanti di pianta. Quindi proteinasi K trattamento rimuove i capsidi. Quindi il DNA virale è concentrato ed utilizzato per il sequenziamento di nuova generazione (NGS). I dati NGS sono utilizzati per assemblare contigs che vengono sottoposti a NCBI-BLASTn per identificare un sottoinsieme delle sequenze di virus nel dataset generato. In una pipeline parallela, RNA è isolato dalle foglie infette tramite un metodo di estrazione RNA basato su colonna standard. Quindi lo svuotamento ribosoma avviene per arricchire per un sottoinsieme dei trascritti di mRNA e virus. Assemblati sequenze derivate da RNA (RNA-seq) di sequenziamento sono stati sottoposti al NCBI-BLASTn per identificare un sottoinsieme di sequenze di virus in questo set di dati. Nel nostro studio, abbiamo identificato due genomi correlati badnavirus full-length in due DataSet. Questo metodo è preferibile a un altro approccio comune che estrae la popolazione totale di piccole sequenze di RNA per ricostituire la pianta virus sequenze genomic. Questo virus di quest’ultimo metagenomica pipeline recupera relative sequenze che sono retrò-trascrivere gli elementi inseriti nel genoma della pianta. Questo è accoppiato all’analisi biochimiche e molecolare di discernere ulteriormente gli agenti infettivi attivamente. L’approccio documentato in questo studio, recupera sequenze rappresentative di replicare il virus che probabilmente indicare infezione attiva del virus.
Malattie delle piante emergenti guidare i ricercatori a sviluppare nuovi strumenti per l’individuazione degli agenti causali corretti. I primi rapporti di malattie da virus nuovi o ricorrenti si basano su sintomi che si verificano comunemente come mosaico e malformazioni della foglia, vena di compensazione, nanismo, avvizzimento, lesioni, necrosi, o altri sintomi. Lo standard per la segnalazione di un nuovo virus come agente causale di una malattia è per separarla da altri agenti patogeni contaminanti, si propagano in host adatto e riprodurre la malattia inoculando nelle piante sane della specie ospite originale. La limitazione in questo approccio è che molti generi di virus vegetali dipendono da un insetto o altri vettori per la trasmissione a un host adatto o tornare alla originale specie ospiti. In questo caso, la ricerca per il vettore appropriato può essere prolungata, ci possono essere difficoltà a fondare colonie di laboratorio del vettore e ulteriori sforzi sono necessari per elaborare un protocollo per la trasmissione sperimentale. Se le condizioni per gli studi di trasmissione di successo di laboratorio non è possibile, quindi il lavoro cade a corto lo standard per la segnalazione di una nuova malattia di virus. Per virus che si verificano nei loro ospiti naturali a titoli molto bassi, i ricercatori devono identificare host alternativo per la propagazione per mantenere scorte sufficienti infettive per svolgere ricerche. Per specie di virus che infettano soltanto poche piante questo può anche essere un ostacolo per la coltivazione di colture di riserva1.
Negli ultimi anni, gli scienziati stanno impiegando più spesso alto-rendimento NGS e metagenomica approcci per scoprire le sequenze di virus che sono presenti nell’ambiente, che può esistere non correlata ad una malattia nota, ma può essere assegnato a generi e specie tassonomica 2 , 3 , 4. tali approcci alla scoperta e alla categorizzazione dei materiali genetici in un ambiente distinto forniscono un modo per descrivere la diversità di virus in natura o la loro presenza in un certo ecosistema ma non necessariamente confermare un quadro per la definizione agenti causali per una malattia apparente.
Il genere Badnavirus appartiene alla famiglia Caulimoviridae dei virus. Questi virus sono bacilliform in forma con genomi di DNA circolare a doppio filamento di circa 7-9 kb. Tutti i virus si replicano attraverso un intermedio del RNA. Virus esistono come episomi e replicare indipendente della pianta cromosomica del DNA5,6. Gli studi di campo delle popolazioni di virus indicano che queste popolazioni di virus sono geneticamente complesse. Inoltre, le informazioni ottenute attraverso una gamma dei genomi delle piante di sequenziamento ad alta hanno scoperto numerosi esempi di frammenti di genoma badnavirus inserite da eventi illegittimo integration in genomi delle piante. Queste sequenze di badnavirus endogeno non sono necessariamente associate a infezione7,8,9,10,11. Successivamente, l’uso di NGS per identificare nuove badnaviruses come l’agente causale della malattia è complicata dalla diversità della sottopopolazione di genomi episomal così come la presenza di sequenze endogeno12,13.
Mentre non c’è non una pipeline ottima per la scoperta dei genomi di romanzo pararetrovirus, ci sono due approcci comuni per identificare questi virus come agenti causali per la malattia. Un metodo consiste nell’arricchire per piccole sequenze di RNA da foglie infette e poi assemblare queste sequenze per ricostituire il virus genome(s)14,15,16,17. Un altro approccio è l’amplificazione di rotolamento cerchio (RCA) per amplificare i virus a DNA circolare genomi18. Il successo di RCA dipende l’età della foglia e il titolo del virus nel tessuto selezionato. I prodotti RCA sono sottoposti a digestione di limitazione e clonati in plasmidi per direct sequencing19,20,21.
Virus giallo mottle canna (CaYMV) è una badnavirus ed è descritto come la causa eziologica della malattia mottle giallo in canna, anche se solo un frammento di bp 565 del genoma è stato precedentemente isolato da infetto cannas22. Uno studio contemporaneo identificato CaYMV in Alpinia purpurata (fioritura zenzero; CaYMV-Ap)23. L’obiettivo di questo studio era di recuperare sequenze di genoma completo badnavirus da gigli canna infetti. Descriviamo un protocollo per purificare i virus da contaminanti di pianta e quindi isolare il DNA virale da questa preparazione e preparare una libreria di DNA per l’uso in NGS. Questo approccio elimina la necessità di passaggi intermedi di amplificazione molecolare. Isoliamo anche mRNA da piante infette per RNA-seq. NGS, che comprende RNA-seq è stata effettuata utilizzando ogni preparazione di acidi nucleici. Contigs assemblati sono stati trovati a relazionarsi con il taxon Badnavirus in entrambi i set di dati utilizzando il centro nazionale per la biotecnologia e Information (NCBI) strumento di ricerca di base di allineamento locale per gli acidi nucleici (BLASTn). Abbiamo identificato i genomi di due badnavirus specie24.
Negli ultimi anni una varietà di metodi sono stati impiegati per studiare la biodiversità di virus vegetali in ambienti naturali che comprendono arricchimento per particelle simili al virus (VLP) o virus specifici RNA o DNA2,3,44, 45,46 . Questi metodi sono seguiti da analisi NGS e bioinformatica. L’obiettivo di questo studio era quello di trovare l’agente causale di una malattia comune in una pianta coltivata. La malattia è stata segnalata per essere il risultato di un virus sconosciuto che ha senza involucro bacilliform particelle, e per cui solo un frammento di bp 565 è stato clonato47. Questa informazione è stata sufficiente per precedenti ricercatori ipoteticamente assegnare il virus al genere Badnavirus all’interno della famiglia Caulimoviridae. Mentre i rapporti anteriori supposto che canna mottle malattia in Gigli di canna era il risultato di un singolo badnavirus, utilizzando l’approccio di metagenomica delineato in questo studio, abbiamo determinato che la malattia è stata causata da due badnavirus provvisorio specie24. Così, la forza di un approccio metagenoma per scoprire l’agente causale di una malattia è che ora possiamo identificare situazioni dove ci possono essere più di una causa.
Il nostro approccio combinando dati di sequenziamento del DNA e RNA è approfondita e dimostra anche che i risultati utilizzando due approcci ha prodotto risultati coerenti e ha confermato la presenza di due virus correlati. Abbiamo impiegato una procedura modificata per isolamento di caulimoviruses e prodotto un campione che è stato arricchito per gli acidi nucleici di virus associato e che sono stati protetti all’interno del capside del virus. Un laboratorio di servizio è stato incaricato di effettuare il sequenziamento del DNA. Il concetto essenziale per il sequenziamento de novo è che quel DNA polimerasi incorpora il fluorescente etichettato nucleotidi in un filamento di DNA modello durante cicli sequenziali della sintesi del DNA. Il contigs assemblati seguita da NGS sono state presentate in un workflow di bioinformatic producendo contigs pochi che sono stati identificati come virus contigs. Ulteriore conferma di virus due genomi10,24,48,49,50 è stata ottenuta tramite analisi bioinformatica del RNA-seq dati ottenuti dalle preparazioni di RNA ribo-vuotati. Un risultato interessante era di imparare che le popolazioni delle sequenze recupero mediante sequenziamento del DNA e RNA fornito distribuzioni simili degli acidi nucleici virali e non virali. Per il sequenziamento del DNA e RNA, < 0,5% delle sequenze erano di origine del virus. All'interno della popolazione del virus sequenze 78-82% apparteneva alla famiglia Caulimoviridae. Confrontando i contigs virus assemblato dal sequenziamento del DNA e RNA, abbiamo confermato che i due genomi assemblati si è verificato in entrambi i set di dati.
Una preoccupazione di usare solo sequenziamento del DNA per identificare i nuovi genomi di virus è che il genoma di badnavirus è un DNA circolare aperto. Abbiamo ipotizzato che sequenze sovrapposte discontinuità nel genoma potrebbero presentare ostacoli per l’assemblaggio del genoma da contigs. L’esame iniziale dei risultati del sequenziamento del DNA ha rivelato due genomi di virus simili. Abbiamo supposto che questi genomi sia rappresentavano la diversità genetica di una specie che non è stata studiata, o rappresentate due specie co-infettare lo stesso impianto di24. Di conseguenza, l’analisi bioinformatica collettiva dei set di dati ottenuti da NGS DNA e RNA 16s, attivata la conferma della presenza di due genomi di integrale.
C’è un altro rapporto che si è sviluppato un metodo alternativo per l’estrazione VLP e acidi nucleici da omogenati di pianta per gli studi di metagenomica, basati su procedure per recuperare il DNA dal virus del mosaico del cavolfiore (CaMV; un caulimovirus)3. Questo approccio identificato romanzo RNA e virus a DNA sequenze nelle piante non coltivate. I passaggi derivati dalla procedura di isolamento caulimovirus utilizzata in questo studio per individuare l’agente causale di una malattia delle piante coltivate sono a differenza i passaggi derivati per l’estrazione VLP da piante naturalmente infettati24. Il successo di entrambi i metodi modificati suggerisce che la procedura di quadro per l’isolamento di caulimovirus può essere un prezioso punto di partenza per studi metagenomica di virus vegetali in generale.
The authors have nothing to disclose.
Ricerca è stata finanziata dal centro dell’Oklahoma per l’avanzamento della scienza e tecnologia applicata ricerca programma fase II AR 132-053-2; e dal dipartimento di Oklahoma di colture speciali agricoltura ricerca programma di sovvenzione. Si ringrazia il Dr. HongJin Hwang e la struttura di nucleo di bioinformatica OSU che è stata sostenuta da sovvenzioni da NSF (EOS-0132534) e NIH (2P20RR016478-04, 1P20RR16478-02 e 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |