Hier presenteren we een nieuwe aanpak om te identificeren plantenvirussen met dubbele streng DNA genomen. Wij gebruiken standaard methoden uittreksel DNA en RNA van besmette bladeren en uitvoeren van de volgende generatie sequencing. Bioinformatic hulpmiddelen assembleren sequenties in contigs, identificeren van contigs vertegenwoordigen virus genomen en genomen aan taxonomische groepen toewijzen.
Deze benadering van de metagenome wordt gebruikt om plantenvirussen met circulaire DNA-genoom en hun afschriften te identificeren. Vaak plant DNA virussen die zich voordoen in lage titers in hun gastheer of niet mechanisch naar een andere host kunnen niet worden geënt zijn moeilijk te propageren om te bereiken van een grotere titer van besmettelijk materiaal. Besmette bladeren zijn grond in een milde buffer met een optimale pH en Ionische samenstelling aanbevolen voor het zuiveren van de meeste bacilliform Para retrovirussen. Ureum wordt gebruikt te breken integratie-organen die val virionen en te ontbinden van cellulaire componenten. Differentiële centrifugeren biedt verdere scheiding van virionen van verontreinigingen van de plant. Proteïnase K behandeling verwijdert vervolgens de capsids. Dan is de virale DNA geconcentreerd en gebruikt voor het rangschikken van de volgende generatie (NGS). De NGS-gegevens worden gebruikt voor het monteren van contigs die zijn voorgelegd aan NCBI-BLASTn te identificeren van een subset van virus sequenties in de gegenereerde dataset. In een parallelle pijpleiding is RNA geïsoleerd van besmette bladeren met behulp van een standaard kolom gebaseerde RNA extractiemethode. Vervolgens wordt ribosoom uitputting uitgevoerd om te verrijken voor een subset van mRNA en virus afschriften. Geassembleerde sequenties afgeleid van RNA sequencing (RNA-seq) werden voorgelegd aan NCBI-BLASTn te identificeren van een subset van virus sequenties in deze dataset. In onze studie vastgesteld we twee verwante full-length badnavirus genomen in de twee datasets. Deze methode verdient de voorkeur aan een andere gemeenschappelijke benadering die extracten van de totale bevolking van kleine RNA opeenvolgingen te reconstrueren plant virus genomic opeenvolgingen. Dit laatste metagenomic pijpleiding herstelt virus gerelateerde sequenties die zijn retro-transcriberen elementen ingevoegd in het genoom van de plant. Dit is gekoppeld aan biochemische of moleculaire testen verder onderscheiden de actief infectieuze agentia. De aanpak die is beschreven in deze studie, herstelt sequenties die representatief is voor het repliceren van virussen die waarschijnlijk actieve virusinfectie geven.
Opkomende plantenziektes rijden onderzoekers aan het ontwikkelen van nieuwe instrumenten voor het identificeren van de juiste causale agent(en). Eerste verslagen van nieuwe of terugkerende virusziekten zijn gebaseerd op algemeen voorkomende symptomen zoals mozaïek en misvormingen van het blad ader wissen, dwerggroei, verwelking, laesies, necrose of andere symptomen. De norm voor het melden van een nieuw virus, zoals het oorzakelijke agens voor een ziekte wil scheiden van andere contaminerende pathogenen, propageren het in geschikte host en reproduceren van de ziekte door het enten in gezonde planten van de oorspronkelijke host-soorten. De beperking in deze benadering is dat vele geslachten van plantenvirussen afhankelijk is van een insect of andere vectoren voor verzending naar een geschikte gastheer of terug naar de oorspronkelijke host-soorten. In dit geval, het zoeken naar de geschikte vector kan worden verlengd, kunnen er problemen om laboratorium kolonies van de vector en verdere inspanningen zijn nodig om het opstellen van een protocol voor experimentele transmissie. Als de voorwaarden voor succesvolle laboratoriumonderzoek naar de overdracht kunnen niet worden bereikt, dan achterblijft het werk bij de standaard voor het melden van een nieuwe virus van de ziekte. Voor virussen die zich in hun natuurlijke gastheren op zeer lage titers voordoen, moeten onderzoekers vaststellen alternatieve hosts teeltmateriaal te handhaven voldoende besmettelijke voorraden voor het uitvoeren van onderzoek. Voor soorten van het virus die alleen een paar planten infecteren kunnen dit ook een belemmering voor de teelt van voorraadculturen1.
In de afgelopen jaren wetenschappers zijn vaker in dienst van high-throughput NGS en metagenomic benaderingen te ontdekken virus sequenties die aanwezig zijn in de omgeving, die niets te maken met een bekende ziekte kan bestaan, maar kan worden toegewezen aan taxonomische soorten en geslachten 2 , 3 , 4. dergelijke benaderingen van de ontdekking en de categorisering van genetische materialen in een aparte omgeving bieden een manier om diversiteit van het virus in de natuur of hun aanwezigheid in een bepaalde ecosysteem te beschrijven, maar niet noodzakelijkerwijs bevestigt aan een kader voor het definiëren van causale agenten voor een schijnbare ziekte.
Het geslacht Badnavirus behoort tot de familie Caulimoviridae van pararetroviruses. Deze virussen zijn bacilliform in vorm met circulaire dubbele streng DNA-genoom van ongeveer 7 tot en met 9 kb. Alle pararetroviruses worden gerepliceerd via een RNA-intermediair. Pararetroviruses bestaan als episomes en onafhankelijk van de plant chromosomale DNA5,6repliceren. Veldstudies van virus bevolking erop wijzen dat deze virus populaties genetisch complex. Informatie verkregen in een heel scala van plant genomen door hoge doorvoer sequentiebepaling hebben bovendien talrijke voorbeelden van badnavirus genoom fragmenten ingevoegd plant genomen door onwettige integratie gebeurtenissen ontdekt. Deze endogene badnavirus sequenties zijn niet noodzakelijkerwijs geassocieerd met infectie7,8,9,10,11. Vervolgens het gebruik van NGS om nieuwe badnaviruses als het oorzakelijke agens van de ziekte wordt bemoeilijkt door de diversiteit van de populaties van episomal genomen, alsmede het voorkomen van endogene sequenties12,13.
Hoewel er niet een optimale pijpleiding voor de ontdekking van roman pararetrovirus genomen, zijn er twee gemeenschappelijke benaderingen om te identificeren deze virussen als causaal agenten voor ziekte. Een methode is om te verrijken voor kleine RNA-sequenties van besmette bladeren en vervolgens monteren deze sequenties te reconstrueren van het virus genome(s)14,15,16,17. Een andere benadering is de rollende cirkel versterking (RCA)-naar het versterken van de circulaire DNA-virus genoom18. Het succes van RCA, is afhankelijk van de leeftijd van het blad en de titer van het virus in het geselecteerde weefsel. De RCA-producten zijn onderworpen aan beperkingsspijsvertering en gekloond in plasmiden voor directe sequencing2120,19,.
Canna geel mottle virus (CaYMV) is een badnavirus en wordt beschreven als de etiologische oorzaak van gele mottle ziekte in canna, hoewel slechts een 565 bp fragment van het genoom eerder geïsoleerd zijn van besmette cannas22 is. Een hedendaagse studie is gebleken dat CaYMV in Alpinia purpurata (bloeiende gember; CaYMV-Ap)23. Het doel van deze studie was om te herstellen van volledige badnavirus genoom sequenties van besmette canna lelies. We beschrijven een protocol voor het zuiveren van virus vanuit plant verontreinigingen, en vervolgens isoleren viraal DNA van deze voorbereiding, en bereiden een DNA-bibliotheek voor gebruik in NGS. Deze benadering elimineert de noodzaak voor de tussenliggende moleculaire amplificatie stappen. Wij isoleren ook mRNA van geïnfecteerde planten voor RNA-seq. NGS, waarin RNA-seq werd uitgevoerd met behulp van elk preparaat van nucleic zuur. Geassembleerde contigs bleken te relateren aan het Badnavirus taxon in beide datasets met behulp van het nationaal centrum voor biotechnologie en informatie (NCBI) de zoekfunctie van fundamentele lokale uitlijning voor nucleic zuren (BLASTn). We geconstateerd dat het genoom van twee badnavirus soorten24.
In de afgelopen jaren te studeren plant virus biodiversiteit in natuurgebieden waaronder verrijken voor virusachtige deeltjes (VLP) of virus specifieke RNA of DNA2,3,44, een verscheidenheid van methoden zijn tewerkgesteld 45,46 . Deze methoden worden gevolgd door NGS en bioinformatic analyse. Het doel van deze studie was om te vinden van het causaal agens van een gemeenschappelijk ziekte in een gecultiveerde plant. De ziekte werd gemeld dat het resultaat van een onbekend virus dat niet-gehuld bacilliform deeltjes heeft, en waarvoor is slechts een 565 bp fragment gekloonde47. Deze informatie was voldoende voor voorafgaande onderzoekers hypothetisch toewijzen van het virus aan het geslacht Badnavirus binnen de familie Caulimoviridae. Terwijl voorafgaande verslagen veronderstelde dat canna mottle ziekte in canna lelies het resultaat van een enkel badnavirus was, met behulp van de metagenomics-aanpak in deze studie, vastbesloten wij dat de ziekte werd veroorzaakt door de twee voorlopige badnavirus soorten24. De kracht van het gebruik van een metagenome aanpak om te ontdekken het oorzakelijke agens van een ziekte is dus dat we nu van situaties identificeren kunnen waar er mogelijk meer dan één oorzaak.
Onze benadering combineren van DNA en RNA sequencing gegevens is grondig en toont ook aan dat de resultaten met behulp van twee benaderingen consistente resultaten opgeleverd en bevestigd van de aanwezigheid van twee verwante virussen. We een gewijzigde procedure voor isolatie van de caulimoviruses in dienst en een monster dat voor virus geassocieerde nucleïnezuren werd verrijkt en die werden beschermd binnen het virus Eiwitmantel geproduceerd. Een servicelaboratorium werd gecontracteerd voor het verrichten van DNA sequencing. Het essentieel concept voor DOVO sequencing is dat DNA-polymerase bevat de TL label nucleotiden in een sjabloon bundel van DNA tijdens opeenvolgende cycli van DNA-synthese. De contigs gemonteerd gevolgd door NGS werden ingediend in een bioinformatic workflow produceren een paar contigs die werden geïdentificeerd als virus contigs. Nog een bevestiging van twee virus genomen10,24,48,49,50 werd verkregen door middel van bioinformatic analyse van RNA-seq gegevens verkregen uit RNA-preparaten ribo-uitgeput. Een interessante uitkomst was om te leren dat de bevolking van sequenties teruggevorderd met DNA en RNA sequencing voorzien soortgelijke distributies van niet-virale en virale nucleïnezuren. Voor DNA en RNA sequencing, < 0,5% van sequenties werden van oorsprong van het virus. Binnen de bevolking van virus sequenties 78-82% tot de familie Caulimoviridae behoorde. Door het vergelijken van de geassembleerde virus contigs van DNA en RNA sequencing, bevestigd we hebben dat het twee geassembleerde genoom in beide datasets plaatsgevonden.
Een punt van zorg van het gebruik van enige DNA rangschikkend om te identificeren van het nieuwe virus genoom is het genoom van de badnavirus een open circulaire DNA. Wij vermoedde dat sequenties overlappende discontinuïteiten in het genoom obstakels voor genoom montage van contigs zou kunnen voorstellen. Eerste onderzoek van het DNA rangschikkend resultaten bleek twee soortgelijke genoom van het virus. We veronderstelde dat deze genomen hetzij vertegenwoordigd genetische diversiteit van een soort die niet is onderzocht of vertegenwoordigde twee soorten mede het infecteren van dezelfde plant24. De analyse van de collectieve bioinformatic van datasets verkregen door NGS DNA en RNA sequencing, ingeschakeld dus de bevestiging van de aanwezigheid van twee volle lengte genomen.
Er is een ander verslag dat een alternatieve methode voor de extractie van VLP en nucleïnezuren van plant homogenates voor metagenomic studies, gebaseerd op procedures om te herstellen van DNA van bloemkool mosaic virus (CaMV; een caulimovirus)3ontwikkeld. Deze aanpak geïdentificeerd roman RNA en DNA-virus sequenties in niet-gekweekte planten. De stappen die zijn afgeleid van de caulimovirus isolatie procedure in deze studie gebruikt om te ontdekken het oorzakelijke agens van een ziekte van geteelde planten zijn anders dan de stappen voor het extraheren van de VLP van natuurlijk geïnfecteerde planten24afgeleid. Het succes van beide gemodificeerde methoden suggereert dat de procedure voor de isolatie van de caulimovirus kan een waardevol uitgangspunt voor metagenomic studies van plantenvirussen in het algemeen.
The authors have nothing to disclose.
Onderzoek werd gefinancierd door Oklahoma Center voor de vooruitgang van wetenschap en technologie toegepast onderzoek programma fase II AR 132-053-2; en door het departement van de Oklahoma van landbouw Specialty gewassen onderzoek subsidie programma. Wij danken Dr. HongJin Hwang en de OSU Bioinformatics Core faciliteit die werd gesteund door subsidies van NSF (EOS-0132534) en NIH (2P20RR016478-04 en 1P20RR16478-02 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |