Nous présentons ici une nouvelle approche pour identifier les virus végétaux avec les génomes d’ADN double brin. Nous utilisons des méthodes standard pour extraire l’ADN et l’ARN de feuilles infectées et de réaliser le séquençage de prochaine génération. Outils bioinformatiques assemblent des séquences en contigs, identifient des contigs représentant les génomes de virus et affecter des génomes aux groupes taxonomiques.
Cette approche de métagénome sert à identifier les virus de plantes avec les génomes d’ADN circulaires et leurs transcriptions. Souvent les virus de l’ADN de plantes qui se produisent dans des titres faibles dans leur hôte ou ne peut pas être inoculés mécaniquement à un autre hôte sont difficiles à propager pour atteindre un plus grand titre de matières infectieuses. Les feuilles infectées sont broyés dans un tampon doux pH optimal et de composition ionique recommandé pour purifier les rétrovirus Para bacilliformes la plupart. L’urée est utilisée de casser vers le haut de corps d’inclusion des virions d’intercepter et de dissoudre les composants cellulaires. Centrifugation différentielle fournit plus de séparation des virions de contaminants de la plante. Puis le traitement de la protéinase K supprime les capsides. Puis l’ADN viral est concentrée et utilisé pour l’ordonnancement de prochaine génération (NGS). Les données des end sont utilisées pour assembler des contigs qui sont soumis à NCBI-BLASTn pour identifier un sous-ensemble des séquences du virus dans le dataset généré. Dans un pipeline parallèle, l’ARN est isolé dans les feuilles infectées à l’aide d’une méthode d’extraction RNA standard basée sur les colonnes. Puis épuisement ribosome est effectué pour enrichir pour un sous-ensemble de transcriptions de virus et de l’ARNm. Assemblé séquences dérivées de l’ARN (RNA-seq) le séquençage ont été soumis au NCBI-BLASTn pour identifier un sous-ensemble des séquences du virus dans ce dataset. Dans notre étude, nous avons identifié deux génomes différents longs liés à deux séries de données. Cette méthode est préférable à une autre approche commune qui extrait la population globale de petites séquences d’ARN pour reconstituer des séquences génomiques de virus de plante. Ce dernier métagénomique pipeline récupère virus associés des séquences qui sont rétro-transcription des éléments insérés dans le génome de la plante. Ceci est couplé à des épreuves biochimiques ou moléculaires pour discerner davantage les agents infectieux activement. L’approche documentée dans cette étude, récupère les séquences représentant de réplication des virus qui probablement signe d’infection de virus actif.
Maladies des plantes émergentes conduire les chercheurs à développer de nouveaux outils afin d’identifier les agents causals corrects. Rapports initiaux de maladies à virus nouveaux ou récurrents sont basés sur des symptômes fréquents tels que la mosaïque et des malformations des feuilles, nervures, nanisme, flétrissement, lésions, nécrose, ou d’autres symptômes. La norme pour la notification d’un nouveau virus étant l’agent causal d’une maladie pour le séparer des autres pathogènes contaminants, propager dans hôte convenable et reproduire la maladie en inoculant dans des plants sains de l’espèce hôte original. La limitation de cette approche est que beaucoup de genres de virus végétaux dépendent un insecte ou d’autres vecteurs de transmission d’un hôte convenable, ou retour à l’espèce hôte original. Dans ce cas, la recherche pour le vecteur approprié peut être prolongée, il peut y avoir des difficultés à établir des colonies de laboratoire du vecteur, et des efforts supplémentaires sont nécessaires pour élaborer un protocole de transmission expérimentale. Si les conditions d’études en transmission réussie de laboratoire ne peuvent être atteints, alors le travail en deçà la norme pour avoir signalé une nouvelle maladie virale. Pour les virus qui se produisent chez leurs hôtes naturels aux très faibles concentrations, chercheurs doivent identifier des hôtes alternes de multiplication afin de maintenir des stocks infectieuses suffisants pour mener à bien la recherche. Pour les espèces de virus qui infectent uniquement quelques plantes, cela peut aussi être un obstacle pour la croissance de cultures mères1.
Ces dernières années, les scientifiques emploient plus souvent haut débit NGS et métagénomique approches pour découvrir des séquences du virus présents dans l’environnement, ce qui peut exister sans rapport avec une maladie connue, mais peut être assigné aux genres et espèces taxonomiques 2 , 3 , 4. ces approches à la découverte et la catégorisation du matériel génétique dans un environnement distinct permettent de décrire la diversité des virus dans la nature ou leur présence dans un écosystème de certain mais ne confirme pas nécessairement à un cadre pour la définition agents causals de maladie apparente.
Le genre de virus appartient à la famille Caulimoviridae de pararetroviruses. Ces virus sont bacilliformes en forme avec le génome d’ADN circulaire double brin d’environ 7 à 9 kb. Tous les pararetroviruses se répliquer via un intermédiaire de RNA. Pararetroviruses existent extrachromosomale et répliquer indépendants de l’usine chromosomique ADN5,6. Études sur le terrain des populations de virus indiquent que les populations de ces virus sont génétiquement complexes. En outre, les informations obtenues dans un éventail de génomes de plantes par séquençage à haut débit ont découvert de nombreux exemples de différents fragments de génome insérés par les événements d’intégration illégitime dans les génomes végétaux. Ces séquences de virus endogènes ne sont pas nécessairement associés à infection7,8,9,10,11. Par la suite, l’utilisation de NGS pour identifier les nouveaux badnaviruses comme l’agent causal de la maladie est compliquée par la diversité de la sous-population des génomes épisomiques ainsi que la présence de séquences endogène12,13.
Bien qu’il n’y a pas un seul pipeline optimal pour la découverte des génomes pararétrovirus roman, il y a deux approches communes pour identifier ces virus comme agents responsables de maladies. Une méthode consiste à enrichir de petites séquences d’ARN de feuilles infectées et ensuite assembler ces séquences afin de reconstituer les virus analyses14,15,16,17. Une autre approche est l’amplification de cercle roulant (RCA) pour amplifier les génomes de virus à ADN circulaire18. Le succès de RCA dépend de l’âge de la feuille et le titre de virus dans les tissus choisis. Les produits RCA sont soumis à la digestion de restriction et clonés dans des plasmides direct sequencing19,20,21.
Virus de la panachure jaune de Canna (CaYMV) est un virus et est décrite comme étant la cause étiologique de la maladie de la panachure jaune chez canna, bien que seul un fragment de bp 565 du génome a été précédemment isolée de cannas infecté22. Une étude contemporaine a CaYMV en Alpinia purpurata (floraison gingembre ; CaYMV-Ap)23. L’objectif de cette étude était de récupérer les séquences du génome complet connu de lis canna infectés. Nous décrivons un protocole pour la purification des virus des contaminants de l’usine et ensuite isoler l’ADN viral de cette préparation et préparer une bibliothèque d’ADN à utiliser dans la NGS. Cette approche élimine le besoin d’étapes intermédiaires amplification moléculaire. Nous isolons également ARNm de plantes infectées pour NGS RNA-Seq., qui comprend la RNA-seq a été réalisée à l’aide de chaque préparation d’acide nucléique. Contigs assemblés trouvées se rapportant au taxon connu dans les deux ensembles de données à l’aide du Centre National de biotechnologie et l’Information (NCBI) outil de recherche de base alignement local pour les acides nucléiques (BLASTn). Nous avons identifié les génomes de deux différents espèces24.
Ces dernières années, diverses méthodes ont été employées pour étudier la biodiversité des plantes virus dans des environnements naturels incluent enrichissante pour les Pseudo-particules virales (VLP) ou virus spécifiques ARN ou ADN2,3,44, 45,46 . Ces méthodes sont suivies d’une analyse NGS et bioinformatique. L’objectif de cette étude était de trouver l’agent causal d’une maladie commune dans une plante cultivée. La maladie a été signalée pour être le résultat d’un virus inconnu qui contient des particules bacilliformes non enveloppés, et pour lesquels seul un fragment de bp 565 a été cloné47. Cette information ne suffisait pas pour les chercheurs préalables d’assigner hypothétiquement le virus du genre connu au sein de la famille Caulimoviridae. Alors que les précédents rapports émis l’hypothèse que la maladie de marbrure de canna en lis canna était le résultat d’une mosaïque unique, à l’aide de la démarche métagénomique décrite dans cette étude, nous avons déterminé que la maladie était causée par différents provisoire deux espèces24. Ainsi, l’effectif d’utilisent une approche de métagénome pour découvrir l’agent causal d’une maladie est que nous pouvons maintenant identifier les situations où il peut y avoir plus d’une cause.
Notre approche combinant les données de séquençage de l’ADN et l’ARN est approfondie et démontre aussi que les résultats à l’aide de deux approches ont donné des résultats cohérents et ont confirmé la présence de deux virus apparentés. Nous avons utilisé une procédure modifiée pour l’isolement de caulimoviruses et produit un échantillon qui s’est enrichi d’acides nucléiques virus associés et qui ont été protégés au sein de la capside du virus. Un laboratoire de service a été mandatée pour effectuer du séquençage de l’ADN. Le concept essentiel pour le séquençage de novo , c’est que l’ADN polymérase incorpore la fluorescente appelée nucléotides dans un brin d’ADN modèle au cours des cycles séquentiels de synthèse de l’ADN. Les contigs assemblé suivie par NGS ont été présentées dans un workflow de bioinformatic produisant des contigs quelques qui ont été identifiés comme virus contigs. Nouvelle confirmation de virus deux génomes10,24,48,49,50 a été obtenue par le biais de l’analyse bioinformatique des RNA-seq données obtenues par déplétion ribo préparations d’ARN. Un résultat intéressant a été d’apprendre que les populations de séquences récupéré par séquençage de l’ADN et l’ARN fourni des distributions similaires d’acides nucléiques non viraux et virales. Pour le séquençage d’ADN et d’ARN, < 0,5 % des séquences étaient d’origine du virus. Au sein de la population du virus séquences 78-82 % appartenaient à la famille des Caulimoviridae. En comparant les contigs de virus assemblé de séquençage de l’ADN et ARN, nous a confirmé que les deux génomes assemblées ont eu lieu dans les deux ensembles de données.
Un souci d’utilisation seul séquençage de l’ADN pour identifier les génomes de virus nouveaux, c’est que le génome du virus est un ADN circulaire ouvert. Nous avons supposé que les séquences qui se chevauchent de discontinuités dans le génome pourraient présentent des obstacles pour l’assemblage de génome de contigs. Premier examen des résultats du séquençage de l’ADN a révélé deux génomes de virus similaires. Nous avons émis l’hypothèse que ces génomes représentent soit la diversité génétique d’une espèce qui n’a pas été étudiée, ou représentés deux espèces co infectant les mêmes plant24. Par conséquent, l’analyse bioinformatique collective des ensembles de données obtenues par NGS ADN et le séquençage de RNA, a permis la confirmation de la présence de deux génomes de pleine longueur.
Il y a un autre rapport qui a mis au point une autre méthode permettant d’extraire les VLP et acides nucléiques d’homogénats de plantes pour les études de métagénomique, basées sur les procédures pour récupérer l’ADN de virus de mosaïque du chou-fleur (CaMV ; un caulimovirus)3. Cette approche a identifié roman RNA et séquences de virus à ADN chez les plantes non cultivées. Les étapes de la procédure d’isolement caulimovirus utilisée dans cette étude à la découverte de l’agent causal d’une maladie des plantes cultivées sont les mesures calculées pour l’extraction de VLP de plantes infectées naturellement24. Le succès de ces deux méthodes mis à jour le suggère que la procédure-cadre de caulimovirus d’isolement peut-être être un précieux point de départ pour études métagénomique des phytovirus en général.
The authors have nothing to disclose.
Recherche a été financée par le centre de l’Oklahoma pour l’avancement de la Science et de technologie appliquée Research Programme Phase II AR 132-053-2 ; et par le ministère de l’Oklahoma de cultures de spécialité Agriculture programme de subventions de recherche. Nous remercions le Dr HongJin Hwang et l’OSU bioinformatique Core Facility, qui était soutenue par des subventions de la NSF (EOS-0132534) et le NIH (2P20RR016478-04, 1P20RR16478-02 et 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |