Aquí presentamos un nuevo enfoque para identificar virus con genomas de ADN de doble cadena. Usamos métodos estándar para extraer el ADN y el ARN de hojas infectadas y llevar a cabo la secuenciación de próxima generación. Herramientas bioinformáticas montan secuencias en contigs, identifican contigs representación de genomas del virus y asignan genomas a grupos taxonómicos.
Este enfoque del metagenoma se utiliza para identificar virus con genoma de ADN circular y sus transcripciones. A menudo virus de ADN de plantas que se producen en títulos bajos en su host o no pueden ser inoculadas mecánicamente a otro host son difíciles de propagar para lograr una mayor concentración de material infeccioso. Hojas infectadas son en un tampón suave con pH óptimo y composición iónica recomendado para purificar más retrovirus de párr de baciliforme. La urea se utiliza para romper los cuerpos de inclusión que atrapan a los viriones y disolver los componentes celulares. Centrifugación diferencial proporciona más separación de viriones de contaminantes de la planta. Luego tratamiento de proteinasa K elimina la cápsida. Entonces el ADN viral es concentrado y usado para la secuenciación de próxima generación (NGS). Los datos NGS se utilizan para armar contigs que son sometidos a NCBI-BLASTn para identificar un subconjunto de secuencias del virus en el conjunto de datos generado. En una tubería paralela, ARN es aislada de hojas infectadas utilizando un método de extracción basado en la columna estándar RNA. Luego agotamiento del ribosoma se lleva a cabo para enriquecer para un subconjunto de transcritos de ARNm y virus. Montado secuencias derivadas del ARN (RNA-seq) de la secuencia fueron sometidas a NCBI-BLASTn para identificar un subconjunto de secuencias del virus en este conjunto de datos. En nuestro estudio, se identificaron dos genomas relacionados badnavirus integral en los dos conjuntos de datos. Este método es preferido a otro enfoque común que los extractos de la población total de pequeñas secuencias de ARN para la reconstitución de secuencias genómicas de virus de plantas. Este último metagenómica tubería recupera virus relacionados con las secuencias que se insertan elementos retro-transcripción en el genoma de la planta. Esto junto a los análisis bioquímicos o moleculares más discernir los agentes infecciosos activamente. El método documentado en este estudio, recupera secuencias representativas de replicar virus que probablemente indican infección activa del virus.
Enfermedades emergentes conducen los investigadores a desarrollar nuevas herramientas para identificar el agente causal correcta. Informes iniciales de enfermedades virales nuevos o recurrentes se basan en los síntomas que comúnmente ocurren como mosaico y de malformaciones de la hoja, vena claro, enanismo, marchitez, lesiones, necrosis, u otros síntomas. El estándar por informar de un nuevo virus como el agente causal de una enfermedad es diferenciarlo de otros patógenos contaminantes, propagar en el huésped adecuado y reproducir la enfermedad por inoculación en plantas sanas de la especie original. La limitación de este enfoque es que muchos géneros de virus de plantas dependen de un insecto u otros vectores para la transmisión a un huésped adecuado o a la especie original. En este caso, la búsqueda para el vector apropiado puede ser prolongada, puede haber dificultades para establecer colonias de laboratorio del vector, y más esfuerzos son necesarios para elaborar un protocolo para la transmisión experimental. Si las condiciones de los estudios de transmisión de laboratorio exitoso no se logra, entonces la obra incumple la norma por informar de una nueva enfermedad de virus. Los virus que se producen en sus hospederos naturales a muy bajas concentraciones, los investigadores deben identificar hosts alternativos de propagación para mantener suficientes existencias infecciosas para llevar a cabo la investigación. Para especies de virus que infectan sólo algunas plantas también esto puede ser un obstáculo para el crecimiento de cultivos stock1.
En los últimos años, los científicos son más a menudo que emplean NGS de alto rendimiento y metagenómica enfoques para descubrir secuencias de virus que están presentes en el ambiente, que puede existir sin relación a una enfermedad conocida, pero puede ser asignado a géneros y especies taxonómicas 2 , 3 , 4. estos enfoques el descubrimiento y clasificación de material genético en un ambiente distinto proporciona una manera de describir la diversidad de virus en la naturaleza o su presencia en un determinado ecosistema pero no necesariamente confirma un marco para la definición de agentes causales de una enfermedad evidente.
El género Badnavirus pertenece a la familia Caulimoviridae de pararetrovirus. Estos virus son baciliforme en forma con genoma de ADN circular de doble cadena de aproximadamente 7 a 9 kb. Los pararetrovirus replican a través de un intermediario de RNA. Pararetrovirus existen como episomas y replican independientes de la planta cromosómico DNA5,6. Estudios de campo de poblaciones de virus indican que las poblaciones de estos virus son genéticamente complejas. Además, la información obtenida a través de una gama de genomas de plantas mediante secuenciación de alto rendimiento han descubierto numerosos ejemplos de fragmentos de genoma de badnavirus insertados por eventos de integración ilegítimo en genomas de plantas. Estas secuencias endógenas badnavirus no están necesariamente asociadas con infección7,8,9,10,11. Posteriormente, el uso de NGS para identificar nuevos badnaviruses como el agente causal de la enfermedad es complicado por la diversidad de la subpoblación de genoma episomal, así como la aparición de secuencias endógenas12,13.
Mientras que hay no una tubería óptima para el descubrimiento de los genomas de pararetrovirus novela, hay dos métodos comunes para identificar estos virus como agentes causales de enfermedad. Un método es enriquecer para pequeñas secuencias de ARN de hojas infectadas y luego montar estas secuencias para reconstituir el virus genome(s)14,15,16,17. Otro enfoque es la amplificación de círculo rodante (RCA) para amplificar genomas de virus de ADN circular18. El éxito de RCA depende de la edad de la hoja y el título del virus en el tejido seleccionado. Los productos RCA son sometidos a digestión de restricción y clonados en plásmidos para directo secuencia19,20,21.
Virus del moteado amarillo de Canna (CaYMV) es un badnavirus y se describe como la causa etiológica de la enfermedad del moteado amarillo en canna, aunque sólo un fragmento de 565 PB del genoma ha sido previamente aislado de cannas infectados22. Un estudio contemporáneo identificado CaYMV de Alpinia purpurata (jengibre de floración; CaYMV-Ap)23. El objetivo de este estudio fue recuperar las secuencias del genoma completo badnavirus de lirios de canna infectados. Describimos un protocolo para la purificación de virus de los contaminantes de la planta y luego aislar DNA viral de esta preparación y preparar una biblioteca de DNA para el uso de NGS. Este enfoque elimina la necesidad de pasos intermedios de amplificación molecular. También aislamos mRNA de plantas infectadas para NGS RNA-seq., que incluye RNA-seq se realizó con cada preparación de ácidos nucleicos. Contigs montados se encontró que se refieren a la taxonomía de Badnavirus en ambos conjuntos de datos con el Centro Nacional de biotecnología y la información (NCBI) herramienta de búsqueda de alineación local básico para los ácidos nucleicos (BLASTn). Se identificaron los genomas de dos badnavirus especies24.
En los últimos años se han empleado una variedad de métodos para el estudio de biodiversidad de virus vegetal en ambientes naturales que incluyen enriquecimiento de partículas similares a virus (VLP) o virus específicos ARN o ADN2,3,44, 45,46 . Estos métodos son seguidos por NGS y bioinformáticas de análisis. El objetivo de este estudio fue encontrar al agente causal de una enfermedad común en una planta cultivada. La enfermedad fue divulgada para ser el resultado de un virus desconocido que tiene partículas no-envueltos baciliforme, y que sólo un fragmento de bp 565 ha sido clonado47. Esta información fue suficiente para que los investigadores previos hipotéticamente asignar el virus del género Badnavirus dentro de la familia Caulimoviridae. Mientras que informes anteriores la hipótesis de que la enfermedad del moteado canna en lirios de canna fue el resultado de un badnavirus solo, utilizando el enfoque de metagenómica planteado en este estudio, se determinó que la enfermedad era causada por badnavirus provisional dos especies24. Por lo tanto, la fuerza de la utilización de un metagenoma enfoque para descubrir el agente causal de una enfermedad es que ahora podemos identificar situaciones donde puede haber más de una causa.
Nuestro enfoque combina datos de secuenciación de DNA y RNA es completa y también demuestra que los resultados utilizando dos enfoques dieron resultados coherentes y confirmaron la presencia de dos virus relacionados. Empleó un procedimiento modificado para el aislamiento de Caulimovirus y produce una muestra que se enriquece para ácidos nucleicos de virus asociados y que estaban protegidos dentro de la cápside del virus. Un laboratorio de servicio fue contratado para llevar a cabo la secuenciación de ADN. El concepto esencial para la secuenciación de novo es que la ADN polimerasa incorpora el fluorescente con la etiqueta nucleotides en un filamento de la plantilla de ADN durante los ciclos secuenciales de la síntesis de ADN. Los contigs montado seguido por NGS se presentaron en un flujo de trabajo Bioinformático produciendo unos contigs que fueron identificados como virus contigs. Más confirmación de virus dos genomas10,24,48,49,50 se obtuvo a través de análisis Bioinformático de datos RNA-seq de preparaciones de RNA ribo-agotado. Un resultado interesante fue conocer que las poblaciones de secuencias recuperaron por secuenciación de ADN y ARN proporciona distribuciones similares de ácidos nucleicos virales y no virales. Para secuenciación de DNA y RNA, < 0,5% de secuencias fueron de origen del virus. Dentro de la población de virus secuencias 78-82% perteneció a la familia Caulimoviridae. Comparando los contigs de virus ensamblados de secuenciación de DNA y RNA, se confirmó que los dos genomas montados se produjeron en ambos conjuntos de datos.
Una preocupación de usar sola secuencia de la DNA para identificar los nuevos genomas de virus es que el genoma de badnavirus es un ADN circular abierto. Conjeturamos que secuencias de superposición de discontinuidades en el genoma pueden presentar obstáculos para el ensamblaje del genoma de contigs. Examen inicial de los resultados de la secuencia de la DNA reveló dos genomas de virus similares. Presumimos que estos genomas representaban o diversidad genética de una especie que no ha sido estudiada o mentionadas aquí dos especies co infectar la misma planta24. Por lo tanto, el análisis Bioinformático colectiva de conjuntos de datos obtenidos por NGS ADN y la secuencia de RNA, permitió la confirmación de la presencia de los dos genomas de longitud completa.
Hay otro informe que desarrolló un método alternativo para la extracción de ácidos nucleicos y VLP de homogenados de planta para los estudios de metagenómica, basados en procedimientos para recuperar el ADN del virus del mosaico del coliflor (CaMV; un caulimovirus)3. Este enfoque identifica novela RNA y secuencias de ADN de virus en plantas no cultivadas. Las medidas derivadas del procedimiento de aislamiento caulimovirus utilizado en este estudio para descubrir al agente causal de una enfermedad de las plantas cultivadas son los pasos para extraer VLP de plantas naturalmente infectadas24. El éxito de ambos métodos modificados sugiere que el procedimiento marco para caulimovirus aislamiento puede ser un valioso punto de partida para estudios de metagenómica de virus de plantas en general.
The authors have nothing to disclose.
Investigación fue financiada por el centro de Oklahoma para el avance de la ciencia y la tecnología aplicada investigación programa fase II AR 132-053-2; y por el Departamento de Oklahoma de agricultura cultivos de especialidad de investigación programa de subvenciones. Agradecemos a Dr. HongJin Hwang y la instalación de base de Bioinformática de OSU que fue apoyado por becas del NSF (EOS-0132534) y NIH (2P20RR016478-04, 1P20RR16478-02 y 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |