Aqui nós apresentamos uma nova abordagem para identificar a planta vírus com genoma de DNA dobro-costa. Utilizamos métodos padrão para extrair o DNA e RNA de folhas contaminadas e realizar o sequenciamento de próxima geração. Ferramentas de Bioinformatic montam sequências em contigs, identificam contigs representando genomas do vírus e atribuir genomas de grupos taxonômicos.
Esta abordagem de metagenome é usada para identificar a planta vírus com genoma de DNA circular e seus transcritos. Muitas vezes planta vírus de DNA que ocorrem em baixa concentração de acolhimento ou não poderem ser inoculadas mecanicamente para outro host são difíceis de propagar para alcançar uma maior concentração de material infeccioso. Folhas infectadas são terreno em um buffer suave com pH ideal e a composição iônica, recomendado para a maioria dos retrovírus de pará bacilliform de purificação. A ureia é usada para quebrar os corpos de inclusão que armadilha virions e para dissolver os componentes celulares. Centrifugação diferencial fornece uma separação de virions de contaminantes de planta. Tratamento de proteinase K, em seguida, remove os capsids. Em seguida, o DNA viral é concentrado e usado para sequenciamento de próxima geração (NGS). Os dados NGS são usados para montar contigs que são submetidos à NCBI-BLASTn para identificar um subconjunto de sequências de vírus no dataset gerado. Em um pipeline paralelo, RNA é isolado de folhas contaminadas, usando um método de extração de RNA baseado na coluna padrão. Depleção de ribossoma é realizada para enriquecer para um subconjunto de transcrições de mRNA e vírus. Montadas sequências derivadas de RNA (RNA-seq) de sequenciamento foram submetidas à NCBI-BLASTn para identificar um subconjunto de sequências de vírus neste dataset. Em nosso estudo, identificamos dois genomas relacionados badnavirus completos em dois conjuntos de dados. Este método é preferível à outra abordagem comum que extrai a população agregada de pequenas sequências de ARN para reconstituir a planta vírus sequências genomic. Este último metagenomic gasoduto recupera vírus relacionados com sequências que são elementos retrô-transcrevendo inseridos no genoma da planta. Este é acoplado para ensaios bioquímicos ou moleculares mais discernir os agentes infecciosos ativamente. A abordagem documentada neste estudo, recupera sequências representativas da replicação de vírus que provavelmente indicam infecção pelo vírus ativo.
Doenças emergentes de planta conduzir os investigadores a desenvolver novas ferramentas para identificar o agente causal correta (s). Os relatórios iniciais de viroses novo ou recorrente baseiam-se geralmente ocorrem sintomas como mosaico e malformações da folha, veia de compensação, nanismo, murcha, lesões, necrose, ou outros sintomas. O padrão para um novo vírus de relatórios como o agente causal de uma doença é para separá-lo de outros patógenos contaminantes, propagá-la em um hospedeiro adequado e reproduzir a doença por inoculação em plantas saudáveis da espécie hospedeiro original. A limitação desta abordagem é que muitos géneros de vírus de planta dependem de um inseto ou outros vetores para a transmissão para um hospedeiro adequado ou voltar para as original espécies de hospedeiros. Neste caso, a busca para o vetor apropriado pode ser prolongada, pode haver dificuldades para estabelecer colônias de laboratório do vetor e mais esforços são necessários para elaborar um protocolo para transmissão experimental. Se as condições para estudos de transmissão bem sucedida de laboratório não podem ser alcançadas, então o trabalho fica aquém do padrão para relatar uma nova doença de vírus. Para vírus que ocorrem em seus hospedeiros naturais em títulos muito baixos, pesquisadores devem identificar hospedeiros alternativos de propagação para manter reservas suficientes de infecciosas para realização de pesquisas. Para as espécies de vírus que infectam apenas algumas plantas isso também pode ser um obstáculo para o cultivo de culturas-mãe1.
Nos últimos anos, os cientistas estão mais frequentemente empregando NGS elevado-throughput e abordagens metagenomic para descobrir sequências de vírus que estão presentes no ambiente, que pode existir relacionados com uma doença conhecida, mas pode ser atribuído a gêneros e espécies taxonômicas 2 , 3 , 4. tais abordagens para a descoberta e a categorização de materiais genéticos em um ambiente distinto fornecem uma maneira para descrever a diversidade de vírus na natureza ou sua presença em um determinado ecossistema, mas não necessariamente confirma um enquadramento para a definição agentes causais para uma doença aparente.
O gênero Badnavirus pertence à família Caulimoviridae de pararetroviruses. Estes vírus são bacilliform em forma com genoma de DNA circular de fita dupla de aproximadamente 7 a 9 kb. Todos os pararetroviruses replicar através de um intermediário de RNA. Pararetroviruses existe como episomes e replicar independentes da planta cromossômico DNA5,6. Estudos de populações do vírus de campo indicam que estas populações de vírus são geneticamente complexas. Além disso, as informações obtidas através de uma gama de genomas de plantas por sequenciamento de alto rendimento tem descoberto inúmeros exemplos de fragmentos de genoma badnavirus inseridos por eventos de integração ilegítimo em genomas de planta. Essas sequências de badnavirus endógena não estão necessariamente associadas com infecção7,8,9,10,11. Posteriormente, o uso de NGS para identificar novos badnaviruses como o agente causal da doença é complicado pela diversidade de genomas epissomal subpopulação, bem como a ocorrência de sequências endógenas12,13.
Enquanto há não um pipeline ideal para a descoberta de genomas de romance pararetrovirus, existem duas abordagens comuns para identificar estes vírus como agentes causais de doença. Um método é enriquecer para pequenas sequências de RNA das folhas infectadas e em seguida montar essas sequências para reconstituir o vírus genome(s)14,15,16,17. Outra abordagem é a amplificação de círculo rolante (RCA) para amplificar a vírus de DNA circular genomas18. O sucesso da RCA depende da idade da folha e do título do vírus no tecido selecionado. Os produtos RCA são submetidos a digestão da limitação e clonados em plasmídeos para direct sequenciamento19,20,21.
Vírus mottle amarelo de canna (CaYMV) é um badnavirus e é descrito como a causa etiológica da doença mottle amarelo em canna, embora tenha sido apenas um fragmento de bp 565 do genoma anteriormente isoladas de cannas infectados22. Um estudo contemporâneo identificado CaYMV em Alpinia purpurata (gengibre de floração; CaYMV-Ap)23. O objetivo deste estudo foi recuperar sequências do genoma completo badnavirus de lírios de canna infectados. Descrevemos um protocolo para a purificação de vírus de contaminantes de planta e depois isolar ADN viral, a partir desta preparação e preparar uma biblioteca de DNA para uso em NGS. Essa abordagem elimina a necessidade de etapas de amplificação molecular intermediário. Nós também isolar mRNA de plantas infectadas para RNA-Seq. NGS, que inclui RNA-seq foi realizada usando cada preparação de ácido nucleico. Contigs montados foram encontrados para relacionar o táxon Badnavirus em ambos os conjuntos de dados usando o centro nacional de biotecnologia e Information (NCBI) ferramenta de busca de alinhamento local básico de ácidos nucleicos (dos). Identificamos os genomas de duas badnavirus espécies24.
Nos últimos anos uma variedade de métodos têm sido empregadas para o estudo da biodiversidade de vírus de planta em ambientes naturais, que incluem enriquecedor para partículas vírus-like (VLP) ou vírus específico do RNA ou DNA2,3,44, 45,46 . Esses métodos são seguidos por NGS e bioinformatic análise. O objetivo deste estudo foi encontrar o agente causal de uma doença comum em uma planta cultivada. A doença foi relatada para ser o resultado de um vírus desconhecido, que tem partículas não-envelopado bacilliform, e para que apenas um fragmento de bp 565 tem sido clonado47. Esta informação foi suficiente para os investigadores prévios, hipoteticamente, atribuir o vírus para o gênero Badnavirus dentro da família Caulimoviridae. Enquanto relatórios anteriores a hipótese de que a doença de mottle canna em lírios de canna foi o resultado de um único badnavirus, usando a abordagem de metagenômica descrita neste estudo, determinamos que a doença era causada por badnavirus provisório duas espécies24. Assim, a força do uso de uma abordagem metagenome para descobrir o agente causal de uma doença é que agora podemos identificar situações onde pode haver mais de uma causa.
Nossa abordagem combina dados de sequenciamento de DNA e RNA é completa e também demonstra que os resultados usando duas abordagens produziram resultados consistentes e confirmaram a presença de dois vírus relacionados. Nós empregado um procedimento modificado para isolamento de caulimoviruses e produzido uma amostra que foi enriquecido por ácidos nucleicos de vírus associado e que estavam protegidos dentro do capsídeo do vírus. Um laboratório de serviço foi contratado para realizar o sequenciamento de DNA. O conceito essencial para sequenciamento de novo é que a DNA polimerase incorpora o fluorescente etiquetado nucleotides em uma cadeia de DNA modelo durante ciclos sequenciais de síntese de DNA. O contigs montado seguido por NGS foram apresentados em um fluxo de trabalho de bioinformatic produzindo contigs alguns que foram identificadas como contigs de vírus. Mais uma confirmação do vírus dois genomas10,24,,48,49,50 foi obtida através da análise de bioinformatic da RNA-seq dados obtidos de preparações de RNA ribo-esgotada. Um resultado interessante era aprender que as populações de sequências recuperaram por sequenciamento de DNA e RNA fornecidos distribuições similares dos ácidos nucleicos virais e não virais. Para o sequenciamento de DNA e RNA, < 0.5% das sequências foram de origem do vírus. No seio da população de vírus sequências 78-82% pertencia à família Caulimoviridae. Comparando o vírus montado contigs de sequenciamento de DNA e RNA, confirmamos que os dois genomas montados ocorreram em ambos os conjuntos de dados.
Uma preocupação de usar apenas sequenciamento de DNA para identificar os genomas de vírus novo é que o genoma de badnavirus é um DNA circular aberto. Supõe-se que sequências sobrepondo descontinuidades no genoma podem apresentar obstáculos para a montagem do genoma de contigs. Exame inicial dos resultados de sequenciamento de DNA revelou dois genomas similares do vírus. Formulamos a hipótese que estes genomas também representavam a diversidade genética de uma espécie que não tem sido estudada, ou representados duas espécies co infectando a mesma planta24. Portanto, a análise de bioinformatic coletiva de conjuntos de dados obtidos pelo DNA NGS e sequenciação do ARN, habilitado a confirmação da presença de dois genomas completos.
Há um outro relatório que desenvolveu um método alternativo para extrair VIP e ácidos nucleicos de planta homogenates para estudos de metagenomic, com base em procedimentos para recuperar o DNA do vírus do mosaico da couve-flor (CaMV; um caulimovirus)3. Esta abordagem identificada romance RNA e sequências de DNA vírus em plantas não cultivadas. As etapas derivadas do procedimento de isolamento caulimovirus usado neste estudo para descobrir o agente causal de uma doença de plantas cultivadas são ao contrário as etapas derivadas para extrair VIP de plantas infectadas naturalmente24. O sucesso de ambos os métodos modificados sugere que o procedimento de quadro para caulimovirus isolamento pode ser um valioso ponto de partida para estudos de metagenomic de vírus de plantas em geral.
The authors have nothing to disclose.
Pesquisa foi financiada pelo centro de Oklahoma para o avanço da ciência e tecnologia aplicada pesquisa programa fase II AR 132-053-2; e pelo departamento de agricultura especialidade culturas de Oklahoma programa de bolsas de investigação. Agradecemos o Dr. HongJin Hwang e a instalação de núcleo de Bioinformática OSU que foi apoiada por concessões do NSF (EOS-0132534) e NIH (2P20RR016478-04, 1P20RR16478-02 e 5P20RR15564-03).
NaH2PO4 | Sigma-Aldrich St. Louis MO | S5976 | Grinding buffer for virus purification |
Na2HPO4 | Sigma-Aldrich | S0751 | Grinding buffer for virus purification |
Na2SO3 | Thermo-Fisher Waltham, MA | 28790 | Grinding buffer for virus purification |
urea | Thermo-Fisher | PB169-212 | Homogenate extraction |
Triton X-100 | Sigma-Aldrich | X-100 | Homogenate extraction |
Cheesecloth | VWR Radnor, PA | 21910-107 | Filter homogenate |
Tris | Thermo-Fisher | BP152-5 | Pellet resuspension& DNA resuspension buffers |
MgCl2 | Spectrum, Gardena, CA | M1035 | Pellet resuspension buffer |
EDTA | Spectrum | E1045 | Stops enzyme reactions |
Proteinase K | Thermo-Fisher | 25530 | DNA resuspension buffer |
phenol:chloroform:isoamylalcohol | Sigma-Aldrich | P2069 | Dissolve virion proteins |
DNAse I | Promega | M6101 | Degrade cellular DNA from extracts |
95% ethanol | Sigma-Aldrich | 6B-100 | Virus DNA precipitation |
Laboratory blender | VWR | 58984-030 | Grind leaf samples |
Floor model ultracentrifuge &Ti70 rotor | Beckman Coulter, Irving TX | A94471 | Separation of cellular extracts |
Floor model centrifuge and JA-14 rotor | Beckman Coulter | 369001 | Separation of cellular extracts |
Magnetic stir plate | VWR | 75876-022 | Mixing urea into samples overnight |
Rubber policeman | VWR | 470104-462 | Dissolve virus pellet |
2100 bioanalyzer Instrument | Agilent Genomics, Santa Clare, CA | G2939BA | Sensitive detection of DNA and RNA quality and quantity |
2100 Bioanalyzer RNA-Picochip | 5067-1513 | Microfluidics chip used to move, stain and measure RNA quality in a 2100 Bioanalyzer | |
2100 Bioanalyzer DNA-High Sensitive chip | 5067-4626 | Microfluidics chip used to move, stain and measure DNA quality in a 2100 Bioanalyzer | |
Nanodrop spectrophotometer | Thermo-Fisher | ND-2000 | Analysis of DNA/RNA quality at intermediate steps of procedures |
Plant total RNA isolation kit | Sigma-Aldrich | STRN50-1KT | Isolate RNA for RNA-seq |
RNase-free water | VWR | 10128-514 | Resuspension of DNA and RNA for NGS |
RNA concentrator spin column | Zymo Research, Irvine, CA | R1013 | Prepare RNA for RNA-seq |
rRNA removal kit | Illumina, San Diego, CA | MRZPL116 | Prepare RNA for RNA-seq |
DynaMag-2 Magnet | ThermoFisher | 12321D | Prepare RNA for RNA-seq |
RNA enrichment system | Roche | 7277300001 | Prepare RNA for RNA-seq |
Agarose | Thermo-Fisher | 16500100 | Gel analysis of DNA/RNA quality at intermediate steps of procedures |
Ethidium bromide | Thermo-Fisher | 15585011 | Agarose gel staining |
pGEM-T +JM109 competent cells | Promega, Madison, WI | A3610 | Clone genome fragments |
pFU Taq polymerase | Promega | M7741 | PCR amplify virus genome |
dNTPs | Promega | U1511 | PCR amplify virus genome |
PCR oligonucleotides | IDT, Coralvill, IA | Custom order | PCR amplify virus genome |
Miniprep DNA purification kit | Promega | A1330 | Plasmid DNA purification prior to sequencing |
PCR clean-up kit | Promega | A9281 | Prepare PCR products for cloning |
pDRAW32 software | ACAClone | Computer analysis of circular DNA and motifs | |
MEGA6.0 software | MEGA | Molecular evolutionary genetics analysis | |
Primer 3.0 | Simgene.com | ||
Quant-iT™ RiboGreen™ RNA Assay Kit | Thermo-Fisher | R11490 | Fluorometric determination of RNA quantity |
GS Junior™ pyrosequencing System | Roche | 5526337001 | Sequencing platform |
GS Junior Titanium EmPCR Kit (Lib-A) | Roche | 5996520001 | Reagents for emulsion PCR |
GS Jr EmPCR Bead Recovery Reagents | Roche | 5996490001 | Reagents for emulsion PCR |
GS Junior EmPCR Reagents (Lib-A) | Roche | 5996538001 | Reagents for emulsion PCR |
GS Jr EmPCR Oil & Breaking Kit | Roche | 5996511001 | Reagents for emulsion PCR |
GS Jr Titanium Sequenicing kit* | Roche | 5996554001 | Includes sequencing reagents, enzymes, buffers, and packing beads |
GS Jr. Titanium Picotiter Plate Kit | Roche | 5996619001 | Sequencing plate with associated reagents and gaskets |
IKA Turrax mixer | 3646000 | Special mixer used with Turrax Tubes | |
IKA Turrax Tube (specialized mixer) | 20003213 | Specialized mixing tubes with internal rotor for creating emulsions | |
GS Nebulizers Kit | Roche | 5160570001 | Nucleic acid size fractionator for use during library preparations |
GS Junior emPCR Bead Counter | Roche | 05 996 635 001 | Library bead counter |
GS Junior Bead Deposition Device | Roche | 05 996 473 001 | Holder for Picotiter plate during centrifugation |
Counterweight & Adaptor for the Bead Deposition Devices | Roche | 05 889 103 001 | Used to balance deposition device with picotiter plate centrifugation |
GS Junior Software | Roche | 05 996 643 001 | Software suite for controlling the instrument, collecting and analyzing data |
GS Junior Sequencer Control v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Run Processor v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS De Novo Assembler v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Reference Mapper v. 3.0 | Roche | (Included in item 05 996 643 001 above) | |
GS Amplicon Variant Analyzer v. 3.0 | Roche | (Included in item 05 996 643 001 above) |