Aqui nós apresentamos uma abordagem profunda de sequenciamento que fornece uma análise imparcial da nascente 3′-termini, bem como perfis mutacional de moléculas de DNA único-encalhado. A aplicação principal é a caracterização de DNAs complementares retrovirais nascentes (cDNAs), os intermediários gerados durante o processo de transcrição reversa retroviral.
Monitoramento de ácido nucleico intermediários durante a replicação do vírus fornece insights sobre os efeitos e mecanismos de ação dos compostos antivirais e proteínas de célula do hospedeiro na síntese de DNA viral. Aqui abordamos a falta de um ensaio baseado em pilha, cobertura de alto e de alta resolução que é capaz de definir a transcrição reversa retroviral intermediários no âmbito fisiológico da infecção pelo vírus. O método descrito capta a 3′-termini de moléculas de DNA (cDNA) nascentes complementares dentro das células infectadas de HIV-1 em resolução de nucleotídeo único. O protocolo envolve a colheita de células inteiras DNA, alvo enriquecimento de viral DNA através do híbrido captura, ligadura de adaptador, fracionamento de tamanho por gel de purificação, amplificação do PCR, sequenciamento profundo e análise de dados. Um passo fundamental é a ligadura eficiente e imparcial das moléculas do adaptador para abrir termini 3′-DNA. Aplicação do método descrito determina a abundância de reversos transcrições de cada comprimento específico numa determinada amostra. Ele também fornece informações sobre a variação da sequência (interno) em transcrição reversa e, assim, qualquer potenciais mutações. Em geral, o ensaio é adequado para todas as questões relacionadas ao DNA 3′-extensão, desde que a sequência de modelo é conhecida.
A fim de dissecar e compreender a replicação viral totalmente, cada vez mais refinadas técnicas que capturam replicação intermediários são necessários. Em particular, a definição precisa das espécies do ácido nucleico viral dentro do contexto das células infectadas pode fornecer novos insights, uma vez que muitos mecanismos de replicação viral têm até à data foram examinados em reações isoladas em vitro . Um exemplo é o processo de transcrição reversa em retrovírus, como o vírus de imunodeficiência humana 1 (HIV-1). As várias etapas de transcrição reversa do HIV-1, durante o qual o enzima viral transcriptase reversa (RT) copia o genoma de RNA de single-stranded DNA dupla-hélice, têm sido estudados principalmente em ensaios de extensão da primeira demão com proteínas purified e ácidos nucleicos ácidos1,2,3,4,5. Enquanto princípios fundamentais foram estabelecidos, tais ensaios não incorpora todos os componentes celulares e virais e podem não refletir stoichiometries biologicamente relevantes dos fatores envolvidos. Portanto, nós projetamos uma técnica poderosa para determinar o espectro de intermediários de transcrição reversa com seus precisos do cDNA 3′-termini (isto é, determinar seus comprimentos exatos) e sequências nucleotídicas no contexto das infecções da vida células6. Coleção de dados de tempo de experiências do curso podem ser utilizadas para comparar o perfil de transcritos sob várias condições, tais como a presença de moléculas antivirais ou proteínas, que possam influenciar a eficiência e processivity da síntese de DNA e acumulação. Isto permite uma compreensão mais detalhada do ciclo de vida natural do patógeno, que muitas vezes é a base para a concepção de medicação específica e intervenção terapêutica bem sucedida.
Transcrição reversa do HIV-1 é composto por uma série de eventos sucessivos, iniciada pelo recozimento de um primer de tRNA para o modelo de RNA genômico, que então é estendido por RT para produzir uma transcrição de cDNA de single-stranded curta chamada uma subtração-vertente forte-parada (-sss) (ver A Figura 1). Posteriormente, o cDNA – sss é transferido do terminal 5′-longa repetição (LTR) para a LTR 3′ do RNA genômico, onde ele anneals e serve como o primer para RT continuada mediada alongamento de menos vertente DNA (ver comentários na transcrição reversa1 , 2 , 3 , 4). esta primeira transferência de vertente é um dos passos limitante de transcrição reversa; daí, o cDNA – sss é conhecido por se acumular. O projeto básico de fluxo de trabalho e biblioteca para capturar os produtos de transcrição reversa em células infectadas é descrito na Figura 2a. Os primers específicos e análise de configurações que são usadas no protocolo e listadas na tabela 1 alvo todos cedo reverso transcrição do cDNA intermediários dentro do intervalo de comprimento de 23 para ~ 650 nt, que inclui o nt 180-182 – sss DNA. No entanto, adaptações menores adequadas à estratégia permitirá que o aplicativo não só produtos de transcrição reversa atrasado, mas também outros vírus e sistemas, onde o objetivo é detectar as extremidades de DNA contendo 3′-OH. Limitações importantes a considerar incluem a escala de comprimento do produto final do PCR na biblioteca; em particular, modelos em que a distância entre o adaptador sobre o aberto 3′-terminal e o site cartilha montante exceder ~ 1000 nt irão provavelmente ser menos eficientemente sequenciados, introduzindo potencialmente enganosa preconceitos técnicos durante (preparação de biblioteca Veja a discussão para mais detalhes e sugestões de adaptação).
Anteriormente relatadas técnicas para a determinação sistemática dos 3′-termini de ácidos nucleicos concentraram-se no RNA, e não DNA, moléculas. Um exemplo é 3′ corrida (amplificação rápida das extremidades do cDNA)7, o que depende a poliadenilação dos RNAm. Além disso, foram desenvolvidas estratégias baseadas em ligadura de adaptador empregando ligases de RNA, que incluíram RLM-corrida (RNA ligase-mediada)8 ou do laço (amplificação baseados em ligadura das extremidades do cDNA)9. É importante ressaltar que amplificações baseada em ligadura são sensíveis a qualquer viés introduzido pela reação da ligadura em si. Por exemplo, a ligadura pode ser mais ou menos eficiente, dependendo de um determinado nucleotídeo na posição 3′, a sequência, comprimento total da molécula ou estrutura local. Tais preferências ligase levam a captura incompleta de moléculas e deturpação na leitura, o que nós e os outros têm observado9,10. Para minimizar o viés de ligadura durante as etapas de adição de adaptador no protocolo descrito neste documento, testou uma série de estratégias de ligadura e o uso de T4 DNA ligase com adaptador prendendor single-stranded DNA encontrado (como descrito por Kwok et al. 11) para ser o único procedimento com perto de ligadura quantitativa que não resultou em diferenças significativas na eficiência da ligadura quando avaliados com um conjunto especificamente selecionado de oligonucleotídeos de controle6. A escolha desta estratégia de ligadura é, portanto, um recurso-chave para o sucesso do presente protocolo.
Até à data, monitoramento da progressão do HIV-1 RT em células infectadas principalmente realizado medindo-se produtos da transcrição reversa de diversos comprimento com PCR quantitativo (qPCR) usando conjuntos de cartilha-sonda que medem exclusivamente mais curto ou mais longo (precoce e tarde, respectivamente) do cDNA produtos12,13,14. Enquanto essa abordagem qPCR é apropriada determinar a eficiência intrínseca do processo de transcrição reversa em sistemas celulares, a saída é de resolução relativamente baixa, sem informações de sequência sendo derivada. Nossa nova abordagem, com base no adaptador otimizada da ligadura, geração biblioteca mediada por PCR e sequenciamento profunda endereços o fosso tecnológico e oferece uma oportunidade para monitorar a transcrição reversa durante a infecção de HIV-1, quantitativamente e em único nucleotídeo resolução.
Ilustramos a utilidade desse método em um estudo que distingue-se entre dois propostos modelos para a capacidade do HIV-1 factor de restrição APOBEC3G (apolipoprotein B mRNA edição enzima catalítica do polypeptide, como 3G) para interferir com o produção de transcrição reversa viral6.
A disponibilidade de rápido, confiável e econômica profunda sequenciamento revolucionou muitos aspectos no campo das Ciências da vida, permitindo grande profundidade nas análises baseada no sequenciamento. Um desafio restante situa-se no design inovador e criação de representante bibliotecas de sequenciamento. Aqui descrevemos um protocolo para capturar moléculas de cDNA viral nascente, especificamente os intermediários do processo de transcrição reversa do HIV-1.
O passo mais crítico no âmbito desta estratégia é a ligadura de um adaptador para o aberto 3′-termini de forma quantitativa e imparcial. Eficiências de ligadura entre dois ssDNA termini, ambos intere intramolecular, foram investigados e otimizado para várias aplicações11,26,,27,28,29. A escolha de usar um adaptador de gancho de cabelo com T4 DNA ligase nas condições descritas na etapa 3.3 resulta da otimização empírica, no qual foram avaliados diferentes ligases, adaptadores e reagentes para a ligadura dos oligonucleotides sintéticos que representam Sequências de HIV-1 (tabela 2) (dados não mostrados). Nessas reacções teste em vitro , confirmamos que o T4 DNA ligase mediada da ligadura do adaptador de grampo de cabelo, conforme descrito por Kwok et al. 11, tem um viés muito baixo e atinge perto de ligadura completa de moléculas aceitador quando o adaptador é usado em excesso. A eficiência da ligadura não foi afetada pela adição de uma sequência de nucleotídeos para processar o adaptador compatível para o sistema de multiplex da primeira demão (ver Figura 4). Em comparação, nós encontramos que um thermostable 5′ do DNA/RNA ligase (“Ligase A”, veja Tabela de materiais para exatas ligases comparado aqui), que é uma engenharia ligase de RNA que foi desenvolvido em parte para melhorar a eficiência da ligadura com ssDNA como o aceitador 27, foi realmente mais eficaz no ligando duas ssDNA moléculas do RNA ligase do (“Ligase B”), mas teve um viés significativo, com fortes diferenças na eficiência da ligadura nem oligonucleotides com diferenças de comprimento de base única [tabela 2 ; HTP con meados G (a) e (b)]. Além disso, encontramos apenas um mínimo viés em reações com “Ligase C”, combinado com um adaptador carregando um estudo randomizado 5′-termini (uma estratégia usada para compensar o viés de nucleotídeos conhecidos de “Ligase C”; Veja, por exemplo, Ding et al. 30). no entanto, o “Ligase C”-mediada por ligadura intermoleculares estava incompletas, tornando o sistema de T4 DNA ligase a escolha superior.
Várias etapas de controle de qualidade sobre o curso do protocolo e a inclusão de controles positivos e negativos de permitam a detecção de problemas potenciais antes de continuação de ensaio e fornecem orientação para solucionar problemas de esforços. As quantificações de qPCR em passos 2.2.2 e 2.3.12 certifique-se que a quantidade de material a entrada é suficiente. Número de cópias de cDNA típicas na faixa de eluição (da etapa 2.1) 200 µ l de 10.000 cerca de 300.000 por µ l. A etapa de captura híbrida pode resultar em alguma perda de HIV-1 global do cDNA quantidade mas deve resultar em um forte enriquecimento do cDNA específico do HIV-1 sobre o DNA celular, que pode ser determinado usando-se primers adequados para quantificar o DNA genômico, antes e depois de enriquecimento por qPCR ou medindo a concentração de DNA total. Recuperado cDNA de HIV-1 após o híbrido capturar etapas deve ser pelo menos 10% da entrada. Baixa material começar caso contrário pode explicar um controlo positivo de sucesso do oligonucleotide (consulte a etapa 3.3.2) mas só limitado leituras alcançadas nas amostras. Baixo Leia números globais também poderiam ser explicados pela superestimação da concentração biblioteca devido à presença de espécies de DNA irrelevantes sem adaptadores de MiSeq. Isto resultaria em densidade baixa de cluster e pode ser melhorado através da determinação da concentração de sequências do HIV-1 na biblioteca por qPCR além da quantidade total de DNA por ensaios fluorométrica. Devido à natureza altamente sensível do método, especial cuidado para evitar contaminação nem de baixo nível, tanto a partir de outras amostras (em particular, as alta concentração controle do oligonucleotide das existências de), bem como de equipamento de laboratório. Nesse sentido, trabalhando em um UV para esterilização de estação de trabalho do PCR é benéfico. A eletroforese em gel automatizado da biblioteca final (etapa 6.1.2) é uma medida adicional de controle de qualidade. A gama de tamanho de ácido nucleico tipicamente observada é entre 150 a 500 nt. Primers que podem ser detectados no controle opcional após a PCR, e antes de purificação (ver nota na etapa 5.2) agora deve estar ausente. Em um resultado representativo, a curva de intensidade de amostra tem um pico em torno de 160 a 170 nt e uma segunda maior pico em torno de 320 a 350 nt. Isto provavelmente reflete a abundância superior muitas vezes visto em transcrições de reverso relativamente curtas (comprimento de inserção de nt de 1 a 20) e completos no forte-parada (comprimento de inserção de nt de 180 a 182) (Figura 3b).
Enquanto o protocolo apresentado e primers selecionados são específicos para início construções de transcrição reversa do HIV-1, o método é geralmente aplicável para qualquer estudo com o objetivo de determinar aberto 3′-termini de DNA. As principais modificações necessárias em outros contextos será o método de captura híbrida e a estratégia de projeto da primeira demão. Por exemplo, se o destino é ser adaptada ao finais transcrições de HIV-1, um número maior de diferentes capturando os oligonucleotides biotinilado recozimento em todo o comprimento do cDNA seria aconselhável e provavelmente irá diminuir a perda na etapa de captura híbrida. Como mencionado na introdução, é importante considerar as limitações ao projetar a gama sobre as quais 3′-termini é para ser detectado para evitar diferentes fontes de viés. Primeiro, pode haver um viés nas reações de PCR se os modelos com o adaptador são de comprimento vastamente diferentes. Em segundo lugar, a plataforma de sequenciamento usada aqui (por exemplo, MiSeq) tem uma gama de comprimento de inserção preferencial para clustering optimal, e significativamente mais curtos e mais produtos não podem ser sequenciados com a mesma eficiência. Em parte, isto pode ser resolvido computacionalmente, como foi feito através do cálculo de um fator de correção para o viés de comprimento linear (ver Figura 4, o gráfico inferior). No entanto, se a região de onde 3′-termini mapeamento é desejada é longa (> 1000 nt), é mais aconselhável dividir as reações com as transcrições ligadas e usar múltiplos primers upstream para avaliar 3′-termini em seções.
O programa de análise foi escrito internamente para a finalidade específica de analisar tanto o último nucleotídeo da sequência de HIV-1, adjacente à sequência de adaptador fixo, bem como a variação de base de todas as bases para identificar quaisquer mutações. Os passos individuais incluem o seguinte: primeiro, as sequências de adaptador são aparadas usando o toolkit de fastx-0.0.13; em seguida, as sequências que são duplicadas (significando sequências idênticas, incluindo o código de barras) são removidas. Todas as restantes leituras exclusivas então estão alinhadas para a sequência do HIV-1 usando gravata borboleta (http://bowtie-bio.sourceforge.net/index.shtml) com a incompatibilidade máxima definido em três bases. A sequência do modelo é composta o primeiro 635 nt do cDNA de HIV-1 (estirpe NL4.3), que inclui a sequência – sss e o primeiro produto de transferência de fio até a faixa de polypurine (U5-R-U3-PPT; consulte a Figura 1). Desse modo, o software fornecido e modelos são diretamente adequados se o método é usado para o mesmo aplicativo (detecção de início transcrições inversa do HIV-1NL4.3). Ajustes vão ter que ser feito para outras sequências de destino. As posições de 3′-termini para cada leitura foram determinadas pela posição no alinhamento. Chamadas de base para cada posição são gravadas e taxas de mutação são calculadas a partir da cobertura total de cada base, que varia, como as leituras são de comprimentos diferentes e inserções longas não podem ser inteiramente cobertas pelo sequenciamento de 125-base em Read2.
Para concluir, acreditamos que o método descrito para ser uma ferramenta valiosa para muitos tipos de estudos. Aplicações óbvias incluem investigações sobre os mecanismos subjacentes a inibição da transcrição reversa através de drogas anti-retrovirais ou fatores de restrição do celular. No entanto, apenas relativamente pequenos ajustes devem ser necessários adaptar o sistema de 3′-termini mapeamento dentro de outros single-stranded DNA viral produtos intermédios, que estão presentes, por exemplo, em replicação de Parvovírus. Além disso, o princípio do método, particularmente sua etapa de ligadura otimizada, pode fornecer uma parte do núcleo de design de preparação de biblioteca para a caracterização de quaisquer extensões de 3′-DNA, incluindo alongamentos catalisados por celular DNA dupla-hélice polimerases.
The authors have nothing to disclose.
Os autores reconhecem o apoio de membros do laboratório Martins, Luis Apolonia, Jernej Ule e Rebecca Oakey. Os autores graças a Matt Arno do rei faculdade Londres Centro de genômica e Debbie Hughes no University College London (UCL), Instituto de Neurologia próxima geração sequenciamento facilidade, pela ajuda com o sequenciamento de MiSeq é executado. O trabalho foi apoiado por o UK Medical Research Council (G1000196 e senhor/M001199/1 a M.M.), a Wellcome Trust (106223/Z/14/Z a M.M.), sétimo programa-quadro da Comissão Europeia (FP7/2007-2013) no âmbito do acordo de concessão não. PIIF-GA-2012-329679 (a D.P.) e o departamento de saúde através de um institutos nacionais para atribuição de saúde abrangente de pesquisa Biomedical Research Center para o cara e St Thomas’ NHS Foundation Trust em parceria com faculdade Londres do rei e do rei Hospital Universitário NHS Foundation Trust.
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood – CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) – MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation – automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |