Long-leitura sequências facilitam grandemente a montagem de genomas complexas e caracterização da variação estrutural. Nós descrevemos um método para gerar as sequências ultra-longa pelas plataformas de sequenciamento baseado em nanopore. A abordagem adota uma extração de DNA otimizada seguida de preparações de biblioteca modificada para gerar centenas de mil leituras com cobertura moderada de células humanas.
Terceira geração de tecnologias de sequenciamento de DNA único-molécula oferecem significativamente mais ler comprimento que pode facilitar a montagem de genomas complexas e análise das variantes estruturais complexas. Nanopore plataformas executam sequenciamento de único-molécula medindo diretamente as alterações atuais mediadas pela passagem de DNA através dos poros e podem gerar centenas de leituras de quilobase (kb) com custo de capital mínimo. Esta plataforma tem sido adotada por muitos pesquisadores para uma variedade de aplicações. Alcançar longas distâncias de leitura de sequenciamento é o fator mais crítico para alavancar o valor das plataformas de sequenciamento de nanopore. Para gerar leituras ultra-longa, consideração especial é necessário para evitar quebras de DNA e ganhar eficiência para gerar modelos de sequenciamento produtivo. Aqui, nós fornecemos o protocolo detalhado de ultra-longa sequenciamento de DNA, incluindo a extração de DNA de alto peso molecular (HMW) de células frescas ou congeladas, construção de biblioteca por mecânica de corte ou fragmentação de transposase e sequenciamento em um dispositivo de nanopore. De 20 a 25 µ g de DNA HMW, o método pode atingir N50 ler comprimento de 50-70 kb com corte mecânico e N50 de 90-100 kb ler comprimento com transposase mediada por fragmentação. O protocolo pode ser aplicado a DNA extraído de células de mamíferos, para realizar o sequenciamento do genoma inteiro para a detecção de variantes estruturais e montagem do genoma. As melhorias adicionais na extração de DNA e reações enzimáticas mais aumentará o comprimento Leia e expandir sua utilidade.
Na última década, maciçamente paralelo e tecnologias de segunda geração altamente precisos da elevado-produção sequenciamento conduziram a uma explosão da inovação tecnológica1,2,3e descoberta de biomédica. Apesar dos progressos técnicos, os curto-ler dados gerados pelas plataformas da segunda geração são ineficazes para resolver complexas regiões genômicas e são limitados na detecção de variantes estruturais genômicas (SVs), que desempenham papéis importantes em humanos evolução e doenças4,5. Além disso, curto-ler dados são incapazes de resolver a variação de repetição e são impróprios para discernir haplótipo eliminação de variantes genéticas6.
Recentes progressos em único-molécula sequenciamento oferece significativamente mais ler o comprimento, o que pode facilitar a detecção de todo o espectro da SVs7,8,9e ofertas exactas e completas de montagem do complexo microbiana e mamíferos genomas6,10. A plataforma nanopore executa single-molécula sequenciamento medindo diretamente as alterações atuais mediadas pela passagem de DNA através dos poros11,12,13. Ao contrário de qualquer existente química de sequenciamento de DNA, sequenciamento de nanopore pode gerar long (dezenas de milhares de kilobases) leituras em tempo real, sem depender de cinética de polimerase ou artificial amplificação da amostra do DNA. Portanto, nanopore longa leitura sequenciamento (NLR-seq) detém grande promessa para gerar ultra-longa comprimentos Leia bem além de 100kb, que avançou grandemente análises genômicas e biomédica14, particularmente na baixa complexidade ou repetição-rico regiões dos genomas15.
A característica única de sequenciamento de nanopore é seu potencial para gerar longo lê sem uma limitação do comprimento teórico. Portanto, o comprimento de leitura é dependente do comprimento físico do DNA que é diretamente afetado pela qualidade de modelo de integridade e sequenciamento do DNA. Além disso, dependendo da extensão da manipulação e o número de etapas envolvidas, tais como forças de pipetagem e condições de extração, a qualidade do DNA é altamente variável. Portanto, é desafiador para um ceder tempo leituras aplicando apenas os protocolos padrão de extração de DNA e métodos de construção de biblioteca fornecido do fabricante. Para este fim, nós desenvolvemos um robusto método para gerar ultra-longa ler (centenas de kilobases) dados de sequenciamento a partir de células colhidos Pelotas. Adotamos várias melhorias nos procedimentos de preparação de extração e biblioteca de DNA. Racionalizámos o protocolo para excluir procedimentos desnecessários que causam danos e degradação do DNA. Este protocolo é composto de alto peso molecular (HMW) extração de DNA, construção de biblioteca de DNA ultra-longa e sequenciamento em uma plataforma de nanopore. Para um biólogo molecular bem treinado, que normalmente demora 6h da célula da colheita para a realização de extração de DNA de HMW, 90 min ou 8 h para construção de biblioteca, dependendo do método de corte e até um mais 48 h para sequenciamento de DNA. O uso do protocolo irá capacitar a Comunidade genômica para melhorar a nossa compreensão da complexidade do genoma e ganhar a introspecção nova variação do genoma em doenças humanas.
Em princípio, sequenciamento de nanopore é capaz de gerar 100 kb para megabase leituras no comprimento11,12,13. Quatro principais fatores afetarão o desempenho de qualidade de dados e executar o sequenciamento: 1) números ativo dos poros e a atividade dos poros; 2) proteína motor, que controla a velocidade do DNA de passagem da nanopore; 3) modelo DNA (comprimento, pureza, qualidade, massa); 4) sequenciamento adaptador ligadura eficiência, que determina o DNA utilizável do exemplo de entrada. Os dois primeiros fatores dependem da versão da célula de fluxo e o kit de sequenciamento, fornecido pelo fabricante. Os segundo dois fatores são passos críticos no presente protocolo (extração de DNA HMW, cisalhamento e ligadura).
Este protocolo requer paciência e prática. A qualidade do DNA HMW é importante para ultra-longa de bibliotecas de DNA6. O protocolo começa com células coletadas com alta viabilidade (> 85% de células viáveis preferida), limitando o DNA degradado de células mortas. Qualquer processo áspero que pode apresentar danos ao DNA (por exemplo, forte perturbando, tremendo, vórtice, múltiplos pipetagem, repetidos congelamento e descongelamento) deve ser evitado. Na concepção do protocolo, omitimos pipetagem em todo o processo de extração de DNA. Dicas de furo grande precisam ser usado quando pipetagem é necessário após o corte mecânico durante a construção da biblioteca e sequenciamento. Como os nanoporos são sensíveis os produtos químicos na câmara reserva12, deveria haver tão poucos contaminantes residuais (por exemplo, os detergentes, surfactantes, fenol, etanol, proteínas, RNAs, etc) quanto possível no DNA. Considerando o comprimento e o rendimento, o método de extração do fenol mostra os resultados melhores e mais reprodutíveis em comparação com vários métodos de extração diferentes testados até agora.
Apesar da capacidade do presente protocolo para produzir sequências de leitura longa, várias limitações ainda permanecem. Em primeiro lugar, este protocolo foi otimizado com base no dispositivo de sequenciamento de nanopore disponível no momento da publicação; assim, é limitado para a química seletiva de sequenciamento baseado em nanopore e pode ser de qualidade inferior quando executadas em outros tipos de dispositivos de sequenciamento de long-leitura. Em segundo lugar, o resultado é altamente dependente da qualidade do DNA extraído de matérias-primas (tecidos ou células). Comprimento de leitura pode ser comprometido se o DNA de partida já está degradado ou danificado. Em terceiro lugar, apesar de várias etapas QC são incorporadas no protocolo para verificar a qualidade do DNA, o rendimento final e comprimento das leituras podem ser afetadas pela célula de fluxo e pore a atividade, que pode ser variável nesta fase inicial da plataforma de sequenciamento de nanopore desenvolvimento.
O protocolo descrito aqui usa amostras de linha de células humanas de suspensão para extração de DNA. Otimizamos os tempos de passagem na agulha de corte, a proporção de DNA HMW transposase e o tempo de ligadura para produzir os resultados descritos. O protocolo pode ser expandido de quatro maneiras. Primeiro, os usuários podem começar com outras culturas de células de mamíferos e com quantidade diferente de células, tecidos, amostras clínicas ou outros organismos. Serão necessários mais otimização no tempo de incubação de Lise, volume de reação e centrifugação. Em segundo lugar, é difícil prever o tamanho de destino para o sequenciamento de leitura ultra-longa. Se os comprimentos de leitura são mais curtos do que o esperado, os usuários podem ajustar os tempos de passagem no método baseado em corte mecânico ou alterar a proporção do DNA HMW para transposase no método baseado na fragmentação transposase. Tempo de ligação e eluição durante as etapas de limpeza são úteis porque o DNA HMW é altamente viscoso. Em terceiro lugar, com nanopore diferentes dispositivos de sequenciamento, um pode ajustar a quantidade e o volume do DNA para satisfazer os critérios de sequenciador. Em quarto lugar, apenas aqueles DNA ligado a adaptadores de sequenciamento vai ser sequenciado. Para melhorar ainda mais a eficiência da ligadura, um pode tentar dosear as concentrações de adaptador e ligase. Tempo de ligadura modificados e moleculares crowding agentes como PEG18 podem ser aplicados no futuro. O protocolo de sequenciamento de DNA ultra-longa combinado com CRISPR19,20 pode oferecer uma ferramenta eficaz para o sequenciamento de enriquecimento do alvo.
The authors have nothing to disclose.
Os autores Y. Zhu agradecer seus comentários sobre o manuscrito. Pesquisa reportada nesta publicação foi parcialmente suportada pelo Instituto Nacional de câncer do institutos nacionais da saúde sob prêmio número P30CA034196. O conteúdo é exclusivamente da responsabilidade dos autores e não representa necessariamente a opinião oficial do institutos nacionais da saúde.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | コメント |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |