Sola célula secuencia revela heterogeneidad genotípica en los sistemas biológicos, pero las tecnologías actuales carecen de la capacidad necesaria para el perfilado profundo de la función y composición de la comunidad. Aquí, describimos un flujo de trabajo de microfluidos para la secuencia > 50.000 genomas unicelulares de diversas poblaciones de la célula.
Tecnologías de secuenciación han experimentado un cambio de paradigma de bulto a la resolución sola célula en respuesta a una comprensión de la evolución del papel de la heterogeneidad celular en los sistemas biológicos. Sin embargo, unicelular secuenciación de grandes poblaciones se ha visto obstaculizado por limitaciones en el procesamiento de genomas para la secuencia. En este papel, describimos un método de secuenciación del genoma de unicelular (SiC-seq) que utiliza gotas de microfluídica para aislar, amplificar y código de barras los genomas de las células. Encapsulación de la célula en microgels permite la purificación compartimentado y tagmentation de la DNA, mientras que una fusión de microfluidos pares eficientemente cada genoma con un código de barras único oligonucleótido unicelular que permite > 50.000 células individuales a ser ordenados por ejecutar. Los datos de secuenciación se demultiplexan por código de barras, generación de grupos de Lee origina de las células. Como método de alto rendimiento y bajo sesgo de secuencia unicelular, SiC-seq permitirá una gama más amplia de estudios genómicos dirigidos a poblaciones de células diferentes.
El genoma sirve como un modelo de identidad celular y función, que contiene la totalidad de un organismo del potencial de codificación. Una comprensión de la biología celular a nivel de genoma puede explicar la diversidad fenotípica observada en poblaciones celulares heterogéneas. Esta heterogeneidad es evidente en los sistemas biológicos y tiene amplias implicaciones para la salud y la enfermedad. Por ejemplo, las variaciones número de la copia del gene entre las células del tumor están ligadas a la evolución y propagación de cáncer1,2. Infecciones bacterianas, Islas de patogenicidad presentes en una pequeña fracción de los genomas pueden ser transferidas horizontalmente y conducen a la proliferación de bacterias antibiotic-resistant3,4. Un desafío principal en el estudio de genomas a nivel unicelular es la baja cantidad de ADN disponible, así como la necesidad de analizar miles de células a la muestra la completa diversidad de genotipos. Por estas razones, limitaciones en el rendimiento experimental han obstaculizado la efectividad de los estudios de unicelulares, sesgar los resultados hacia las células más abundantes. Técnicas de aislamiento de células individuales como flujo clasificación5,6, pinza óptica7, empotramiento en a granel geles8y microfluídica9 son capaces de procesar cientos de células para secuenciación; sin embargo, esto representa sólo una pequeña fracción de la mayoría de las muestras. Un método de secuenciación del genoma de unicelular con rendimiento de procesamiento substancialmente más alta permitiría más profunda y más completa de perfiles de poblaciones celulares, así dilucidar el papel de la diversidad genotípica dentro de estas comunidades.
Microfluídica de gotas permite la manipulación de alto rendimiento de las células y reactivos biológicos dentro de millones de reactores picolitros-escala. Hasta la fecha, microdroplet tecnologías se han utilizado para estudiar patrones de expresión diferencial entre las células de los tejidos heterogéneos10,11,12, profundamente la secuencia de moléculas largas13,14 ,15y análisis de secuencia (ChiP-seq) de inmunoprecipitación conducta cromatina de las células16. De hecho, microgotas son capaces de operaciones de alto rendimiento, compartimentadas, haciéndolos susceptibles a aplicaciones en genómica unicelular. El desarrollo de esta tecnología presenta sus propios retos tecnológicos, sin embargo. Células deben lisis, purificadas y amplificadas con sesgo mínimo, uniformemente las poblaciones celulares de muestra. Además, a diferencia de cofia transcripciones del mRNA en células de mamíferos, no existe motivo molecular comparable en el genoma para facilitar la captura del ácido nucleico Diana. Por estas razones, secuenciación del genoma de la célula de solo ha sido difícil de implementar en plataformas microdroplet.
En este trabajo, proporcionamos un protocolo detallado de nuestro enfoque previamente divulgados microfluídicos unicelular capaz de secuenciar los genomas de decenas de miles de células en un solo experimento17. Con esta tecnología, llamada SiC-seq, las células bacterianas son encapsuladas en microescala hidrogeles individualmente lisis, tagmented y se fusionó con un microdroplet que contiene un código de barras único oligonucleótido, que se empalma en el ADN genómico de la célula a través de un superposición única extensión reacción en cadena de polimerasa (PCR). Los hidrogeles sirven como contenedores aislados en los que DNA genómico de alto peso molecular sterically se encajona, permitiendo que las moléculas más pequeñas tales como detergentes y enzimas líticas para acceder y purificar el ADN antes de código de barras18. Este protocolo de procesos > 50.000 células en cuestión de horas, lo que resulta en una biblioteca de código de barras para la secuencia. Tras la secuencia, las lecturas son demultiplexed según su secuencia de barras unicelular, resultando en un conjunto de datos conformada por millones de lecturas, cada una con un índice de celular.
El flujo de trabajo de SiC-seq microfluídicos produce sola célula genoma secuencia datos de miles de células bacterianas. Códigos de barras digitales empalmados en los genomas de las células encapsuladas de microgel permiten la deconvolución en silico de datos NGS en grupos de código de barras Lee originarios de la misma célula. Un experimento de control con una comunidad microbiana de composición conocida es necesario para evaluar la pureza de los grupos de código de barras. Una gran parte de los grupos de baja pureza indica que la tasa de encapsulación de la célula es demasiado alto o que hay gota significativa la contaminación cruzada que ocurre durante las etapas de procesamiento de microfluidos. Según las estadísticas de Poisson, las células y códigos de barras deben ser encapsuladas en una proporción de blanco de 1 partícula por 10 gotas limitar la tasa de múltiples eventos de encapsulación a menos del 5% de todas las gotas no vacío. Una mayor tasa de encapsulación aumenta las tasas de Dobletes exponencialmente, por lo que la verificación de la relación de encapsulación durante el proceso de dropmaking es de importancia crítica. Los usuarios deben ser particularmente cautelosos de la encapsulación de varias celdas en una sola microgel ya lee de diversas células que comparten la misma secuencia de código de barras no puede ser bioinformatically separado. En el caso de 1 célula recibe 2 códigos de barras diferentes, la pureza del grupo de código de barras no se ve afectada aunque los parámetros de la abundancia están sesgados cuando cuenta la secuencia de código de barras.
Gota la contaminación cruzada también puede presentarse debido a las condiciones de fusión subóptima. Durante una operación de éxito, el dispositivo de fusión de microfluidos (figura 5) puede controllably par 1 gotita de código de barras con 1 microgel y un volumen de reactivo PCR. Las tasas de flujo no ideal se traducirá en una gota de emparejamiento en proporciones incorrectas: 1 código de barras puede combinarse con 2 microgels, por ejemplo. Todas las tarifas de flujo enumeradas en el protocolo pretenden ser las estimaciones y pueden necesitar ser ajustado según pequeñas variaciones en los tamaños de geometría y gotita de dispositivo. Los usuarios con acceso a cámaras con capacidad de grabación de alta velocidad (> 10.000 frames/s) deben verificar la fusión correcta gota al principio y en el transcurso de la operación de microfluidos. Los usuarios sin acceso a una cámara de alta velocidad pueden recoger un pequeño volumen de la salida fusionada y medir manualmente los tamaños de gota bajo el microscopio. El tamaño de las gotas debe ser uniforme: un exceso de códigos de barras sin combinar o microgel gotas indica que las tarifas de reinyección deben reducirse en consecuencia.
Varios general Precauciones al manejar microgels y microgotas para preservar su integridad. Microgels, aunque mecánicamente robusto, debe ser suficientemente refrigerado por antes de la ruptura y lavado pasos para asegurar la completa gelificación. Microgels no-esféricas son una indicación que la agarosa no se da suficiente tiempo para solidificar. Lavado microgels, desactivación las suspensiones a la velocidad requerida para evitar una pérdida de producto. Hidrogel de agarosa tiene un índice de refracción cerca que la del agua y puede ser difícil de ver en un tubo22, así que los usuarios deben identificar cuidadosamente el límite de gel líquido antes de la aspiración. Gotas de agua en aceite son susceptibles a la fusión por la acumulación de fuerzas estáticas23 laboratorio guantes y tubería. Por esta razón, se recomiendan cargar las jeringas de reinyección de gotitas con las manos desnudas y el tratamiento de todas las líneas de reinyección con una pistola antiestática antes de cebado de la bomba. Gotas grandes coaligadas pueden eliminarse lentamente girando las emulsiones en una jeringa y aspirar manualmente las gotas más grandes, que se acumulan en la parte superior debido a su mayor fuerza boyante.
SiC-seq es la primera tecnología para demostrar la secuenciación del genoma de unicelular de > 50.000 células bacterianas. Esta plataforma ofrece ventajas significativas en el rendimiento sobre los enfoques existentes y permite un muestreo más profundo de las comunidades microbianas heterogéneas. Hasta la fecha, tecnologías de microfluidos para la secuenciación del genoma de la célula solo han empleado microchambers micropocillos y9 24 para aislamiento de células y la amplificación, pero con rendimientos en el rango de sólo decenas a cientos de células. La clasificación del flujo de las células en wellplates5,6 no requiere ninguna instrumentación especializada microfluídicos pero posee un rendimiento igualmente bajo. Dado que las muestras de suelo y agua del ambiente comúnmente tienen las diversidades alfa de > 1.000 en las especies de nivel25,26, SiC-seq es altamente ventajosa en virtud de su capacidad para un número mucho mayor de organismos de la muestra. El flujo de trabajo de SiC-seq es adaptable a las entradas de celda de laboratorio cultura, el medio ambiente natural o un anfitrión vivo. Una muestra de células hay que estar en una suspensión acuosa y libre de partículas grandes (> 10 μm) adecuada para la encapsulación de microfluidos. Por ejemplo, el método se ha aplicado previamente a una muestra de agua de mar utilizando una serie de lavado y filtrado de pasos para el procesamiento previo de las células antes de la encapsulación17.
El protocolo de SiC-seq genera una cantidad relativamente escasa de los datos de la secuencia de cada célula individual y puede no ser adecuado para todas las aplicaciones. Algunos algoritmos de Bioinformática como Asamblea de genoma de novo o variante de un solo nucleótido (SNV) que requieren profundidades de cobertura más alto para trabajar con eficacia. En cambio, grupos de código de barras pueden ser agrupado en silico por binning taxonomía de métodos27 para que los algoritmos pueden ser aplicados en grandes conjuntos de lecturas. La relativamente baja eficiencia de código de barras general del flujo de trabajo SiC-seq también puede presentar retos en casos donde la disponibilidad de la muestra de entrada es baja. SiC-seq se basa en un paso de la encapsulación de código de barras de distribución de Poisson, por lo tanto, aproximadamente el 10% de las células recibe un código de barras molecular y se amplifican durante la etapa de preparación final de la biblioteca. Mientras que esto es comparable a otros planes microdroplet basado en código de barras del10, los usuarios que trabajan con muestras de células preciosas pueden tener dificultad para lograr el rendimiento adecuado de la biblioteca para la secuencia y pueden necesitar aumentar el número de ciclos PCR en la final etapa de AMPLIFICACION. Otra posible solución para usuarios con conocimientos de microfluidos es ordenar gotas de código de barras positivas después del paso PCR digital, así que la eficacia total de código de barras > 85%28.
Una potencial futura dirección para la tecnología SiC-seq es adaptar el flujo de trabajo para el uso con las células mamíferas, allanando el camino para nuevos estudios clínicos de unicelulares. Por ejemplo, un análisis de la variación del número de copia entre cáncer solo células mayo mejorar nuestra comprensión del papel de la heterogeneidad en la patología de cáncer2. Por otra parte, integrar SiC-seq con métodos existentes para probar y enriquecer secuencias de ADN de interés29 permitiría la secuenciación específica de unicelular de subpoblaciones o raras cepas de células. Con muestras ambientales, genes de dentro de un camino metabólico conocido podrían dirigidos y analizados contextualmente junto a vecinos de genes para identificar novela islas genómicas. Desde dentro de un ambiente del anfitrión humano, muestras de bacterias patógenas bajo título podrían ser aisladas y secuenciaron en el nivel unicelular para examinar más de cerca sus orígenes genotípicos de virulencia.
The authors have nothing to disclose.
Este trabajo fue financiado por la National Science Foundation a través de un premio de carrera (número DBI-1253293); los institutos nacionales de salud (NIH) (grant números HG007233-01, 01-EB019453-R01, 1R21HG007233, DP2-AR068129-01, R01-HG008978); y la defensa avanzada investigación proyectos Agencia fundiciones programa de vida (número de contrato HR0011-12-C-0065, N66001-12-C-4211, HR0011-12-C-0066).
3" silicon wafers, P type, virgin test grade | University Wafers | 447 | |
SU-8 3025 photoresist | Microchem | 17030192 | |
Spin coater | Specialty Coating Systems | G3P-8 | |
Photomasks | CadArt Servcies | (custom) | See Supplemental Files for mask designs |
PGMEA developer | Sigma-Aldrich | 484431 | |
Isopropanol | Sigma-Aldrich | 109827 | |
Sylgard 184 silicone elastomer kit | Krayden | 4019862 | |
Degassing chamber | Bel-Art | 42025 | |
0.75 mm biopsy punch | World Precision Instruments | 504529 | |
Glass microscope slides (75 mm x 50 mm) | Corning | 294775X50 | |
Aquapel (hydrophobic glass treatment) | Pittsburgh Glass Works | 47100 | |
PE-2 polyethylene tubing | Scientific Commodities | B31695-PE/2 | |
1 mL syringes | BD | 309628 | |
27 gauge needles | BD | 305109 | |
Syringe pump | New Era Pump Systems | NE-501 | |
Novec HFE-7500 fluorinated oil (HFE) | 3M | 98-0212-2928-5 | |
FC-40 fluorinated oil | Sigma-Aldrich | F9755 | |
PEG-PFPE surfactant | Ran Biotechnologies | 008-FluoroSurfactant | |
Space heater | Lasko | CD09250 | |
Agarose, low gelling temperature | Sigma-Aldrich | a9414 | |
TE (10X) | Rockland | mb-007 | |
PBS 1X, pH 7.4 | E&K Scientific Products | EK-65083 | |
OptiPrep (density gradient medium) | Sigma-Aldrich | d1556 | |
1H,1H,2H-Perfluoro-1-Octanol (PFO) | Sigma-Aldrich | 370533 | |
Span 80 (sorbitane monooleate) | Sigma-Aldrich | s6760 | |
Hexane | Sigma-Aldrich | 139386 | |
Tween 20 (polysorbate 20) | Sigma-Aldrich | p2287 | |
Lysozyme Type IV | MP Biomedicals | 195303 | |
Mutanolysin | Sigma-Aldrich | M9901 | |
Zymolyase (yeast lytic enzyme) | Zymo Research | e1004 | |
Lysostaphin | Sigma-Aldrich | L7386 | |
Sodium chloride | Sigma-Aldrich | S9888 | |
EDTA | Sigma-Aldrich | E6758 | |
Tris-HCl, pH 7.5, 1M | Invitrogen | 15567-027 | |
Dithiothreitol (DTT) | Teknova | d9750 | |
Lithium dodecyl sulfate | Sigma-Aldrich | L9781 | |
Proteinase K | New England Biosciences | P8107S | |
Ethanol, 200 Proof (100%) | Koptec | V1001 | |
SYBR Green I (nucleic acid stain) | Invitrogen | S7563 | |
PEG 6k | Sigma-Aldrich | 81260 | |
Triton X-100 (octylphenol ethoxylate) | Sigma-Aldrich | t8787 | |
Nextera DNA Library Prep Kit | Illumina | FC-121-1030 | |
Phusion Hot Start Flex Master Mix (High-Fidelity Hot Start Master Mix) | New England Biosciences | m05365 | |
Platinum Multiplex PCR Master Mix (Taq Master Mix) | Applied Biosystems | 4464263 | |
Warmstart 2.0 Bst Polymerase (isothermal polymerase) | New England Biosciences | m0538m | |
NT buffer from Nextera XT kit (neutralization buffer) | Illumina | FC-131-1024 | |
Cold cathode fluorescent inverter | (custom) | (custom) | |
DC power supply | Mastech | HY1503D | |
Zerostat 3 anti-static gun | Milty | 5036694022153 | |
3D-printed centrifuge syringe holder | (custom) | (custom) | See Supplemental Files for 3D print file |
Zymo DNA Clean & Concentrator-5 | Zymo Research | D4003 |