Unicellulaire séquençage révèle une hétérogénéité génotypique dans les systèmes biologiques, mais les technologies actuelles n’ont pas le débit nécessaire pour la détermination des caractéristiques profondes de la fonction et la composition de la communauté. Nous décrivons ici un “workflow” microfluidique pour séquençage > 50 000 unicellulaires génomes de diverses populations de cellules.
Technologies de séquençage ont subi un changement de paradigme de vrac à cellule unique résolution faisant suite à une compréhension en évolution du rôle de l’hétérogénéité cellulaire dans les systèmes biologiques. Cependant, monocellulaires séquençage de vastes populations a été entravé par limites dans le traitement des génomes de séquençage. Dans cet article, nous décrivons une méthode de séquençage des génomes unicellulaires (SiC-seq) qui utilise des gouttelettes microfluidique à isoler, amplifier et code à barres des génomes de cellules individuelles. Encapsulation de cellules en microgels permet la purification compartimentée et tagmentation de l’ADN, alors qu’une fusion de microfluidique paires efficacement chaque génome avec un code à barres unique oligonucléotide unicellulaires, permettant à > 50 000 cellules individuelles à séquencer par course. Les données de séquençage sont démultiplexage par code à barres, générer des groupes de lectures provenant de cellules individuelles. Une méthode d’unicellulaires séquençage haut-débit et trop faible, SiC-seq afin de permettre à un plus large éventail d’études génomiques destiné aux populations de diverses cellules.
Le génome sert comme un modèle d’identité cellulaire et fonction, contenant l’intégralité d’un organisme de codification potentiel. Une compréhension de la biologie cellulaire au niveau du génome peut expliquer la diversité phénotypique observée au sein de populations de cellules hétérogènes. Cette hétérogénéité est apparente dans les systèmes biologiques et a de grandes implications pour la santé humaine et la maladie. Par exemple, gène copie numéros écarts entre les cellules tumorales sont liés à l’évolution et la propagation du cancer1,2. Dans les infections bactériennes, îles de pathogénicité présents dans une petite fraction des génomes horizontalement, peuvent être transférés et conduisent à la prolifération des bactéries résistantes aux antibiotiques3,4. Un défi principal dans l’étude des génomes au niveau unicellulaire est les faibles quantités d’ADN disponible, ainsi que la nécessité d’analyser des milliers de cellules à déguster toute la gamme des génotypes. Pour ces raisons, limitations de débit expérimental ont entravé l’efficacité des études unicellulaires, polarisation des résultats vers les cellules plus abondants. Techniques d’isolement de la cellule unique comme flux tri5,6, pinces optiques7, un enfoncement en vrac gels8et9 de la microfluidique sont capables de traiter des centaines de cellules pour le séquençage ; Toutefois, cela représente seulement une petite fraction de la plupart des échantillons. Une méthode pour le séquençage du génome de la cellule unique avec un débit nettement plus élevé permettrait plus profonde et plus complète de profilage de populations cellulaires, ainsi élucider le rôle de la diversité génotypique au sein de ces communautés.
Gouttelette microfluidique permet la manipulation de haut débit de cellules et de réactifs biologiques dans des millions de réacteurs picolitre. À ce jour, les microgouttelettes technologies ont été utilisées pour étudier l’expression différentielle entre les cellules de tissus hétérogènes10,11,12, profondément des séquences longues molécules13,14 ,15et conduite chromatine immunoprécipitation séquençage (ChiP-seq) analyses monocellules16. En effet, les gouttelettes sont capables d’opérations de haut-débit, compartimentées, ce qui les rend propices aux applications en génomique des cellules individuelles. Le développement de cette technologie présente ses propres défis technologiques uniques, cependant. Cellules doivent être lysées, purifiées et amplifiés avec polarisation minimale, à uniformément les populations de cellules échantillon. En outre, contrairement à polyadénylé transcriptions d’ARNm dans les cellules de mammifères, il n’y a aucun motif moléculaire comparable dans le génome pour faciliter la capture de l’acide nucléique cible. Pour ces raisons, le séquençage du génome de cellules individuelles a été difficile à mettre en œuvre dans les plates-formes de microgouttelettes.
Dans ce travail, nous fournissons un protocole détaillé de notre approche rapportées antérieurement unicellulaires microfluidique capable de séquencer les génomes de dizaines de milliers de cellules dans une seule expérience17. Avec cette technologie, appelée CTI-seq, cellules bactériennes sont encapsulés dans échelle micron hydrogels et individuellement lysées, tagmented et a fusionné avec un microdroplet contenant un code-barres unique oligonucléotide, qui est raccordé sur l’ADN génomique de la cellule via une chevauchement unique extension chaîne par polymérase (PCR). Les hydrogels servent de conteneurs isolés où l’ADN génomique de high-molecular-weight est stériquement enfermé, permettant à des molécules plus petites comme les détergents et enzymes lytiques d’accéder et de purifier l’ADN avant barcoding18. Ce protocole traite > 50 000 cellules uniques en quelques heures, ce qui entraîne une bibliothèque avec code à barres prête pour le séquençage. Après le séquençage, les lectures sont demultiplexed selon leur séquence de barcode unicellulaires, résultant en un ensemble de données composé de millions de lectures, chacun avec un indice de cellulaire.
Le flux de travail microfluidique SiC-seq produit les données de séquençage du génome de la cellule unique parmi des milliers de cellules bactériennes. Codes à barres numériques épissés sur les génomes de cellules encapsulées microgel permettant la déconvolution de silico des données d’end en groupes de lectures avec code à barres, provenant de la même cellule. Une expérience de contrôle avec une communauté microbienne de composition connue, est nécessaire pour évaluer la pureté des groupes de codes à barres. Une grande partie des groupes de faible pureté indique que le taux d’encapsulation de cellules est trop élevé ou qu’il y a contamination croisée important gouttelette se produisant durant les étapes de traitement de la microfluidique. Selon les statistiques de Poisson, les codes-barres et les cellules doivent être isolés à un ratio de 1 particule pour chaque 10 gouttes à limiter le taux de plusieurs événements d’encapsulation à moins de 5 % de toutes les gouttelettes non vide. Un taux d’encapsulation au-dessus de celle-ci augmente les tarifs des doublets exponentiellement, donc la vérification du ratio encapsulation au cours du processus de dropmaking est d’une importance cruciale. Les utilisateurs doivent être particulièrement prudents de l’encapsulation des cellules multiples en un seul microgel parce que les lectures de différentes cellules partage la même séquence de code à barres ne peut pas être séparé de bioinformatically. Dans le cas que 1 cellule reçoit 2 différents codes à barres, la pureté de groupe de codes à barres n’est pas affectée même si les mesures d’abondance sont étalent lors du comptage par séquence de codes à barres.
Contamination croisée gouttelettes peut-être également survenir en raison des conditions sous-optimales fusion. Lors d’une opération réussie, le dispositif de fusion de microfluidique (Figure 5) pouvez contrôlable coupler 1 gouttelette de codes à barres avec 1 microgel et un volume de réactif PCR. Non-idéal débits seront traduira par une goutte d’appariement des ratios incorrect : 1 code à barres peut être couplé avec 2 microgels, par exemple. Tous les débits indiqués dans le protocole sont censés être des estimations et peuvent devoir être ajustée selon les légères variations dans les tailles de géométrie et de gouttelettes de dispositif. Les utilisateurs ayant accès aux caméras avec des capacités d’enregistrement à grande vitesse (> 10 000 images/s) devraient vérifier la fusion de gouttelettes correcte au début et au cours de l’opération de la microfluidique. Les utilisateurs n’ont pas accès à une caméra haute vitesse peuvent recueillir un petit volume de la sortie fusionnée et mesurer manuellement la taille des gouttelettes sous un microscope. La taille des gouttelettes devrait être uniforme : un excès de code à barres non fusionné ou gouttes microgel indique que le taux de réinjection devrait être réduite en conséquence.
Plusieurs générales devraient prendre les précautions nécessaires lors de la manipulation microgels et projetées à préserver leur intégrité. MICROGELS, bien que mécaniquement robuste, il faut refroidir suffisamment avant la rupture et mesures pour s’assurer de gélification complete de lavage. Microgels non-spherical sont une indication que l’agarose n’était pas donné suffisamment de temps pour se solidifier. Lors du lavage microgels, tournez les suspensions en bas à la vitesse nécessaire pour éviter une perte de produit. D’agarose hydrogel a un indice de réfraction correspondant étroitement à celle de l’eau et peut-être être difficile à voir dans un tube22, donc les utilisateurs doivent bien identifier la limite gel-liquide avant l’aspiration. Gouttelettes d’eau dans l’huile sont sensibles à la coalescence de l’accumulation des forces statiques23 sur les tubes et les gants de laboratoire. Pour cette raison, nous vous recommandons de charger les seringues de réinjection de gouttelette à mains nues et de traiter toutes les lignes de réinjection avec un pistolet antistatique avant l’amorçage de la pompe. Grosses gouttelettes coalescentes peuvent être supprimées en tournant lentement les émulsions dans une seringue et en aspirant manuellement les gouttes plus grandes, qui s’accumulent près du sommet en raison de leur plus grande force de flottabilité.
SiC-seq est la première technologie de démontrer le séquençage du génome de cellules individuelles de > 50 000 cellules bactériennes. Cette plate-forme offre des avantages significatifs en matière de rapport aux approches existantes et permet un échantillonnage plus profond des communautés microbiennes hétérogènes. A ce jour, technologies microfluidiques pour le séquençage du génome de cellules individuelles ont employé microchambers micropuits et9 24 pour l’amplification et l’isolement cellulaire, mais avec des débits de l’ordre de seulement quelques dizaines à des centaines de cellules. Le flux tri des cellules uniques en wellplates5,6 ne nécessite aucune instrumentation de microfluidique spécialisés mais possède un débit de même faible. Étant donné que les échantillons de sol et l’eau de l’environnement ont généralement des diversités alpha de > 1 000 espèces de niveau25,26, SiC-seq est très avantageux en raison de sa capacité à déguster un bien plus grand nombre d’organismes. Le workflow de SiC-seq est adaptable aux entrées des cellules de culture en laboratoire, l’environnement naturel ou un hôte vivant. Un échantillon cellulaire doivent seulement être dans une suspension aqueuse et gratuits de grosses particules (> 10 µm) sont adaptés pour l’encapsulation de la microfluidique. Par exemple, la méthode a été appliquée auparavant à un échantillon d’eau de mer à l’aide d’une série de lavage et de filtrage des étapes pour pré-traiter les cellules avant encapsulation17.
Le protocole de SiC-seq génère une quantité relativement clairsemée de données de séquençage de chaque cellule unique et peut ne pas convenir pour toutes les applications. Certains algorithmes de bioinformatique comme assemblage de génome de novo ou variante de nucléotide (SNV) appelant nécessitent des profondeurs de couverture supérieurs à travailler efficacement. Au lieu de cela, des groupes de codes à barres peuvent être ordonné en clusters en silico par taxonomique binning méthodes27 afin que les algorithmes peuvent être appliqués sur les plus grands ensembles de lectures. L’efficacité de codage à barres globale relativement faible du workflow SiC-seq peut également présenter des défis dans les cas où la disponibilité de l’échantillon d’entrée est faible. SiC-seq s’appuie sur une étape d’encapsulation de barcode Poisson-distribué, donc environ 10 % des cellules reçoivent un code-barres moléculaire et sont amplifiés au cours de l’étape de préparation finale de bibliothèque. Tout cela est comparable aux autres régimes de barcoding axée sur les microgouttelettes10, utilisateurs qui travaillent avec des échantillons cellulaires précieux peuvent avoir des difficultés à atteindre le rendement de la bibliothèque adéquate pour le séquençage et devrez peut-être augmenter le nombre de cycles de la PCR en finale étape d’amplification. Une autre solution possible pour les utilisateurs connaissant bien microfluidique est de trier les gouttelettes de barcode positif après l’étape PCR numérique, ce qui porte l’efficacité globale des codes à barres à > 85 %28.
Une orientation future potentielle pour SiC-seq technologie s’adaptant le flux de travail pour une utilisation avec des cellules de mammifères, ouvrant la voie à nouvelles études cliniques de cellule unique. À titre d’exemple, une analyse de la variation numéro de copie entre cancer de simple cellules mai plus loin notre compréhension du rôle de l’hétérogénéité du cancer pathologie2. Alternativement, intégrant les méthodes existantes pour sonder et enrichir les séquences d’ADN d’intérêt29 de SiC-seq permettrait le séquençage unicellulaires ciblé des sous-populations ou rares souches de cellules. Avec des échantillons environnementaux, gènes de dans une voie métabolique connue pourraient être ciblés et analysés contextuellement aux côtés de voisins gènes afin d’identifier de nouveaux îlots génomiques. De dans un environnement hôte humain, des échantillons de bactéries pathogènes bas-titre a peuvent être isolés et séquencé au niveau cellule unique d’examiner de plus près leurs origines génotypiques de la virulence.
The authors have nothing to disclose.
Ce travail a été soutenu par la National Science Foundation grâce à une bourse de carrière (numéro de licence DBI-1253293) ; le National Institutes of Health (NIH) (subvention nombres HG007233-01, R01-EB019453-01, 1R21HG007233, DP2-AR068129-01, le R01-HG008978) ; et le Defense Advanced Research projets Agence vivant fonderies Program (numéros de contrat HR0011-12-C-0065, N66001-12-C-4211, HR0011-12-C-0066).
3" silicon wafers, P type, virgin test grade | University Wafers | 447 | |
SU-8 3025 photoresist | Microchem | 17030192 | |
Spin coater | Specialty Coating Systems | G3P-8 | |
Photomasks | CadArt Servcies | (custom) | See Supplemental Files for mask designs |
PGMEA developer | Sigma-Aldrich | 484431 | |
Isopropanol | Sigma-Aldrich | 109827 | |
Sylgard 184 silicone elastomer kit | Krayden | 4019862 | |
Degassing chamber | Bel-Art | 42025 | |
0.75 mm biopsy punch | World Precision Instruments | 504529 | |
Glass microscope slides (75 mm x 50 mm) | Corning | 294775X50 | |
Aquapel (hydrophobic glass treatment) | Pittsburgh Glass Works | 47100 | |
PE-2 polyethylene tubing | Scientific Commodities | B31695-PE/2 | |
1 mL syringes | BD | 309628 | |
27 gauge needles | BD | 305109 | |
Syringe pump | New Era Pump Systems | NE-501 | |
Novec HFE-7500 fluorinated oil (HFE) | 3M | 98-0212-2928-5 | |
FC-40 fluorinated oil | Sigma-Aldrich | F9755 | |
PEG-PFPE surfactant | Ran Biotechnologies | 008-FluoroSurfactant | |
Space heater | Lasko | CD09250 | |
Agarose, low gelling temperature | Sigma-Aldrich | a9414 | |
TE (10X) | Rockland | mb-007 | |
PBS 1X, pH 7.4 | E&K Scientific Products | EK-65083 | |
OptiPrep (density gradient medium) | Sigma-Aldrich | d1556 | |
1H,1H,2H-Perfluoro-1-Octanol (PFO) | Sigma-Aldrich | 370533 | |
Span 80 (sorbitane monooleate) | Sigma-Aldrich | s6760 | |
Hexane | Sigma-Aldrich | 139386 | |
Tween 20 (polysorbate 20) | Sigma-Aldrich | p2287 | |
Lysozyme Type IV | MP Biomedicals | 195303 | |
Mutanolysin | Sigma-Aldrich | M9901 | |
Zymolyase (yeast lytic enzyme) | Zymo Research | e1004 | |
Lysostaphin | Sigma-Aldrich | L7386 | |
Sodium chloride | Sigma-Aldrich | S9888 | |
EDTA | Sigma-Aldrich | E6758 | |
Tris-HCl, pH 7.5, 1M | Invitrogen | 15567-027 | |
Dithiothreitol (DTT) | Teknova | d9750 | |
Lithium dodecyl sulfate | Sigma-Aldrich | L9781 | |
Proteinase K | New England Biosciences | P8107S | |
Ethanol, 200 Proof (100%) | Koptec | V1001 | |
SYBR Green I (nucleic acid stain) | Invitrogen | S7563 | |
PEG 6k | Sigma-Aldrich | 81260 | |
Triton X-100 (octylphenol ethoxylate) | Sigma-Aldrich | t8787 | |
Nextera DNA Library Prep Kit | Illumina | FC-121-1030 | |
Phusion Hot Start Flex Master Mix (High-Fidelity Hot Start Master Mix) | New England Biosciences | m05365 | |
Platinum Multiplex PCR Master Mix (Taq Master Mix) | Applied Biosystems | 4464263 | |
Warmstart 2.0 Bst Polymerase (isothermal polymerase) | New England Biosciences | m0538m | |
NT buffer from Nextera XT kit (neutralization buffer) | Illumina | FC-131-1024 | |
Cold cathode fluorescent inverter | (custom) | (custom) | |
DC power supply | Mastech | HY1503D | |
Zerostat 3 anti-static gun | Milty | 5036694022153 | |
3D-printed centrifuge syringe holder | (custom) | (custom) | See Supplemental Files for 3D print file |
Zymo DNA Clean & Concentrator-5 | Zymo Research | D4003 |