Eencellige sequencing blijkt genotypische heterogeniteit in biologische systemen, maar de huidige technologieën ontbreken de doorvoer die nodig zijn voor de diepe profilering van communautaire samenstelling en functie. Hier beschrijven we een microfluidic workflow voor het rangschikken > 50.000 eencellige genomen uit verschillende cel populaties.
Sequencing technologieën hebben ondergaan een paradigmaverschuiving van bulk naar eencellige resolutie naar aanleiding van een evoluerend begrip van de rol van cellulaire heterogeniteit in biologische systemen. Eencellige sequentiebepaling van grote populaties heeft echter belemmerd door beperkingen in verwerkt genoom voor het rangschikken. In deze paper beschrijven we een methode voor eencellige genoom sequencing (SiC-seq), die gebruik maakt van druppel microfluidics te isoleren, te versterken en barcode het genoom van afzonderlijke cellen. Cel inkapseling in microgels staat de verzuilde zuivering en de tagmentation van DNA, terwijl een fusie microfluidic efficiënt elke genoom met een unieke eencellige oligonucleotide barcode paren, waardoor > 50.000 afzonderlijke cellen te worden sequenced per run. De gegevens rangschikken is door barcode, genereren van groepen die afkomstig zijn van afzonderlijke cellen leest demultiplexed. Als een hoge-doorvoer en lage-bias methode van eencellige sequencing kunnen SiC-seq een breder scala van genomic studies gericht op verschillende cel populaties.
Het genoom dient als een blauwdruk van cellulaire identiteit en functie, met het geheel van een organisme is potentieel codering. Een goed begrip van cellulaire biologie op het niveau van het genoom kan verklaren de waargenomen fenotypische verscheidenheid binnen heterogene cel populaties. Deze heterogeniteit is herkenbaar in biologische systemen en heeft brede implicaties voor de menselijke gezondheid en ziekte. Bijvoorbeeld, zijn exemplaar nummer variaties van het gen onder tumorcellen gekoppeld aan de evolutie en de verspreiding van kanker1,2. In bacteriële infecties, pathogeniteit eilanden aanwezig zijn in een klein deel van het genoom horizontaal kunnen worden overgedragen en leiden tot de verspreiding van antibiotica-resistente bacteriën3,4. Een primaire uitdaging in het genoom eencellige niveau studeren is de lage hoeveelheden DNA beschikbaar, evenals de noodzaak om te analyseren van duizenden cellen om te proeven van de volledige diversiteit van genotypen. Om deze redenen hebben beperkingen in experimentele doorvoer belemmerd de effectiviteit van eencellige studies, vertekenende resultaten naar de meest voorkomende cellen. Eencellige isolatie technieken zoals stroom sorteren5,6, optisch pincet7, verankering in bulk gels8, en microfluidics9 oplossingen kunnen verwerken van honderden cellen voor het rangschikken; Dit is echter slechts een klein deel van de meeste monsters. Een methode voor eencellige genoom sequencing met aanzienlijk hogere doorvoer zou dieper en meer volledig profilering van cel populaties, waardoor het ophelderen van de rol van de genotypische verscheidenheid binnen deze Gemeenschappen.
Druppel microfluidics kunt de manipulatie van de high-throughput van cellen en biologische reagentia binnen miljoenen picoliter-schaal reactoren. Tot op heden, microdroplet technologieën zijn gebruikt voor het bestuderen van differentiële expressiepatronen onder cellen van heterogene weefsels10,11,12, diep volgnummer lange moleculen13,14 ,15, en gedrag chromatine immunoprecipitation sequencing (ChiP-seq) analyses over de afzonderlijke cellen16. Inderdaad, microdruppels zijn geschikt voor high-throughput, verzuilde operaties, waardoor ze zich lenen voor toepassingen in de eencellige genomica. De ontwikkeling van deze technologie presenteert haar eigen unieke technologische uitdagingen, echter. Cellen moeten worden lysed, gezuiverd en versterkt met minimale bias, uniform monster cel populaties. Bovendien, in tegenstelling tot polyadenylated mRNA afschriften in zoogdiercellen is er geen vergelijkbare moleculaire motief in het genoom ter vergemakkelijking van de opname van het doel nucleic zuur. Eencellige genoom sequencing is al deze redenen moeilijk uit te voeren in microdroplet platformen.
In dit werk bieden wij een gedetailleerd protocol van onze eerder gemelde eencellige microfluidic aanpak staat rangschikkend het genoom van tientallen duizenden van cellen in een enkele experiment17. Met deze technologie, genaamd SiC-seq, bacteriële cellen zijn ingekapseld in micron-schaal hydrogels individueel lysed, tagmented, en samengevoegd met een microdroplet met een unieke oligonucleotide barcode, die is verbinding aan de randen aan de genomic DNA van de cel via een één overlapping extensie polymerase-kettingreactie (PCR). De hydrogels dienen als geïsoleerde containers waarin hoog-moleculair-gewicht genomic DNA is sterically ingekapseld, waardoor kleinere moleculen zoals detergenten en lytische enzymen te openen en te zuiveren van DNA vóór barcoding18. Dit protocol verwerkt > 50.000 afzonderlijke cellen in een kwestie van uren, wat resulteert in een barcoded bibliotheek klaar voor het rangschikken. Na de sequencing zijn de leest demultiplexed volgens hun eencellige barcode volgorde, wat resulteert in een dataset bestaat uit miljoenen leest, elk met een cellulaire index.
De SiC-seq microfluidic workflow produceert eencellige genoom sequencing gegevens uit duizenden bacteriecellen. Digitale barcodes verbinding aan de randen op het genoom van microgel-ingekapseld cellen toestaan voor de deconvolutie in silico NGS gegevens in groepen van barcoded luidt die afkomstig zijn uit dezelfde cel. Een controle-experiment met een microbiële Gemeenschap van waarvan de samenstelling bekend is noodzakelijk voor de evaluatie van de zuiverheid van de barcode-groepen. Een groot deel van de laag-zuiverheid groepen geeft aan dat de cel inkapseling tarief te hoog is of dat er belangrijke druppel kruisbesmetting optreedt tijdens de verwerking van de microfluidic stappen. Volgens de statistieken van de Poisson, moeten de barcodes en cellen worden ingekapseld met een doel-verhouding van 1 deeltje voor elke 10 druppels te beperken van het aantal meerdere inkapseling gebeurtenissen tot minder dan 5% van alle niet-lege druppels. Een inkapseling tarief hoger is dan dit verhoogt de tarieven van paren exponentieel, zodat de verificatie van de inkapseling verhouding tijdens het dropmaking van cruciaal belang is. Gebruikers moeten bijzonder voorzichtig zijn van de inkapseling van meerdere cellen in een enkele microgel omdat leest uit verschillende cellen delen dezelfde barcode volgorde kunnen niet bioinformatically gescheiden worden. In het geval dat 1 cel ontvangt 2 verschillende barcodes, de barcode groep zuiverheid wordt beïnvloed, hoewel de overvloed statistieken zijn scheef wanneer tellen door barcode opeenvolging.
Druppel kruisbesmetting kan ook ontstaan als gevolg van suboptimaal fusie voorwaarden. Tijdens een succesvolle operatie, kan het apparaat fusie microfluidic (Figuur 5) controllably koppel 1 druppel van de barcode met 1 microgel en een volume van PCR reagens. Niet-ideale debiet zal resulteren in een droplet koppeling op onjuiste verhoudingen: 1 barcode kan worden gecombineerd met 2 microgels, bijvoorbeeld. Alle stroomsnelheid vermeld in het protocol zijn bedoeld om te worden schattingen en moet mogelijk worden aangepast afhankelijk van lichte variaties in het apparaat geometrie en druppel maten. Gebruikers met toegang tot camera’s met snelle opnamemogelijkheden (> 10.000 frames/s) moet controleren of de juiste druppel fusie aan het begin en in de loop van de microfluidic werking. Gebruikers zonder toegang tot een high-speed camera kunnen verzamelen van een klein volume van de samengevoegde output en handmatig de grootte van de druppel onder een microscoop te meten. De grootte van de druppel moeten uniform: een teveel aan niet-samengevoegde barcodes of microgel druppels geeft aan dat de tarieven voor herinjectie dienovereenkomstig moeten worden verminderd.
Enkele algemene voorzorgen moeten worden genomen bij de behandeling van microgels en microdruppels om hun integriteit te behouden. Microgels, moeten hoewel mechanisch robuust, worden voldoende afgekoeld voordat het breken en wassen stappen om ervoor te zorgen volledige gelering. Niet-bolvormige microgels zijn een indicatie dat de agarose niet was voldoende tijd krijgen om te stollen. Bij het wassen van microgels, draaien de schorsingen neer op de vereiste snelheden om te voorkomen dat een verlies van product. Agarose hydrogel kan heeft een brekingsindex nauw overeenkomen met die van water en moeilijk te zien in een buis22, zodat gebruikers zorgvuldig de grens van de gel-liquid vóór aspiratie herkennen moeten. Water-in-olie druppels zijn vatbaar voor samenvoeging door de opbouw van statische krachten23 op laboratorium handschoenen en buizen. Voor deze reden raden wij laden de druppel herinjectie spuiten met blote handen en het behandelen van alle lijnen van de herinjectie met een anti-statische pistool voorafgaand aan de pomp zelfaanzuigende. Grote samengevoegd druppels kunnen worden verwijderd door langzaam draaien de emulsies in een spuit en handmatig aspirating de grotere druppels, die zich in de buurt van de top als gevolg van hun grotere uitbundige kracht ophopen.
SiC-seq is de eerste technologie om aan te tonen van eencellige genoom sequentiebepaling van > 50.000 bacteriecellen. Dit platform biedt aanzienlijke voordelen in doorvoer ten opzichte van de bestaande benaderingen en stelt gebruikers van een diepere bemonstering van heterogene microbiële gemeenschappen. Tot op heden hebben microfluidic technologieën voor eencellige genoom sequencing werkzaam microchambers9 en microwells24 voor cel isolatie en versterking, maar met doorvoercapaciteit in het bereik van slechts tientallen tot honderden van cellen. Het sorteren van de stroom van afzonderlijke cellen in wellplates5,6 vereist geen gespecialiseerde microfluidic instrumentatie maar bezit een eveneens lage doorvoersnelheid. Gezien het feit dat de bodem- en watermonsters in de omgeving hebben vaak Alfa diversiteit van > 1000 op de soorten niveau25,26, SiC-seq is zeer gunstig op grond van haar vermogen om te genieten van een veel groter aantal organismen. De SiC-seq workflow is aangepast aan cel ingangen van laboratoriumcultuur, het natuurlijke milieu of een levende gastheer. Een cel monster moet alleen in een waterige suspensie en vrij van grote deeltjes (> 10 µm) geschikt voor de inkapseling van de microfluidic. De methode heeft bijvoorbeeld eerder toegepast op een steekproef uit zeewater met behulp van een reeks van wassen en filteren van de stappen voor het vooraf verwerken van de cellen vóór de inkapseling17.
Het SiC-seq-protocol genereert een relatief geringe hoeveelheid sequencing gegevens van elke eencellige en mogelijk niet geschikt voor alle toepassingen. Sommige bioinformatics algoritmen zoals DOVO genoom vergadering of één nucleotide variant (SNV) roepen vereisen hogere dekking diepten om effectief te werken. In plaats daarvan, barcode groepen kunnen geclusterde in silico door taxonomische weggooien methoden27 zodat algoritmen kunnen worden toegepast op grotere sets van luidt als volgt. De relatief lage barcoding totaalrendement van de SiC-seq-werkstroom kan ook uitdagingen presenteren in gevallen waarin de beschikbaarheid van het input monster laag is. SiC-seq berust op een Poisson-verdeelde barcode inkapseling stap, dus ongeveer 10% van de cellen een moleculaire barcode ontvangen en worden versterkt tijdens de definitieve bibliotheek voorbereiding stap. Terwijl dit vergelijkbaar met andere regelingen op basis van microdroplet barcoding10 is, gebruikers die werken met kostbare celsteekproeven kunnen ondervindt bij het bereiken van de opbrengst van de voldoende bibliotheek voor het rangschikken en wellicht te verhogen van het aantal cycli van PCR in de finale versterking stap. Een andere mogelijke oplossing voor gebruikers met microfluidic expertise is positieve barcode druppels na de digitale PCR stap, waardoor de algehele efficiëntie van de barcoding te sorteren > 85%28.
Een mogelijke toekomstige koers voor SiC-seq-technologie is de aanpassing van de werkstroom voor gebruik met zoogdiercellen, de weg vrijmaakt voor nieuwe klinische eencellige studies. Als voorbeeld, een analyse van de kopie nummer variatie onder één kanker cellen mei verder van ons begrip van de rol van heterogeniteit in kanker pathologie2. U kunt ook zouden SiC-seq integreren met bestaande methoden voor de sonde en verrijken van de opeenvolgingen van DNA van belang29 de gerichte eencellige sequencing van subpopulaties of zeldzame soorten cellen. Met milieu monsters, kon genen van binnen een bekende metabolische weg worden gericht en contextueel geanalyseerd samen met naburige genen te identificeren roman genomic eilanden. Vanuit een menselijke gastheer-omgeving, laag-titer pathogene bacteriën monsters kunnen worden geïsoleerd en sequenced op het niveau van de eencellige te onderzoeken meer nauw hun genotypische oorsprong van virulentie.
The authors have nothing to disclose.
Dit werk werd gesteund door de National Science Foundation via een CAREER Award (subsidie nummer DBI-1253293); de National Institutes of Health (NIH) (subsidie nummers HG007233-01, R01-EB019453-01, 1R21HG007233, DP2-AR068129-01, R01-HG008978); en de Defense Advanced Research projecten Agentschap wonen gieterijen Program (contractnummers HR0011-12-C-0065, N66001-12-C-4211, HR0011-12-C-0066).
3" silicon wafers, P type, virgin test grade | University Wafers | 447 | |
SU-8 3025 photoresist | Microchem | 17030192 | |
Spin coater | Specialty Coating Systems | G3P-8 | |
Photomasks | CadArt Servcies | (custom) | See Supplemental Files for mask designs |
PGMEA developer | Sigma-Aldrich | 484431 | |
Isopropanol | Sigma-Aldrich | 109827 | |
Sylgard 184 silicone elastomer kit | Krayden | 4019862 | |
Degassing chamber | Bel-Art | 42025 | |
0.75 mm biopsy punch | World Precision Instruments | 504529 | |
Glass microscope slides (75 mm x 50 mm) | Corning | 294775X50 | |
Aquapel (hydrophobic glass treatment) | Pittsburgh Glass Works | 47100 | |
PE-2 polyethylene tubing | Scientific Commodities | B31695-PE/2 | |
1 mL syringes | BD | 309628 | |
27 gauge needles | BD | 305109 | |
Syringe pump | New Era Pump Systems | NE-501 | |
Novec HFE-7500 fluorinated oil (HFE) | 3M | 98-0212-2928-5 | |
FC-40 fluorinated oil | Sigma-Aldrich | F9755 | |
PEG-PFPE surfactant | Ran Biotechnologies | 008-FluoroSurfactant | |
Space heater | Lasko | CD09250 | |
Agarose, low gelling temperature | Sigma-Aldrich | a9414 | |
TE (10X) | Rockland | mb-007 | |
PBS 1X, pH 7.4 | E&K Scientific Products | EK-65083 | |
OptiPrep (density gradient medium) | Sigma-Aldrich | d1556 | |
1H,1H,2H-Perfluoro-1-Octanol (PFO) | Sigma-Aldrich | 370533 | |
Span 80 (sorbitane monooleate) | Sigma-Aldrich | s6760 | |
Hexane | Sigma-Aldrich | 139386 | |
Tween 20 (polysorbate 20) | Sigma-Aldrich | p2287 | |
Lysozyme Type IV | MP Biomedicals | 195303 | |
Mutanolysin | Sigma-Aldrich | M9901 | |
Zymolyase (yeast lytic enzyme) | Zymo Research | e1004 | |
Lysostaphin | Sigma-Aldrich | L7386 | |
Sodium chloride | Sigma-Aldrich | S9888 | |
EDTA | Sigma-Aldrich | E6758 | |
Tris-HCl, pH 7.5, 1M | Invitrogen | 15567-027 | |
Dithiothreitol (DTT) | Teknova | d9750 | |
Lithium dodecyl sulfate | Sigma-Aldrich | L9781 | |
Proteinase K | New England Biosciences | P8107S | |
Ethanol, 200 Proof (100%) | Koptec | V1001 | |
SYBR Green I (nucleic acid stain) | Invitrogen | S7563 | |
PEG 6k | Sigma-Aldrich | 81260 | |
Triton X-100 (octylphenol ethoxylate) | Sigma-Aldrich | t8787 | |
Nextera DNA Library Prep Kit | Illumina | FC-121-1030 | |
Phusion Hot Start Flex Master Mix (High-Fidelity Hot Start Master Mix) | New England Biosciences | m05365 | |
Platinum Multiplex PCR Master Mix (Taq Master Mix) | Applied Biosystems | 4464263 | |
Warmstart 2.0 Bst Polymerase (isothermal polymerase) | New England Biosciences | m0538m | |
NT buffer from Nextera XT kit (neutralization buffer) | Illumina | FC-131-1024 | |
Cold cathode fluorescent inverter | (custom) | (custom) | |
DC power supply | Mastech | HY1503D | |
Zerostat 3 anti-static gun | Milty | 5036694022153 | |
3D-printed centrifuge syringe holder | (custom) | (custom) | See Supplemental Files for 3D print file |
Zymo DNA Clean & Concentrator-5 | Zymo Research | D4003 |