Hier presenteren we een aanpassing van de chromosoomconformatie-capture (3C) -techniek in detail met de nadruk op betrokkenheid en leren van niet-gegradueerden.
Chromosoomconformatievangst (3C) is een krachtig hulpmiddel dat een familie van vergelijkbare technieken heeft voortgebracht (bijv. Hi-C, 4C en 5C, hier aangeduid als 3C-technieken) die gedetailleerde informatie bieden over de driedimensionale organisatie van chromatine. De 3C-technieken zijn gebruikt in een breed scala van studies, van het monitoren van de veranderingen in chromatine-organisatie in kankercellen tot het identificeren van versterkercontacten met genpromotors. Hoewel veel van de studies die deze technieken gebruiken grote genoombrede vragen stellen met ingewikkelde monstertypen (d.w.z. eencellige analyse), gaat vaak verloren dat de 3C-technieken zijn gebaseerd op elementaire moleculaire biologiemethoden die van toepassing zijn op een breed scala aan studies. Door strak gerichte vragen van chromatine-organisatie aan te pakken, kan deze geavanceerde techniek worden gebruikt om de niet-gegradueerde onderzoeks- en onderwijslaboratoriumervaring te verbeteren. Dit artikel presenteert een 3C-protocol en biedt aanpassingen en aandachtspunten voor implementatie bij voornamelijk niet-gegradueerde instellingen in niet-gegradueerde onderzoeks- en onderwijservaringen.
Het genoom van een organisme bevat niet alleen alle genen die nodig zijn voor de functie, maar ook alle instructies over hoe en wanneer ze te gebruiken. Dit maakt het reguleren van de toegang tot het genoom een van de belangrijkste functies van de cel. Er zijn veel mechanismen om de genfunctie te controleren; op basisniveau komt genregulatie echter neer op het vermogen van regulerende transcriptiefactoren (transfactoren) om te binden aan hun specifieke DNA-sequenties (cis-regulerende sequenties). Dit is geen aangeboren vermogen; In plaats daarvan wordt het bepaald door de organisatie/structuur van het genoom in de kern, die de beschikbaarheid/blootstelling van de cis-regulerende sequenties aan de transfactoren 1,2,3 regelt. Als de transfactoren hun cis-regulerende sequenties niet kunnen vinden, kunnen de transfactoren hun regulerende taken niet uitvoeren. Dit heeft het begrijpen van hoe genomen in de kern zijn georganiseerd tot een belangrijke bron van onderzoek gemaakt.
Het is algemeen aanvaard dat eukaryote chromosomen in de kern tijdens de interfase hun eigen domein bezetten dat verankerd is aan de nucleaire lamina en nucleaire matrix (figuur 1), waardoor het chromosoom meer op een stuk pizza lijkt, in plaats van een noedel op een bord spaghetti. Chromosomen worden gedeeltelijk gecondenseerd door eiwit-DNA-interacties (chromatine) die delen van het chromosoom verdraaien en lussen. Door middel van elektronenmicroscopie, driedimensionale DNA-fluorescentie in situ hybridisatie (FISH) en DNA-taggingtechnieken (d.w.z. fluorescerende en kunstmatige DNA-methylatie), zijn inactieve domeinen van chromatine strak opeengepakt langs de nucleaire periferie 4,5,6, terwijl delen van actief, minder gecondenseerd chromatine worden gevonden in het binnenste van de kern 7,8,9, 10. Deze experimenten bieden een groothoekbeeld van de chromosoomdynamica, maar doen weinig om de veranderingen vast te leggen die lokaal optreden rond de genpromotoren die zijn waargenomen in DNase11,12– en nucleosoom13,14,15-studies.
De sleutel tot het ontsluiten van chromatinedynamica met een hogere resolutie was de formulering van de 3D-chromosoomkarteringstechniek, 3C. De 3C-techniek zelf bestaat uit vier hoofdstappen: crosslinking van chromatine, chromatinevertering door restrictie-enzymen, chromatineligatie en DNA-zuivering (figuur 2). De nieuwe kunstmatige DNA-fragmenten die door dit proces worden gegenereerd, kunnen vervolgens worden gekarakteriseerd om de nauwe fysieke associatie tussen lineair verre stukjes DNAte onthullen 16. De 3C-techniek werd de basis voor het creëren van meerdere spin-off-technieken die de eerste stappen van 3C gebruiken om bredere genoombrede vragen te stellen (bijv. Hi-C, 4C, ChIP-C). Deze familie van 3C-technieken heeft vastgesteld dat chromosomen zijn georganiseerd in meerdere discrete eenheden die topologisch geassocieerde domeinen (TAD’s) worden genoemd. TAD’s zijn gecodeerd in het genoom en worden gedefinieerd door chromatinelussen geflankeerd door unlooped grenzen16,17,18,19. De TAD-grenzen worden gehandhaafd door twee evolutionair geconserveerde en alomtegenwoordige factoren, waaronder CCCT-bindingsfactor (CTCF) en cohesie, die voorkomen dat lussen binnen afzonderlijke TAD’s interageren16,20. De lussen worden gemedieerd door de interactie van transfactoren met hun regulerende sequenties, evenals CTCF en cohesie21.
Hoewel veel studies met behulp van 3C-technologieën brede genoombrede vragen stellen en gecompliceerde monsterverzamelingstechnieken gebruiken, is de formulering van de 3C-techniek gebaseerd op elementaire moleculaire biologietechnieken. Dit maakt 3C intrigerend voor inzet in zowel niet-gegradueerde onderzoeks- als onderwijslaboratoria. De 3C-techniek kan worden gebruikt voor kleinere gerichte vragen en is inherent flexibel voor op- of afschalen (enkele genen22, chromosomen16 en / of genomen18), afhankelijk van de focus en richting van de gestelde vragen. Deze techniek is ook toegepast op een breed scala aan modelsystemen 7,16,19,23 en heeft bewezen veelzijdig te zijn in het gebruik ervan. Dit maakt 3C een uitstekende techniek voor studenten omdat studenten ervaring kunnen opdoen in gemeenschappelijke moleculaire biologietechnieken terwijl ze ook waardevolle ervaring opdoen met het beantwoorden van gerichte vragen.
Hier wordt een aangepast protocol voor 3C-bibliotheekvoorbereiding gepresenteerd op basis van eerder gepubliceerde protocollen24,25,26,27. Dit protocol is geoptimaliseerd voor ongeveer 1 × 107 cellen, hoewel het 3C-bibliotheken heeft gegenereerd met slechts 1 × 105 cellen. Dit protocol heeft bewezen veelzijdig te zijn en is gebruikt om 3C-bibliotheken te genereren uit zebravisembryo’s, zebraviscellijnen en jongvolwassen (YA) Caenorhabditis elegans (rondworm). Het protocol moet ook geschikt zijn voor cellijnen van zoogdieren en, bij verdere aanpassing, gist.
Het doel van deze aanpassingen is om 3C toegankelijker te maken voor studenten. Er is voor gezorgd dat technieken worden gebruikt die vergelijkbaar zijn met die welke kunnen worden bereikt in een niet-gegradueerd onderwijslaboratorium. De 3C-techniek biedt veel leermogelijkheden voor studenten om elementaire moleculaire biologietechnieken te leren die hun ontwikkeling op de bank, in de klas en in hun inspanningen na het afstuderen ten goede zullen komen.
De 3C is een krachtige techniek die geworteld is in moleculaire basistechnieken. Het is deze basis van fundamentele hulpmiddelen die 3C zo’n intrigerende techniek maakt om te gebruiken met studenten. Met zoveel recente studies die chromatinedynamica op zo’n grote schaal observeren, heeft het gebruik van deze resultaten om een smal gericht experiment op een enkel gen of genomisch gebied te bedenken, het potentieel om een uniek en impactvol experiment in niet-gegradueerd onderzoek te creëren. Vaak worden experimenten zoals deze als te geavanceerd beschouwd voor studenten, maar met een zorgvuldige planning zijn ze gemakkelijk haalbaar. Het is belangrijk op te merken dat de testen die zijn ontworpen om de chromatineverbindingen te onderzoeken die door de 3C-bibliotheek zijn vastgelegd, kunnen variëren van semi-kwantitatieve eindpunt-PCR tot sequentiebepaling van het hele genoom. In feite werden gegevens van de eerste 3C-paper16 gegenereerd uit qPCR. Dit brede scala aan testen kan allemaal worden gebruikt omdat alle 3C-technologieën hetzelfde product produceren – een bibliotheek van DNA-fragmenten die 3D-verbindingen in de kern vertegenwoordigen.
Hier wordt een aanpassing gepresenteerd van een flexibeler en meegaand protocol dat beter past bij niet-gegradueerde onderzoekers. De hierboven genoemde pauzeperioden impliceren nachtelijke vertragingen; Deze pauzes kunnen zich echter uitstrekken over het weekend en, in het geval van de cellen en kernen, over weken. De meest cruciale overweging is wanneer het werk gedaan zal worden. Vaak zijn er in protocollen tijdgevoelige stappen wanneer pauzeren geen optie is. Buiten een paar punten (dag 1 en dag 2) zijn er veel plaatsen om te stoppen en het monster in te vriezen. Deze zijn van cruciaal belang bij het werken met studenten waarbij de schema’s en timings van laboratoriumwerk flexibel moeten zijn. Naast het engineeren van deze stops in het protocol, worden studenten aangemoedigd om in paren of zelfs kleine groepen van drie of vier te werken. Groepen werken goed voor dit protocol, omdat de studenten elkaar kunnen ondersteunen en een buddy-systeem kunnen creëren zodat iedereen veilig werkt. Labwerk is ook leuker met andere betrokkenen. Met groepen kunnen studenten ook werken aan een verscheidenheid aan vragen gericht op de organisatie van chromatine terwijl ze nog steeds hetzelfde protocol uitvoeren. Dus zelfs terwijl studenten aan afzonderlijke projecten werken, koppelt het protocol hun inspanningen en daarom kunnen ze elkaar ondersteunen.
Andere aanpassingen zijn bedoeld om het feit te omzeilen dat bepaalde gespecialiseerde gereedschappen en apparatuur niet noodzakelijkerwijs in alle niet-gegradueerde instellingen te vinden zijn. Deze apparatuur omvat maar is niet beperkt tot qPCR-thermocyclers, geldocumentatiesystemen en nanovolumespectrometers. Inderdaad, deze apparaten zijn handig, maar zijn geen vereiste. Hier wordt de klassieke methode van 3C ook beschreven in het primerontwerpgedeelte; Dit omvat het identificeren van een genomische locus van belang en van daaruit het beoordelen van andere genomische loci voor chromatinecontactpunten verder weg. Deze techniek werkt ook goed als een gepubliceerde dataset wordt gebruikt, zoals een dataset met Hi-C, waar bekende positieve (verbindende) en negatieve (niet-verbindende) loci worden geïdentificeerd. Het ontwerpen van experimenten met behulp van deze gepubliceerde datasets is een andere geweldige aanpassing voor onderwijslaboratoria, omdat de kans op de succesvolle identificatie van chromatineverbindingen meestal groter is. Bovendien kan het onderzoeksartikel in de klas worden besproken en als referentie worden gebruikt.
Dit protocol maakt gebruik van een aangepaste qPCR-benadering om de 3C-productvorming te visualiseren. Besturing is essentieel voor het succes van de 3C-techniek. Elk experiment gebruikt zowel monstercontroles als primercontroles om de voltooiing van de 3C-procedure te bepalen. De monstercontroles omvatten een onverteerde controle (genomisch DNA) en verteerde controle. De onverteerde controle bepaalt het basissignaal voor de primersets en wordt gebruikt met de cross-linked digestiecontrole om de verteringsefficiëntie te bepalen Er wordt verwacht dat er een daling van het product zal zijn voor primers die over een restrictieplaats zijn gericht. Door deze waarde te vergelijken met de onverteerde controle wordt een indicatie gegeven van hoe goed het monster is verteerd.
De primers voor de PCR bevatten een control primer en test primers. De controleprimer is een primerset die zich in de buurt van het genomische gebied bevindt dat wordt getest en geen restrictieplaats bevat. Dit vormt de basis voor het bepalen van de abundantie van de PCR-producten van de testprimer. Testprimers zijn voorwaartse en omgekeerde primers die een restrictieplaats flankeren voor een bepaalde genomische locus van belang (figuur 3). Reacties met behulp van deze primersets worden vergeleken om de verteringsefficiëntie te bepalen, omdat de productrijkdom zou moeten dalen als de restrictieplaats is gesneden. Bij het bepalen van de chromatine-organisatie wordt één testprimer van één locus gekoppeld aan een andere testprimer van een andere genomische locus om te bepalen of deze twee loci dicht bij elkaar liggen in de 3D-ruimte. In dat geval is de verwachting dat een PCR-product alleen gevonden zou worden met het 3C-monster als sjabloon.
Het is belangrijk op te merken dat zelfs gevalideerde primers de neiging hebben om te falen (Figuur 4: r14 primer set). Bovendien worden PCR-producten vaak geïdentificeerd in controlereacties en in reacties waarbij een chromatineverbinding niet wordt voorspeld (zoals de verteerde controle, omdat deze niet geligeerd is). Deze instanties worden gesequenced en falen Sanger QC of keren terug zonder een gedefinieerde volgorde (Figuur 5). Bovendien genereren traditionele 3C-experimenten een “controlesjabloon”, een niet-gekruist, verteerd en geligeerd DNA-monster, dat alle mogelijke geligeerde fragmenten vertegenwoordigt die met een bepaalde hoeveelheid DNA kunnen worden geproduceerd. De “controlesjabloon” speelt een belangrijke rol bij het vergelijken van de intensiteiten van qPCR-signalen tussen twee genomische loci om te bepalen of het signaal een echte interactie vertegenwoordigt of slechts een willekeurige associatie. Het maken van een “controlesjabloon” kan problematisch zijn, omdat een groot deel van het chromatine dat wordt getest moet worden gevangen in de vorm van een kunstmatig chromosoom en samen met de 3C-monsters moet worden verwerkt. Het beveiligen van een dergelijke constructie is misschien niet haalbaar en het maken ervan kan buiten het bestek van een semesterproject vallen. Vanwege deze problemen raden we aan om een controleprimer te gebruiken. De control primer vervangt niet alle functionaliteit van de “control template” maar biedt nog steeds de mogelijkheid om de data te analyseren om “presence” of “absence” bepalingen te doen.
Bij het uitvoeren van qPCR is het gebruik van gelijke hoeveelheden van het monster belangrijk. Dit moet worden bepaald, zelfs met behulp van een nanospectrofotometer zoals een nanodruppel, door een standaardcurve te genereren uit genomisch DNA van een bekende concentratie en de 3C-monsters op die lijn aan te passen. Deze bedragen moeten worden geregistreerd en gebruikt in volgende PCR’s. De kwaliteit van de PCR-reactie is ook belangrijk. Omdat de PCR in qPCR draait, wordt de productrijkdom gemeten met behulp van fluorescentie en geregistreerd. Deze opname is toegankelijk in de versterkingsplot. Zodra het programma is voltooid, is het belangrijk om de versterkingsplot te controleren en ervoor te zorgen dat de reacties (behalve de no template controls) drie fasen hebben: een basislijn, een exponentiële en een plateau / verzadigingsfase. Het is belangrijk om te controleren of de reacties een exponentiële fase hebben, met name voor het instellen van de drempel (zie hieronder). Bovendien moet er voor serieel verdunde monsters een verschuiving in Ct-waarden optreden die consistent is met de verdunning van het monster (de hoogste concentratie heeft de laagste Ct-waarden, terwijl de laagste concentratie de hoogste Ct-waarden heeft). Monsters die deze verandering in de amplificatieplot niet weerspiegelen, vereisen een nieuwe verdunning of wijzen op een groter probleem met de 3C-monstervorming. Ten slotte berekent de PCR-software tijdens het genereren van de standaardcurve de PCR-efficiëntie en de R2-waarde . Het PCR-rendement moet groter zijn dan 90% en de R2-waarde moet groter zijn dan 0,99. Als aan een van deze voorwaarden niet wordt voldaan, is het waarschijnlijk dat er iets mis is met het monster of de PCR-primers.
Na qPCR kunnen het percentage vertering en de aanwezigheid van 3C-interacties worden berekend met behulp van de qPCR Ct voor elke reactie. Om deze te bepalen, moet eerst de drempel voor de PCR-reactie worden ingesteld. Dit wordt normaal gesproken gedaan met behulp van de software die bij de qPCR-machine wordt geleverd. Door de drempel in te stellen, wordt de concentratie van het PCR-product gedefinieerd die zal worden gebruikt om de ct-waarden van het monster te vergelijken. De drempel moet de amplificatiecurven van de PCR-reacties in de exponentiële fase van amplificatie doorsnijden. Alleen PCR-reacties met exponentiële amplificatie kunnen worden vergeleken (in dit geval de controleprimers en de testprimerreacties), omdat dit de enige manier is om ervoor te zorgen dat de reacties DNA met dezelfde snelheid versterken en getrouw kunnen worden vergeleken. Bij het analyseren van de 3C-grafieken worden voorwaardelijk positieve reacties geïdentificeerd als die met meer product dan de controlemonsters, genomische controle en de verteringscontrole (figuur 4B). Deze monsters moeten echter verder worden gevalideerd met behulp van Sanger-sequencing na de gelzuivering van het PCR-product.
Na Sanger-sequencing kunnen monsters die de QC passeren, worden geanalyseerd met Blat. Het doel van deze analyse is om te bepalen of het monster de sequentie heeft van beide doelgenomische loci die de restrictieplaats flankeren (DpnII in het geval van dit protocol). Als beide sequenties worden geïdentificeerd, kan het 3C-fragment als gevalideerd worden beschouwd. Als de resultaten van de Blat niet de verwachte volgorde opleveren, kan dit erop wijzen dat een of beide primers niet optimaal zijn, wat resulteert in een vals positief qPCR-resultaat. De traceerbestanden voor de fout-positieve monsters hebben ongedefinieerde basispieken en de Seq-rapporten bevatten meestal “n” basisaanroepen.
Sanger-validatie is essentieel, omdat valse positieven van artefactuele PCR-productvorming mogelijk zijn. Deze fout-positieven kunnen worden geïdentificeerd wanneer de sequencingproducten niet de verwachte doelsequentie of een DpnII-locatie hebben die kenmerkend is voor een goed 3C-fragment (figuur 5). De sequencing van de PCR-fragmenten biedt ook een ander gegevenspunt voor het experiment en maakt de studenten duidelijk dat de 3C-techniek verre genomische loci identificeert die samenkomen in de 3D-ruimte in de kernen.
De 3C-techniek biedt een schat aan fundamentele moleculaire technieken voor studenten in een flexibele, eenvoudige procedure. Deze 3C-techniek is ook een startpunt voor de andere 3C-technieken die next-generation sequencing (NGS) bevatten. Dit soort experimenten kunnen studenten blootstellen aan belangrijke aspecten van bio-informatica en zijn geworteld in de basisprincipes die hier worden beschreven. Undergraduate ervaring en betrokkenheid zijn de sleutel tot hun succes en ontwikkeling als jonge wetenschappers. Door deze kansen te bieden, kunnen studenten hun begrip van basisprincipes versterken en tegelijkertijd hun zelfvertrouwen opbouwen om geavanceerde technieken en vragen aan te pakken.
The authors have nothing to disclose.
Dit werk werd gedeeltelijk ondersteund door het Rhode Island Institutional Development Award (IDeA) Network of Biomedical Research Excellence van het National Institute of General Medical Sciences van de National Institutes of Health onder subsidienummer P20GM103430 en het Bryant Center of Health and Behavioral Sciences.
37% Formaldehyde | Millapore-Sigma | F8775 | |
100% Ethanol | Millapore-Sigma | E7023 | |
CaCl2 | MP Biomedical | 215350280 | |
chloroform | Millapore-Sigma | C0549 | |
cOmplete, EDTA-free Protease Inhibitor Cocktail | Millapore-Sigma | COEDTAF-RO | mixed to 50x in water. Diluted to 1x in Sucrose buffer and GB buffer fresh |
Dithiothreitol (DTT) | Millapore-Sigma | D0632 | 1 M stock diluted to 500 µM in Sucrose buffer and GB buffer fresh |
DpnII | NEB | R0543M | |
Glycerol | Millapore-Sigma | G9012 | |
glycine | Millapore-Sigma | G8898 | |
glycogen | Millapore-Sigma | 10901393001 | |
HEPES | Millapore-Sigma | H3375 | |
KCl | Millapore-Sigma | P3911 | |
KH2PO4 | Millapore-Sigma | P5655 | |
methyl green pyronin | Millapore-Sigma | HT70116 | |
MgAc2 | Thermoscientific | 1222530 | |
Na2HPO4 | Millapore-Sigma | S5136 | |
NaCl | Millapore-Sigma | S9888 | |
phenol-chloroform | Millapore-Sigma | P3803 | |
Pronase | Millapore-Sigma | 11459643001 | |
Proteinase K | IBI Scientific | IB05406 | |
qPCR Ready mix (Phire Taq etc) | Millapore-Sigma | KCQS07 | |
RNase A | Millapore-Sigma | R6148 | |
Sodium Acetate | Millapore-Sigma | S2889 | |
sodium dodecyl sulfate (SDS) | Millapore-Sigma | L3771 | |
Sucrose | Millapore-Sigma | S0389 | |
T4 DNA Ligase | Promega | M1804 | |
Tris-HCl | Millapore-Sigma | 108319 | |
Triton X-100 | Millapore-Sigma | T9284 | |
Trypsin-EDTA | Millapore-Sigma | T4049 |