Ici, nous présentons une adaptation de la technique de capture de conformation chromosomique (3C) en détail en mettant l’accent sur la participation et l’apprentissage au premier cycle.
La capture de conformation chromosomique (3C) est un outil puissant qui a engendré une famille de techniques similaires (par exemple, Hi-C, 4C et 5C, appelées ici techniques 3C) qui fournissent des informations détaillées sur l’organisation tridimensionnelle de la chromatine. Les techniques 3C ont été utilisées dans un large éventail d’études, allant de la surveillance des changements dans l’organisation de la chromatine dans les cellules cancéreuses à l’identification des contacts d’amplificateur établis avec les promoteurs de gènes. Alors que de nombreuses études utilisant ces techniques posent de grandes questions à l’échelle du génome avec des types d’échantillons complexes (c.-à-d. analyse de cellules uniques), ce qui est souvent perdu, c’est que les techniques 3C sont fondées sur des méthodes de biologie moléculaire de base applicables à un large éventail d’études. En abordant des questions étroitement ciblées sur l’organisation de la chromatine, cette technique de pointe peut être utilisée pour améliorer l’expérience de laboratoire de recherche et d’enseignement de premier cycle. Cet article présente un protocole 3C et fournit des adaptations et des points d’accent pour la mise en œuvre dans les établissements principalement de premier cycle dans les expériences de recherche et d’enseignement de premier cycle.
Le génome d’un organisme contient non seulement tous les gènes nécessaires à leur fonctionnement, mais aussi toutes les instructions sur la façon et le moment de les utiliser. Cela fait de la régulation de l’accès au génome l’une des fonctions les plus importantes de la cellule. Il existe de nombreux mécanismes pour contrôler la fonction des gènes; Cependant, à son niveau de base, la régulation des gènes se résume à la capacité des facteurs de transcription régulateurs (trans-facteurs) à se lier à leurs séquences d’ADN spécifiques (séquences cis-régulatrices). Ce n’est pas une capacité innée; Au lieu de cela, il est régi par l’organisation / structure du génome dans le noyau, qui contrôle la disponibilité / exposition des séquences cis-régulatrices aux transfacteurs 1,2,3. Si les transfacteurs ne peuvent pas trouver leurs séquences cis-régulatrices, alors les transfacteurs ne peuvent pas effectuer leurs tâches de régulation. Cela a fait de la compréhension de la façon dont les génomes sont organisés dans le noyau une source importante de recherche.
Il est largement admis que pendant l’interphase, les chromosomes eucaryotes du noyau occupent leur propre domaine ancré à la lame nucléaire et à la matrice nucléaire (Figure 1), faisant ainsi du chromosome plus une tranche de pizza, plutôt qu’une nouille sur une assiette de spaghettis. Les chromosomes sont partiellement condensés par des interactions protéine-ADN (chromatine) qui tordent et bouclent des parties du chromosome. Grâce à la microscopie électronique, à l’hybridation in situ par fluorescence tridimensionnelle de l’ADN (FISH) et aux techniques de marquage de l’ADN (c.-à-d. méthylation fluorescente et artificielle de l’ADN), on a constaté que les domaines inactifs de la chromatine étaient étroitement emballés le long de la périphérie nucléaire 4,5,6, tandis que des portions de chromatine active, moins condensée, se trouvent à l’intérieur du noyau 7,8,9, 10. Ces expériences fournissent une vue d’ensemble de la dynamique chromosomique, mais ne font pas grand-chose pour capturer les changements qui se produisent localement autour des promoteurs de gènes observés dans les études DNase11,12 et nucléosome13,14,15.
La clé pour déverrouiller la dynamique de la chromatine à plus haute résolution a été la formulation de la technique de cartographie chromosomique 3D, 3C. La technique 3C elle-même comprend quatre étapes principales: la réticulation de la chromatine, la digestion de la chromatine par des enzymes de restriction, la ligature de la chromatine et la purification de l’ADN (Figure 2). Les nouveaux fragments d’ADN artificiels générés par ce processus peuvent ensuite être caractérisés pour révéler l’association physique étroite entre des morceaux d’ADNlinéairement éloignés 16. La technique 3C est devenue la base de la création de multiples techniques dérivées qui utilisent les étapes initiales de 3C pour poser des questions plus larges à l’échelle du génome (par exemple, Hi-C, 4C, ChIP-C). Cette famille de techniques 3C a identifié que les chromosomes sont organisés en plusieurs unités discrètes appelées domaines topologiquement associés (TAD). Les TAD sont codés dans le génome et sont définis par des boucles de chromatine flanquées de frontières non bouclées16,17,18,19. Les limites du TAD sont maintenues par deux facteurs évolutifs conservés et omniprésents, y compris le facteur de liaison CCCT (CTCF) et la cohésion, qui empêchent les boucles au sein de TADs distincts d’interagir16,20. Les boucles sont médiées par l’interaction des transfacteurs avec leurs séquences régulatrices, ainsi que par le CTCF et la cohésion21.
Bien que de nombreuses études utilisant les technologies 3C posent des questions générales à l’échelle du génome et utilisent des techniques complexes de collecte d’échantillons, la formulation de la technique 3C est basée sur des techniques de biologie moléculaire de base. Cela rend 3C intrigant pour le déploiement dans les laboratoires de recherche et d’enseignement de premier cycle. La technique 3C peut être utilisée pour des questions ciblées plus petites et est intrinsèquement flexible pour la mise à l’échelle vers le haut ou vers le bas (gènes uniques22, chromosomes16 et / ou génomes18) en fonction de l’objectif et de la direction des questions posées. Cette technique a également été appliquée à une large gamme de systèmes modèles 7,16,19,23 et s’est avérée polyvalente dans son utilisation. Cela fait de 3C une excellente technique pour les étudiants de premier cycle en ce sens que les étudiants peuvent acquérir de l’expérience dans les techniques courantes de biologie moléculaire tout en acquérant une expérience précieuse dans la réponse aux questions dirigées.
Présenté ici est un protocole adapté pour la préparation de la bibliothèque 3C basé sur les protocolesprécédemment publiés 24,25,26,27. Ce protocole a été optimisé pour environ 1 × 107 cellules, bien qu’il ait généré des bibliothèques 3C avec aussi peu que 1 × 105 cellules. Ce protocole s’est avéré polyvalent et a été utilisé pour générer des bibliothèques 3C à partir d’embryons de poisson zèbre, de lignées cellulaires de poisson zèbre et de Caenorhabditis elegans (vers ronds) pour jeunes adultes (YA). Le protocole devrait également être approprié pour les lignées cellulaires de mammifères et, avec une adaptation supplémentaire, la levure.
L’objectif de ces adaptations est de rendre le 3C plus accessible aux étudiants de premier cycle. On a pris soin d’utiliser des techniques semblables à celles qui peuvent être accomplies dans un laboratoire d’enseignement de premier cycle. La technique 3C offre de nombreuses possibilités d’apprentissage aux étudiants de premier cycle pour apprendre les techniques de base de la biologie moléculaire qui bénéficieront à leur développement sur le banc, en classe et dans leurs efforts après l’obtention du diplôme.
Le 3C est une technique puissante qui est enracinée dans les techniques moléculaires de base. C’est cette base d’outils fondamentaux qui fait de 3C une technique si intrigante à utiliser avec les étudiants de premier cycle. Avec autant d’études récentes observant la dynamique de la chromatine à une si grande échelle, l’utilisation de ces résultats pour concevoir une expérience étroitement ciblée sur un seul gène ou une seule région génomique a le potentiel de créer une expérience unique et percutante dans la recherche de premier cycle. Souvent, de telles expériences sont considérées comme trop avancées pour les étudiants de premier cycle, mais avec une planification minutieuse, elles sont facilement réalisables. Il est important de noter que les tests conçus pour sonder les connexions chromatines capturées par la bibliothèque 3C peuvent varier de la PCR semi-quantitative au séquençage du génome entier. En fait, les données du premier article3C 16 ont été générées à partir de qPCR. Cette large gamme de tests peut tous être utilisés parce que toutes les technologies 3C produisent le même produit – une bibliothèque de fragments d’ADN représentant des connexions 3D dans le noyau.
Présenté ici est une adaptation d’un protocole plus flexible et accommodant qui convient mieux aux chercheurs de premier cycle. Les périodes de pause énumérées ci-dessus impliquent des retards de nuit; Cependant, ces pauses peuvent s’étendre sur les week-ends et, dans le cas des cellules et des noyaux, pendant des semaines. La considération la plus cruciale est le moment où le travail sera terminé. Souvent, dans les protocoles, il y a des étapes urgentes où la pause n’est pas une option. En dehors de quelques points (jour 1 et jour 2), il existe de nombreux endroits pour s’arrêter et congeler l’échantillon. Ceux-ci sont essentiels lorsque vous travaillez avec des étudiants de premier cycle où les horaires et les horaires des travaux de laboratoire doivent être flexibles. En plus d’intégrer ces arrêts dans le protocole, les étudiants de premier cycle sont encouragés à travailler en paires ou même en petits groupes de trois ou quatre. Les groupes fonctionnent bien pour ce protocole, car les étudiants peuvent se soutenir mutuellement et créer un système de jumelage pour que tout le monde travaille en toute sécurité. Le travail de laboratoire est également plus amusant avec les autres personnes impliquées. Avec les groupes, les étudiants peuvent également travailler sur une variété de questions axées sur l’organisation de la chromatine tout en exécutant le même protocole. Ainsi, même si les étudiants travaillent sur des projets distincts, le protocole relie leurs efforts et, de ce fait, ils peuvent se soutenir mutuellement.
D’autres adaptations visent à contourner le fait que certains outils et équipements spécialisés ne se trouvent pas nécessairement dans tous les établissements de premier cycle. Ces pièces d’équipement comprennent, sans toutefois s’y limiter, les thermocycleurs qPCR, les systèmes de documentation sur gel et les spectromètres de nanovolume. En effet, ces équipements sont pratiques mais ne sont pas une exigence. Ici, la méthode classique de 3C est également décrite dans la partie de conception de l’apprêt; Cela implique d’identifier un locus génomique d’intérêt et, à partir de là, d’évaluer d’autres loci génomiques pour les points de contact de la chromatine plus éloignés. Cette technique fonctionne également bien si un ensemble de données publié est utilisé, tel qu’un ensemble de données utilisant Hi-C, où des loci positifs connus (connectants) et négatifs (non connectés) sont identifiés. La conception d’expériences utilisant ces ensembles de données publiés est une autre excellente adaptation pour les laboratoires d’enseignement, car les chances d’identification réussie des connexions chromatiniques sont généralement plus grandes. De plus, l’article de recherche peut être discuté en classe et servir de référence.
Ce protocole utilise une approche qPCR modifiée pour visualiser la formation du produit 3C. Les contrôles sont essentiels au succès de la technique 3C. Chaque expérience utilise à la fois des contrôles d’échantillon et des contrôles d’amorce pour déterminer l’achèvement de la procédure 3C. Les contrôles de l’échantillon comprennent un contrôle non digéré (ADN génomique) et un contrôle digéré. Le contrôle non digéré détermine le signal de base pour les ensembles d’amorces et est utilisé avec le contrôle de digestion réticulé pour déterminer l’efficacité de la digestion. On s’attend à ce qu’il y ait une baisse de produit pour tous les apprêts dirigés à travers un site de restriction. La comparaison de cette valeur avec le témoin non digéré donne une indication de la façon dont l’échantillon a été digéré.
Les amorces pour la PCR comprennent une amorce de contrôle et des amorces de test. L’amorce de contrôle est un ensemble d’amorces qui se trouve près de la région génomique à tester et qui ne contient pas de site de restriction. Cela fournit la base de référence pour déterminer l’abondance des produits PCR d’amorce d’essai. Les amorces d’essai sont des amorces avant et arrière qui flanquent un site de restriction pour un locus génomique d’intérêt particulier (Figure 3). Les réactions utilisant ces jeux d’amorces sont comparées pour déterminer l’efficacité de la digestion, car l’abondance du produit devrait diminuer si le site de restriction a été coupé. Pour déterminer l’organisation de la chromatine, une amorce de test d’un locus est associée à une autre amorce de test d’un locus génomique différent pour déterminer si ces deux loci sont proches l’un de l’autre dans l’espace 3D. Dans ce cas, on s’attend à ce qu’un produit de PCR ne soit trouvé qu’en utilisant l’échantillon 3C comme modèle.
Il est important de noter que même les amorces validées ont tendance à échouer (Figure 4 : jeu d’amorces r14). En outre, les produits de PCR sont fréquemment identifiés dans les réactions de contrôle et dans les réactions dans lesquelles une connexion de chromatine n’est pas prévue (comme le témoin digéré, puisqu’il n’est pas ligaturé). Ces instances sont séquencées et échouent à Sanger QC ou reviennent sans séquence définie (Figure 5). De plus, les expériences 3C traditionnelles génèrent un « modèle de contrôle », un échantillon d’ADN non réticulé, digéré et ligaturé, qui représente tous les fragments ligaturés possibles pouvant être produits avec une quantité donnée d’ADN. Le « modèle de contrôle » joue un rôle important dans la comparaison des intensités des signaux qPCR entre deux loci génomiques afin de déterminer si le signal représente une véritable interaction ou simplement une association aléatoire. La création d’un « modèle de contrôle » peut être problématique, car une grande partie de la chromatine analysée doit être capturée sous la forme d’un chromosome artificiel et traitée avec les échantillons 3C. Sécuriser une telle construction peut ne pas être faisable, et en créer une pourrait sortir de la portée d’un projet semestriel. En raison de ces difficultés, nous suggérons d’utiliser un abécédaire de contrôle. L’introduction au contrôle ne remplace pas toutes les fonctionnalités du « modèle de contrôle », mais offre tout de même la possibilité d’analyser les données pour déterminer la « présence » ou l’« absence ».
Lors de la qPCR, il est important d’utiliser des quantités égales de l’échantillon. Cela devrait être déterminé, même en utilisant un nano-spectrophotomètre tel qu’une nanogoutte, en générant une courbe standard à partir d’ADN génomique d’une concentration connue et en ajustant les échantillons 3C à cette ligne. Ces montants doivent être enregistrés et utilisés dans les PCR ultérieures. La qualité de la réaction PCR est également importante. Comme la PCR s’exécute en qPCR, l’abondance du produit est mesurée par fluorescence et enregistrée. Cet enregistrement est accessible dans le tracé d’amplification. Une fois le programme terminé, il est important de vérifier le graphique d’amplification et de s’assurer que les réactions (à l’exception des contrôles sans modèle) ont trois phases: une ligne de base, une exponentielle et une phase de plateau/saturation. Il est important de vérifier que les réactions ont une phase exponentielle, en particulier pour fixer le seuil (voir ci-dessous). De plus, pour les échantillons dilués en série, il devrait y avoir un changement dans les valeurs Ct correspondant à la dilution de l’échantillon (la concentration la plus élevée aura les valeurs Ct les plus faibles, tandis que la concentration la plus faible aura les valeurs Ct les plus élevées). Les échantillons qui ne reflètent pas ce changement dans la place d’amplification nécessitent une nouvelle dilution ou indiquent un problème plus important avec la formation de l’échantillon 3C. Enfin, tout en générant la courbe standard, le logiciel de PCR calculera l’efficacité de la PCR et la valeurR2 . L’efficacité de la PCR doit être supérieure à 90 % et la valeur de R2 doit être supérieure à 0,99. Si l’une ou l’autre de ces conditions n’est pas remplie, il est probable que quelque chose ne va pas avec l’échantillon ou les amorces PCR.
Après qPCR, le pourcentage de digestion et la présence d’interactions 3C peuvent être calculés en utilisant la qPCR Ct pour chaque réaction. Pour les déterminer, il faut d’abord définir le seuil de la réaction PCR. Cela se fait normalement à l’aide du logiciel fourni avec la machine qPCR. L’établissement du seuil définira la concentration du produit PCR qui sera utilisé pour comparer les valeurs Ct de l’échantillon. Le seuil doit couper en deux les courbes d’amplification des réactions de PCR dans la phase exponentielle d’amplification. Seules les réactions PCR avec amplification exponentielle peuvent être comparées (dans ce cas, les amorces de contrôle et les réactions d’amorce de test), car c’est le seul moyen de s’assurer que les réactions amplifient l’ADN au même rythme et peuvent être comparées fidèlement. Lors de l’analyse des graphiques 3C, les réactions conditionnellement positives sont identifiées comme celles avec plus de produit que les échantillons témoins, le contrôle génomique et le contrôle de la digestion (Figure 4B). Cependant, ces échantillons doivent être validés davantage à l’aide du séquençage de Sanger après la purification du gel du produit PCR.
Après le séquençage de Sanger, les échantillons qui passent le QC peuvent être analysés à l’aide de Blat. Le but de cette analyse est de déterminer si l’échantillon a la séquence des deux loci génomiques cibles flanquant le site de restriction (DpnII dans le cas de ce protocole). Si les deux séquences sont identifiées, le fragment 3C peut être considéré comme validé. Si les résultats du Blat ne renvoient pas la séquence attendue, cela peut indiquer que l’une ou les deux amorces ne sont pas optimales, ce qui entraîne un résultat qPCR faussement positif. Les fichiers de trace des échantillons faussement positifs auront des pics de base non définis et les rapports Seq contiendront principalement « n » appels de base.
La validation de Sanger est essentielle, car les faux positifs de la formation artificielle de produits PCR sont possibles. Ces faux positifs peuvent être identifiés lorsque les produits de séquençage n’ont pas la séquence cible attendue ou un site DpnII caractéristique d’un fragment 3C approprié (Figure 5). Le séquençage des fragments de PCR fournit également un autre point de données pour l’expérience et fait comprendre aux étudiants que la technique 3C identifie des loci génomiques distants qui se rassemblent dans l’espace 3D dans les noyaux.
La technique 3C fournit une multitude de techniques moléculaires fondamentales pour les étudiants de premier cycle dans une procédure flexible et simple. Cette technique 3C est également un point de départ pour les autres techniques 3C qui intègrent le séquençage de nouvelle génération (NGS). Ces types d’expériences peuvent exposer les étudiants de premier cycle à des aspects importants de la bioinformatique et sont enracinés dans les principes de base décrits ici. L’expérience et la participation au premier cycle sont essentielles à leur succès et à leur développement en tant que jeunes scientifiques. En offrant ces opportunités, les étudiants de premier cycle peuvent renforcer leur compréhension des principes de base tout en renforçant leur confiance pour aborder des techniques et des questions de pointe.
The authors have nothing to disclose.
Ce travail a été soutenu en partie par le Rhode Island Institutional Development Award (IDeA) Network of Biomedical Research Excellence du National Institute of General Medical Sciences des National Institutes of Health sous le numéro de subvention P20GM103430 et le Bryant Center of Health and Behavioral Sciences.
37% Formaldehyde | Millapore-Sigma | F8775 | |
100% Ethanol | Millapore-Sigma | E7023 | |
CaCl2 | MP Biomedical | 215350280 | |
chloroform | Millapore-Sigma | C0549 | |
cOmplete, EDTA-free Protease Inhibitor Cocktail | Millapore-Sigma | COEDTAF-RO | mixed to 50x in water. Diluted to 1x in Sucrose buffer and GB buffer fresh |
Dithiothreitol (DTT) | Millapore-Sigma | D0632 | 1 M stock diluted to 500 µM in Sucrose buffer and GB buffer fresh |
DpnII | NEB | R0543M | |
Glycerol | Millapore-Sigma | G9012 | |
glycine | Millapore-Sigma | G8898 | |
glycogen | Millapore-Sigma | 10901393001 | |
HEPES | Millapore-Sigma | H3375 | |
KCl | Millapore-Sigma | P3911 | |
KH2PO4 | Millapore-Sigma | P5655 | |
methyl green pyronin | Millapore-Sigma | HT70116 | |
MgAc2 | Thermoscientific | 1222530 | |
Na2HPO4 | Millapore-Sigma | S5136 | |
NaCl | Millapore-Sigma | S9888 | |
phenol-chloroform | Millapore-Sigma | P3803 | |
Pronase | Millapore-Sigma | 11459643001 | |
Proteinase K | IBI Scientific | IB05406 | |
qPCR Ready mix (Phire Taq etc) | Millapore-Sigma | KCQS07 | |
RNase A | Millapore-Sigma | R6148 | |
Sodium Acetate | Millapore-Sigma | S2889 | |
sodium dodecyl sulfate (SDS) | Millapore-Sigma | L3771 | |
Sucrose | Millapore-Sigma | S0389 | |
T4 DNA Ligase | Promega | M1804 | |
Tris-HCl | Millapore-Sigma | 108319 | |
Triton X-100 | Millapore-Sigma | T9284 | |
Trypsin-EDTA | Millapore-Sigma | T4049 |