Les domaines intrinsèquement désordonnés sont importants pour la fonction du facteur de transcription de fusion oncogène. Pour cibler thérapeutiquement ces protéines, une compréhension plus détaillée des mécanismes de régulation employés par ces domaines est nécessaire. Ici, nous utilisons la transcriptomique pour cartographier les caractéristiques structurelles importantes du domaine EWS intrinsèquement désordonné dans le sarcome d’Ewing.
De nombreux cancers sont caractérisés par des translocations chromosomiques qui entraînent l’expression de facteurs de transcription de fusion oncogène. Typiquement, ces protéines contiennent un domaine intrinsèquement désordonné (IDD) fusionné avec le domaine de liaison à l’ADN (DBD) d’une autre protéine et orchestrent des changements transcriptionnels généralisés pour favoriser la malignité. Ces fusions sont souvent la seule aberration génomique récurrente dans les cancers qu’elles provoquent, ce qui en fait des cibles thérapeutiques attrayantes. Cependant, le ciblage des facteurs de transcription oncogènes nécessite une meilleure compréhension du rôle mécaniste que jouent les IDD de faible complexité dans leur fonction. Le domaine N-terminal d’EWSR1 est un IDD impliqué dans une variété de facteurs de transcription de fusion oncogénique, y compris EWS / FLI, EWS / ATF et EWS / WT1. Ici, nous utilisons le séquençage de l’ARN pour étudier les caractéristiques structurelles du domaine EWS importantes pour la fonction transcriptionnelle de EWS / FLI dans le sarcome d’Ewing. La première déplétion médiée par l’ARNh de la fusion endogène des cellules du sarcome d’Ewing associée à l’expression ectopique d’une variété de constructions mutantes EWS est effectuée. Ensuite, le séquençage de l’ARN est utilisé pour analyser les transcriptomes des cellules exprimant ces constructions afin de caractériser les déficits fonctionnels associés aux mutations dans le domaine EWS. En intégrant les analyses transcriptomiques aux informations précédemment publiées sur les motifs de liaison à l’ADN EWS / FLI et la localisation génomique, ainsi qu’aux tests fonctionnels pour la capacité de transformation, nous avons pu identifier les caractéristiques structurelles de EWS / FLI importantes pour l’oncogenèse et définir un nouvel ensemble de gènes cibles EWS / FLI essentiels pour le sarcome d’Ewing. Cet article démontre l’utilisation du séquençage de l’ARN comme méthode pour cartographier la relation structure-fonction du domaine intrinsèquement désordonné des facteurs de transcription oncogènes.
Un sous-ensemble de cancers, comprenant de nombreuses tumeurs malignes de l’enfance et de l’adolescence, sont caractérisés par des translocations chromosomiques qui génèrentde nouvelles oncogènes de fusion1,2,3,4,5,6. Les protéines de fusion résultantes fonctionnent fréquemment comme des facteurs de transcription oncogènes, orchestrant des changements généralisés dans la régulation transcriptionnelle pour favoriser la tumorigenèse7,8. Les cancers avec ces translocations possèdent généralement un paysage mutationnel par ailleurs calme, avec peu d’aberrations génomiques récurrentes en dehors de la fusion pathognomonique4,9. En tant que tel, cibler directement la protéine de fusion est une stratégie thérapeutique attrayante dans ces maladies. Cependant, ces facteurs de transcription oncogènes consistent généralement en un domaine de faible complexité, intrinsèquement désordonné, activant la transcription fusionné avec un domaine de liaison à l’ADN (DBD)10,11,12,13,14. Les domaines intrinsèquement désordonnés (IDD) et les DBD de ces protéines se sont révélés difficiles à cibler avec les approches pharmacologiques conventionnelles. Le développement de nouvelles approches thérapeutiques nécessite donc une compréhension moléculaire plus détaillée des mécanismes employés par ces fusions pour réguler aberrantement l’expression des gènes.
La partie N-terminale IDD d’EWSR1 est couramment fusionnée à un DBD dans le cancer, y compris EWS / FLI dans le sarcome d’Ewing, EWS / WT1 dans la tumeur diffuse à petites cellules rondes et EWS / ATF1 dans le sarcome à cellules claires des parties molles10. Le rôle mécaniste de l’EWS IDD dans chacune de ces fusions n’est pas bien compris. La famille de fusions EWS/ETS, en particulier EWS/FLI, est la plus fonctionnellement caractérisée à ce jour. EWS/FLI coordonne les changements épigénétiques et transcriptionnels à l’échelle du génome conduisant à l’activation et à la répression de milliers de gènes7,11,15,16. Des études ont montré que l’IDD est important pour le recrutement des co-activateurs transcriptionnels (tels que p300, WDR5 et le complexe BAF), ainsi que des co-répresseurs (tels que le complexe NuRD)11,15,17. La fusion de l’IDD EWS à la partie C-terminale de FLI1 confère une nouvelle spécificité de liaison à l’ADN au DBD ETS de FLI1, de sorte que l’oncoprotéine de fusion (EWS / FLI) se lie aux régions répétitives GGAA-microsatellites du génome en plus du motif ETS consensuel18,19,20. Combinée à la fonction de recrutement de co-activateurs, cette activité émergente de liaison à l’ADN de l’EWS/FLI favorise la formation d’amplificateurs de novo au niveau des microsatellites GGAA distaux aux sites de départ de transcription (TSS) (microsatellites de type amplificateur) et recrute l’ARN polymérase II pour favoriser la transcription au niveau des microsatellites GGAA-microsatellites proximaux au TSS (microsatellites de type promoteur)11,15,16,21.
Prises ensemble, ces données nous ont amenés à émettre l’hypothèse que des éléments discrets au sein du domaine EWS contribuent au recrutement de co-régulateurs distincts pour différents types de sites de liaison EWS/FLI. Cependant, le discernement de ces éléments dans la partie EWS de EWS /FLI, et leur fonctionnement, a été entravé par la nature hautement répétitive et désordonnée du domaine. Ici, nous utilisons un système de sauvetage précédemment publié dans les cellules du sarcome d’Ewing pour cartographier fonctionnellement ces éléments dans l’IDD EWS. Dans ce système, EWS/FLI est épuisé à l’aide d’un shRNA ciblant le 3’UTR du gène FLI1, et l’expression est sauvée avec différentes constructions d’ADNc mutantes EWS/FLI dépourvues du 3’UTR7,17,22. Ces expériences se sont concentrées sur des constructions avec diverses délétions pour cartographier la relation structure-fonction entre l’IDD EWS et d’importants phénotypes oncogènes, y compris l’activation d’une construction de rapporteur GGAA-microsatellite, les essais de formation de colonies et la validation ciblée des gènes activés et réprimés EWS /FLI 7,17,22 . Cependant, ces études n’ont pas réussi à trouver des sous-domaines discrets au sein de l’IDD EWS dans EWS / FLI qui sont particulièrement importants pour l’activation ou la répression. Toutes les constructions testées étaient soit capables d’activer et de réprimer des gènes cibles spécifiques, conduisant à une formation efficace de colonies, soit incapables de réguler l’un des gènes cibles EWS / FLI, entraînant la perte de la formation de colonies7,17,22.
Les analyses transcriptomiques rendues possibles par l’adoption généralisée du séquençage de nouvelle génération sont couramment utilisées pour comparer les signatures d’expression génique dans deux conditions, souvent dans le cadre d’études de dépistage ou descriptives. Nous voulions plutôt tirer parti de la capacité de capturer des données d’expression à l’échelle du génome en utilisant le séquençage de l’ARN (séquençage de l’ARN) pour caractériser les contributions des IDD à la fonction du facteur de transcription. Dans ce cas, RNA-seq est associé au système knockdown-rescue pour explorer la relation structure-fonction du domaine EWS. Cette approche est applicable à d’autres facteurs de transcription de fusion, y compris d’autres fusions EWS ou facteurs de transcription de type sauvage avec une fonction mal comprise, et présente de multiples avantages par rapport aux autres tests utilisés pour les études de cartographie fonctionnelle, tels que les tests rapporteurs ou la qRT-PCR ciblée. Il s’agit notamment de tester les déterminants structurels de la fonction dans le contexte pertinent de la chromatine, la capacité de tester plusieurs types d’éléments de réponse dans un seul essai (c.-à-d. activé et réprimé, microsatellite GGAA et non microsatellite, etc.), et la capacité qui en résulte de mieux détecter la fonction partielle.
La mise en œuvre réussie de cette approche dépend d’un système cellulaire qui capture les phénotypes d’intérêt (dans ce cas, les cellules A673 avec épuisement EWS/FLI médié par l’ARNh), et d’un panel de constructions mutantes dans un vecteur d’expression approprié pour le système cellulaire (dans ce cas, pMSCV-hygro avec divers mutants EWS/FLI marqués 3x-FLAG à délivrer par transduction rétrovirale). La transduction virale des constructions d’épuisement basées sur CRISPR, des constructions d’épuisement basées sur shRNA et des constructions d’expression de l’ADNc avec une sélection appropriée pour générer des lignées cellulaires stables est recommandée par transfection transitoire. L’interprétation en aval des résultats est renforcée lorsque les données transcriptomiques peuvent être associées à d’autres données liées à la localisation du facteur de transcription et à d’autres lectures phénotypiques, le cas échéant.
Dans cet article, nous appliquons cette approche pour caractériser l’activité du mutant DAF d’EWS/FLI14. Le mutant DAF présente 17 mutations tyrosine à alanine dans les régions répétitives de l’IDD EWS de EWS/FLI14. Ce mutant EWS particulier avait déjà été signalé et est incapable d’activer l’expression du gène rapporteur lorsqu’il est fusionné à l’ATF1 DBD14. Cependant, les données préliminaires de qRT-PCR suggèrent que ce mutant était capable d’activer la transcription de la cible EWS/FLI NR0B123. L’approche transcriptomique décrite ici a permis de détecter avec succès la fonction partielle du mutant DAF. En associant ces données transcriptomiques à des informations sur les motifs de liaison et de reconnaissance EWS/FLI, nous montrons en outre que le mutant DAF conserve sa fonction lors des répétitions de microsatellites GGAA. Ces résultats identifient le DAF comme le premier mutant EWS/FLI partiellement fonctionnel et mettent en évidence la fonction des gènes non microsatellites comme étant important pour l’oncogenèse (comme indiqué23). Cela démontre la puissance de cette approche de cartographie transcriptomique structure-fonction pour fournir un aperçu de la fonction des facteurs de transcription oncogènes.
L’étude des mécanismes biochimiques des facteurs de transcription oncogéniques est d’une importance cruciale pour comprendre les maladies qu’ils causent et pour concevoir de nouvelles stratégies thérapeutiques. Cela est particulièrement vrai dans les tumeurs malignes caractérisées par des translocations chromosomiques entraînant des facteurs de transcription de fusion. Les domaines inclus dans ces protéines chimériques peuvent manquer d’interactions significatives avec les domaines régulateurs présents dans les protéines de type sauvage, ce qui complique la capacité d’interpréter les informations structure-fonction dans le contexte de la fusion26,27,28. De plus, beaucoup de ces fusions oncogènes sont caractérisées par des domaines intrinsèquement désordonnés de faible complexité10,13,29,30.
Le domaine EWS est un exemple d’un tel domaine intrinsèquement désordonné qui est impliqué dans une variété de fusions oncogènes10. La nature intrinsèquement désordonnée et répétitive a entravé les efforts de compréhension des mécanismes moléculaires employés par le domaine EWS. Les efforts antérieurs pour étudier la structure-fonction ont largement eu recours à l’utilisation de différents mutants dans le contexte de tests de gènes rapporteurs ou dans des arrière-plans cellulaires qui ne parviennent pas à récapituler le contexte cellulaire pertinent, ou qui n’ont aucune variation structurelle produisant une fonction partielle significative11,17,25. La méthode présentée ici aborde ces questions. La cartographie structure-fonction est effectuée dans un contexte cellulaire pertinent pour la maladie et le séquençage de nouvelle génération permet le profilage transcriptomique pour évaluer la fonction du facteur de transcription dans le contexte de la chromatine native. Dans le cas spécifique du mutant DAF d’EWS/FLI, il a été rapporté que le DAF montrait peu d’activité dans les essais rapporteurs utilisant des éléments de réponse isolés, mais qu’il montrait une activité dans le contexte du promoteur complet du gène, soit dans un test rapporteur, soit dans la chromatine native, suggérant un phénotype23intéressant. L’utilisation de la méthode décrite ici résout plus directement la question de savoir quel type d’éléments régulateurs du génome sont les plus réactifs dans le contexte de la maladie. En testant simultanément tous les gènes cibles candidats dans leur contexte natif de chromatine, une approche transcriptomique est plus susceptible d’identifier des constructions à fonction partielle.
La force inhérente à l’utilisation d’un fond cellulaire pertinent pour la maladie est peut-être la plus grande limitation de cette technique. L’un des facteurs les plus importants est le choix du système cellulaire approprié pour ces expériences. De nombreuses lignées cellulaires dérivées de tumeurs malignes avec des facteurs de transcription pathognomoniques ne tolèrent pas facilement l’élimination de ce facteur de transcription et, dans de nombreux cas, en particulier pour les cancers pédiatriques, la véritable cellule d’origine reste controversée et l’expression de l’oncogène dans d’autres milieux cellulaires est prohibitivement toxique31,32 . Dans ces cas, il peut être utile d’effectuer des expériences dans un contexte cellulaire différent, à condition que le chercheur fasse preuve de prudence dans l’interprétation des résultats et valide de manière appropriée tout résultat pertinent dans un type de cellule plus pertinent pour la maladie.
Il est extrêmement important de valider soigneusement la stabilité et les conséquences phénotypiques de l’expression de l’oncogène et de ne soumettre que des échantillons pour le séquençage qui répondent à des critères stricts. Ici, cela comprenait le transfert western pour confirmer l’élimination et le sauvetage, et la qRT-PCR d’un petit nombre de gènes cibles connus pour valider le témoin positif(Figure 2). Il est également crucial de réduire autant que possible la variabilité des lots en effectuant soigneusement les préparations de cellules et d’ARN de la même manière que possible dans chaque lot.
La méthode décrite ici devient particulièrement puissante lorsqu’elle est associée à d’autres types de données génomiques qui parlent de la fonction pangénomique du facteur de transcription à l’étude. Les orientations futures de ce type d’analyse structure-fonction s’étendraient pour inclure ChIP-seq et ATAC-seq afin de déterminer la liaison du facteur de transcription et tout changement induit dans l’accessibilité de la chromatine. En tant que suite, ce type de données peut indiquer où différents composants structurels d’un facteur de transcription oncogénique contribuent à différents aspects de la fonction (c.-à-d. liaison à l’ADN vs modification de la chromatine vs recrutement co-régulateur). Dans l’ensemble, l’utilisation d’approches basées sur le NGS pour cartographier les relations structure-fonction des facteurs de transcription de fusion peut révéler de nouvelles connaissances sur les déterminants biochimiques de la fonction oncogène de ces protéines. Ceci est important pour approfondir notre compréhension des maladies qu’ils causent et pour permettre le développement de nouvelles stratégies thérapeutiques.
The authors have nothing to disclose.
Cette recherche a été soutenue par le High Performance Computing Facility de l’Abigail Wexner Research Institute du Nationwide Children’s Hospital. Ce travail a été soutenu par le National Institute of Health National Cancer Institute [U54 CA231641 à SLL, R01 CA183776 à SLL]; Alex’s Lemonade Stand Foundation [Prix du jeune chercheur à ERT]; Pelotonia [Bourse à l’ERT]; et la bourse biomédicale CJ Martin Overseas biomedical du Conseil national de la santé et de la recherche médicale [APP1111032 à KIP].
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |