Intrinsiek ongeordende domeinen zijn belangrijk voor de functie van de oncogene fusietranscriptiefactor. Om deze eiwitten therapeutisch te targeten, is een meer gedetailleerd begrip van de regulerende mechanismen die door deze domeinen worden gebruikt, vereist. Hier gebruiken we transcriptomics om belangrijke structurele kenmerken van het intrinsiek ongeordende EWS-domein in Ewing-sarcoom in kaart te brengen.
Veel kankers worden gekenmerkt door chromosomale translocaties die resulteren in de expressie van oncogene fusietranscriptiefactoren. Typisch bevatten deze eiwitten een intrinsiek ongeordend domein (IDD) gefuseerd met het DNA-bindende domein (DBD) van een ander eiwit en orkestreren wijdverspreide transcriptionele veranderingen om maligniteit te bevorderen. Deze fusies zijn vaak de enige terugkerende genomische aberratie in de kankers die ze veroorzaken, waardoor ze aantrekkelijke therapeutische doelen zijn. Het richten op oncogene transcriptiefactoren vereist echter een beter begrip van de mechanistische rol die idd’s met een lage complexiteit spelen in hun functie. Het N-terminale domein van EWSR1 is een IDD die betrokken is bij een verscheidenheid aan oncogene fusietranscriptiefactoren, waaronder EWS / FLI, EWS / ATF en EWS / WT1. Hier gebruiken we RNA-sequencing om de structurele kenmerken van het EWS-domein te onderzoeken die belangrijk zijn voor de transcriptionele functie van EWS / FLI in Ewing-sarcoom. Eerst wordt shRNA-gemedieerde uitputting van de endogene fusie van Ewing-sarcoomcellen in combinatie met ectopische expressie van een verscheidenheid aan EWS-mutante constructen uitgevoerd. Vervolgens wordt RNA-sequencing gebruikt om de transcriptomen van cellen die deze constructen tot expressie brengen te analyseren om de functionele tekorten geassocieerd met mutaties in het EWS-domein te karakteriseren. Door de transcriptomische analyses te integreren met eerder gepubliceerde informatie over EWS / FLI DNA-bindingsmotieven en genomische lokalisatie, evenals functionele testen voor het transformeren van vermogen, waren we in staat om structurele kenmerken van EWS / FLI te identificeren die belangrijk zijn voor oncogenese en een nieuwe set EWS / FLI-doelgenen te definiëren die cruciaal zijn voor Ewing-sarcoom. Dit artikel demonstreert het gebruik van RNA-sequencing als een methode om de structuur-functierelatie van het intrinsiek ongeordende domein van oncogene transcriptiefactoren in kaart te brengen.
Een subset van kankers, waaronder veel maligniteiten van de kindertijd en adolescentie, worden gekenmerkt door chromosomale translocaties die nieuwe fusie-oncogenen genereren1,2,3,4,5,6. De resulterende fusie-eiwitten functioneren vaak als oncogene transcriptiefactoren en orkestreren wijdverspreide veranderingen in transcriptionele regulatie om tumorigenese te bevorderen7,8. Kankers met deze translocaties bezitten gewoonlijk een verder rustig mutatielandschap, met weinig terugkerende genomische aberraties afgezien van de pathognomonische fusie4,9. Als zodanig is het direct richten op het fusie-eiwit een aantrekkelijke therapeutische strategie bij deze ziekten. Deze oncogene transcriptiefactoren bestaan echter vaak uit een laagcomplex, intrinsiek ongeordend, transcriptioneel activerend domein gefuseerd met een DNA-bindend domein (DBD)10,11,12,13,14. Zowel de intrinsiek ongeordende domeinen (IDD’s) als DBD’s van deze eiwitten zijn moeilijk te targeten gebleken met conventionele farmacologische benaderingen. De ontwikkeling van nieuwe therapeutische benaderingen vereist daarom een meer gedetailleerd moleculair begrip van de mechanismen die door deze fusies worden gebruikt om genexpressie op afwijkende wijze te reguleren.
Het N-terminale IDD-gedeelte van EWSR1 wordt vaak gefuseerd met een DBD bij kanker, waaronder EWS / FLI in Ewing-sarcoom, EWS / WT1 in diffuse kleine ronde celtumor en EWS / ATF1 in heldercellig sarcoom van zachte delen10. De mechanistische rol van de EWS IDD in elk van deze fusies is onvolledig begrepen. De EWS/ETS-familie van fusies, met name EWS/FLI, is de meest functioneel gekarakteriseerde tot nu toe. EWS/FLI coördineert genoombrede epigenetische en transcriptionele veranderingen die leiden tot de activering en onderdrukking van duizenden genen7,11,15,16. Studies hebben aangetoond dat de IDD belangrijk is voor de rekrutering van zowel transcriptionele co-activatoren (zoals p300, WDR5 en het BAF-complex), als co-onderdrukkers (zoals het NuRD-complex)11,15,17. De fusie van de EWS IDD met het C-terminale deel van FLI1 verleent nieuwe DNA-bindende specificiteit aan de ETS DBD van FLI1, zodanig dat de fusie oncoproteïne (EWS / FLI) bindt aan repetitieve GGAA-microsatellietgebieden van het genoom naast het consensus ETS-motief18,19,20. In combinatie met de co-activator rekruteringsfunctie bevordert deze emergente DNA-bindende activiteit van EWS /FLI de novo enhancervorming op GGAA-microsatellieten distale naar transcriptiestartplaatsen (TSS) (“enhancer-achtige” microsatellieten) en rekruteert RNA-polymerase II om transcriptie te bevorderen bij GGAA-microsatellieten proximaal aan TSS (“promotor-achtige” microsatellieten)11,15,16,21.
Alles bij elkaar hebben deze gegevens ons ertoe gebracht te veronderstellen dat discrete elementen binnen het EWS-domein bijdragen aan de werving van verschillende co-regulatoren voor verschillende soorten EWS / FLI-bindingssites. Het onderscheiden van deze elementen binnen het EWS-gedeelte van EWS/FLI, en hoe ze functioneren, is echter belemmerd door de zeer repetitieve en ongeordende aard van het domein. Hier gebruiken we een eerder gepubliceerd knockdown-rescue-systeem in Ewing-sarcoomcellen om deze elementen functioneel in kaart te brengen in de EWS IDD. In dit systeem wordt EWS/FLI uitgeput met behulp van een shRNA gericht op de 3’UTR van het FLI1 gen, en expressie wordt gered met verschillende EWS/FLI mutante cDNA constructen zonder de 3’UTR7,17,22. Deze experimenten richtten zich op constructies met verschillende deleties om de structuur-functierelatie tussen de EWS IDD en belangrijke oncogene fenotypes in kaart te brengen, waaronder activering van een GGAA-microsatelliet reporter construct, kolonievormingstests en gerichte validatie van EWS / FLI-geactiveerde en -onderdrukte genen7,17,22 . Deze studies slaagden er echter niet in om afzonderlijke subdomeinen binnen de EWS IDD in EWS / FLI te vinden die uniek belangrijk zijn voor activering of repressie. Alle geteste constructies waren ofwel in staat om specifieke doelgenen te activeren en te onderdrukken, wat leidde tot efficiënte kolonievorming, of niet in staat om een van de EWS / FLI-doelgenen te reguleren, wat leidde tot verlies van kolonievorming7,17,22.
Transcriptomische analyses die mogelijk worden gemaakt door de wijdverspreide toepassing van de volgende generatie sequencing worden vaak gebruikt om genexpressiehandtekeningen in twee omstandigheden te vergelijken, vaak in de context van screening of beschrijvende studies. In plaats daarvan wilden we gebruik maken van de mogelijkheid om genoombrede expressiegegevens vast te leggen met behulp van RNA-sequencing (RNA-seq) om de bijdragen van IDD’s aan de transcriptiefactorfunctie te karakteriseren. In dit geval wordt RNA-seq gekoppeld aan het knockdown-rescue-systeem om de structuur-functierelatie van het EWS-domein te onderzoeken. Deze benadering is van toepassing op andere fusietranscriptiefactoren, waaronder andere EWS-fusies of wildtype-transcriptiefactoren met een slecht begrepen functie, en heeft meerdere voordelen ten opzichte van de andere assays die worden gebruikt voor functionele mappingstudies, zoals reporter-assays of gerichte qRT-PCR. Deze omvatten het testen van structurele determinanten van functie in de relevante chromatinecontext, het vermogen om meerdere soorten responselementen in één test te testen (d.w.z. geactiveerd en onderdrukt, GGAA-microsatelliet en niet-microsatelliet, enz.), En het resulterende vermogen om gedeeltelijke functie beter te detecteren.
Succesvolle implementatie van deze aanpak hangt af van een celgebaseerd systeem dat de fenotypen van belang vastlegt (in dit geval A673-cellen met shRNA-gemedieerde EWS / FLI-depletie) en een panel van mutante constructen in een expressievector die geschikt is voor het celgebaseerde systeem (in dit geval pMSCV-hygro met verschillende 3x-FLAG-gelabelde EWS / FLI-mutanten die moeten worden afgeleverd door retrovirale transductie). Virale transductie van crispr-gebaseerde depletieconstructies, shRNA-gebaseerde depletieconstructies en cDNA-expressieconstructies met de juiste selectie om stabiele cellijnen te genereren, wordt aanbevolen boven voorbijgaande transfectie. De downstream-interpretatie van resultaten wordt versterkt wanneer de transcriptomische gegevens kunnen worden gecombineerd met andere gegevens met betrekking tot lokalisatie van de transcriptiefactor en andere fenotypische uitlezingen waar beschikbaar.
In dit artikel passen we deze benadering toe om de activiteit van de DAF-mutant van EWS/FLI14te karakteriseren. De DAF-mutant heeft 17 tyrosine- tot alaninemutaties in de repetitieve gebieden van de EWS IDD van EWS/FLI14. Deze specifieke EWS-mutant was eerder gemeld en is niet in staat om reporter-genexpressie te activeren wanneer deze is gefuseerd met de ATF1 DBD14. Voorlopige qRT-PCR-gegevens suggereerden echter dat deze mutant in staat was om transcriptie van het EWS / FLI-doel NR0B123te activeren. De transcriptomische benadering die hier wordt beschreven, maakte een succesvolle detectie van de partiële functie van de DAF-mutant mogelijk. Door deze transcriptomische gegevens te koppelen aan informatie over EWS/FLI bindings- en herkenningsmotieven laten we verder zien dat de DAF mutant functie behoudt bij GGAA-microsatelliet repeats. Deze resultaten identificeren DAF als de eerste gedeeltelijk functionele EWS/FLI-mutant en benadrukken de functie bij niet-microsatellietgenenen als belangrijk voor oncogenese (zoals gerapporteerd23). Dit toont de kracht aan van deze transcriptomische structuur-functie mapping benadering om inzicht te geven in de functie van oncogene transcriptiefactoren.
Het bestuderen van de biochemische mechanismen van oncogene transcriptiefactoren is van cruciaal belang om de ziekten die ze veroorzaken te begrijpen en om nieuwe therapeutische strategieën te ontwerpen. Dit geldt vooral bij maligniteiten die worden gekenmerkt door chromosomale translocaties die resulteren in fusietranscriptiefactoren. De domeinen die in deze chimere eiwitten zijn opgenomen, missen mogelijk zinvolle interacties met regulerende domeinen die aanwezig zijn in de wild-type eiwitten, wat het vermogen om structuur-functie-informatie te interpreteren in de context van de fusiebemoeilijkt 26,27,28. Bovendien worden veel van deze oncogene fusies gekenmerkt door intrinsiek ongeordende domeinen met een lage complexiteit10,13,29,30.
Het EWS-domein is een voorbeeld van zo’n intrinsiek ongeordend domein dat betrokken is bij een verscheidenheid aan oncogene fusies10. De intrinsiek ongeordende en repetitieve aard heeft de inspanningen belemmerd om de moleculaire mechanismen te begrijpen die door het EWS-domein worden gebruikt. Eerdere pogingen om de structuurfunctie te onderzoeken, hebben grotendeels hun toevlucht genomen tot het gebruik van verschillende mutanten in de context van reporter-gentests of in celachtergronden die de relevante cellulaire context niet samenvatten, of geen structurele variaties hebben die zinvolle partiële functieproduceren 11,17,25. De hier gepresenteerde methode pakt deze problemen aan. Structuur-functie mapping wordt uitgevoerd in een ziekte-relevante celcontext en next generation sequencing maakt transcriptomische profilering mogelijk om transcriptiefactorfunctie te evalueren in de setting van native chromatine. In het specifieke geval van de DAF-mutant van EWS/FLI werd gemeld dat DAF weinig activiteit vertoonde in reporter-assays met behulp van geïsoleerde responselementen, maar activiteit vertoonde in de context van de volledige genpromotor, hetzij in een reporter-assay of in native chromatine, wat een interessant fenotype23suggereert. Het gebruik van de hier beschreven methode lost directer de vraag op welk type regulerende elementen in het genoom het meest responsief zijn in de ziekteomgeving. Door alle kandidaat-doelgenen tegelijkertijd in hun oorspronkelijke chromatinecontext te testen, is het waarschijnlijker dat een transcriptomische benadering constructen met gedeeltelijke functie identificeert.
De inherente kracht van het gebruik van een ziekterelevante celachtergrond is misschien wel de grootste beperking van deze techniek. Een van de belangrijkste factoren is het kiezen van het juiste celsysteem voor deze experimenten. Veel cellijnen afgeleid van maligniteiten met pathognomonische transcriptiefactoren tolereren niet gemakkelijk knockdown van die transcriptiefactor, en in veel gevallen, met name voor pediatrische kankers, blijft de ware cel van oorsprong controversieel en is de expressie van het oncogen in andere celachtergronden onbetaalbaartoxisch 31,32 . In deze gevallen kan het nuttig zijn om experimenten uit te voeren in een andere celachtergrond, zolang de onderzoeker voorzichtig is bij de interpretatie van de resultaten en alle relevante bevindingen in een meer ziekterelevant celtype op de juiste manier valideert.
Het is van cruciaal belang om de stabiliteit en fenotypische gevolgen van expressie van het oncogen zorgvuldig te valideren en alleen monsters voor sequencing in te dienen die aan strikte criteria voldoen. Hier omvatte dit western blot om knockdown en redding te bevestigen, en qRT-PCR van een klein aantal bekende doelgenen om de positieve controle te valideren(figuur 2). Het is ook cruciaal om zoveel mogelijk batchvariabiliteit te verminderen door de cel- en RNA-preparaten zorgvuldig zo gelijk mogelijk uit te voeren door elke batch.
De hier beschreven methode wordt vooral krachtig in combinatie met andere soorten genomische gegevens die spreken over de genoombrede functie van de transcriptiefactor die wordt bestudeerd. Toekomstige richtingen voor dit type structuurfunctieanalyse zouden worden uitgebreid met ChIP-seq en ATAC-seq om de binding van de transcriptiefactor en eventuele geïnduceerde veranderingen in chromatinetoegankelijkheid te bepalen. Als suite kan dit type gegevens erop wijzen dat verschillende structurele componenten van een oncogene transcriptiefactor bijdragen aan verschillende aspecten van de functie (d.w.z. DNA-binding versus chromatinemodificatie versus co-regulator rekrutering). Over het algemeen kan het gebruik van op NGS gebaseerde benaderingen om de structuur-functierelaties van fusietranscriptiefactoren in kaart te brengen, nieuwe inzichten onthullen in de biochemische determinanten van de oncogene functie van deze eiwitten. Dit is belangrijk om ons begrip van de ziekten die ze veroorzaken te vergroten en om de ontwikkeling van nieuwe therapeutische strategieën mogelijk te maken.
The authors have nothing to disclose.
Dit onderzoek werd ondersteund door de High Performance Computing Facility van het Abigail Wexner Research Institute in het Nationwide Children’s Hospital. Dit werk werd ondersteund door het National Institutes of Health National Cancer Institute [U54 CA231641 naar SLL, R01 CA183776 naar SLL]; Alex’s Lemonade Stand Foundation [Young Investigator Award aan ERT]; Pelotonia [Fellowship aan ERT]; en de National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 naar KIP].
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |