I domini intrinsecamente disordinati sono importanti per la funzione del fattore di trascrizione di fusione oncogenica. Per indirizzare terapeuticamente queste proteine, è necessaria una comprensione più dettagliata dei meccanismi di regolazione impiegati da questi domini. Qui, usiamo la trascrittomica per mappare importanti caratteristiche strutturali del dominio EWS intrinsecamente disordinato nel sarcoma di Ewing.
Molti tumori sono caratterizzati da traslocazioni cromosomiche che provocano l’espressione di fattori di trascrizione di fusione oncogenici. Tipicamente, queste proteine contengono un dominio intrinsecamente disordinato (IDD) fuso con il dominio di legame al DNA (DBD) di un’altra proteina e orchestrano cambiamenti trascrizionali diffusi per promuovere la malignità. Queste fusioni sono spesso l’unica aberrazione genomica ricorrente nei tumori che causano, rendendoli bersagli terapeutici attraenti. Tuttavia, il targeting dei fattori di trascrizione oncogenici richiede una migliore comprensione del ruolo meccanicistico che gli IDD a bassa complessità svolgono nella loro funzione. Il dominio N-terminale di EWSR1 è un IDD coinvolto in una varietà di fattori di trascrizione di fusione oncogenica, tra cui EWS / FLI, EWS / ATF e EWS / WT1. Qui, usiamo il sequenziamento dell’RNA per studiare le caratteristiche strutturali del dominio EWS importanti per la funzione trascrizionale di EWS / FLI nel sarcoma di Ewing. Viene eseguita la prima deplezione mediata da shRNA della fusione endogena da cellule di sarcoma di Ewing accoppiata con l’espressione ectopica di una varietà di costrutti mutanti EWS. Quindi il sequenziamento dell’RNA viene utilizzato per analizzare i trascrittomi delle cellule che esprimono questi costrutti per caratterizzare i deficit funzionali associati alle mutazioni nel dominio EWS. Integrando le analisi trascrittomiche con le informazioni precedentemente pubblicate sui motivi di legame del DNA EWS / FLI e la localizzazione genomica, nonché i saggi funzionali per la capacità di trasformazione, siamo stati in grado di identificare le caratteristiche strutturali di EWS / FLI importanti per l’oncogenesi e definire un nuovo set di geni bersaglio EWS / FLI critici per il sarcoma di Ewing. Questo articolo dimostra l’uso del sequenziamento dell’RNA come metodo per mappare la relazione struttura-funzione del dominio intrinsecamente disordinato dei fattori di trascrizione oncogenici.
Un sottogruppo di tumori, tra cui molte neoplasie maligne dell’infanzia e dell’adolescenza, sono caratterizzate da traslocazioni cromosomiche che generano nuovi oncogeni di fusione1,2,3,4,5,6. Le proteine di fusione risultanti funzionano frequentemente come fattori di trascrizione oncogenici, orchestrando cambiamenti diffusi nella regolazione trascrizionale per promuovere la tumorigenesi7,8. I tumori con queste traslocazioni possiedono comunemente un paesaggio mutazionale altrimenti tranquillo, con poche aberrazioni genomiche ricorrenti a parte la fusione patognomonica4,9. Pertanto, il targeting diretto della proteina di fusione è una strategia terapeutica interessante in queste malattie. Tuttavia, questi fattori di trascrizione oncogenici consistono comunemente in un dominio a bassa complessità, intrinsecamente disordinato, che attiva trascrizionalmente fuso con un dominio di legame al DNA (DBD)10,11, 12,13,14. Sia i domini intrinsecamente disordinati (IDD) che i DBD di queste proteine si sono dimostrati difficili da colpire con approcci farmacologici convenzionali. Lo sviluppo di nuovi approcci terapeutici, quindi, richiede una comprensione molecolare più dettagliata dei meccanismi impiegati da queste fusioni per regolare aberrantemente l’espressione genica.
La porzione IDD N-terminale di EWSR1 è comunemente fusa con una DBD nel cancro, tra cui EWS / FLI nel sarcoma di Ewing, EWS / WT1 nel tumore diffuso a piccole cellule rotonde e EWS / ATF1 nel sarcoma a cellule chiare delle parti molli10. Il ruolo meccanicistico dell’IDD EWS in ciascuna di queste fusioni non è completamente compreso. La famiglia di fusioni EWS/ETS, in particolare EWS/FLI, è la più funzionalmente caratterizzata fino ad oggi. EWS/FLI coordina i cambiamenti epigenetici e trascrizionali a livello di genoma che portano all’attivazione e alla repressione di migliaia di geni7,11,15,16. Gli studi hanno dimostrato che l’IDD è importante per il reclutamento sia di co-attivatori trascrizionali (come p300, WDR5 e il complesso BAF), sia di co-repressori (come il complesso NuRD)11,15,17. La fusione dell’IDD EWS con la porzione C-terminale di FLI1 conferisce una nuova specificità di legame del DNA alla DBD ETS di FLI1, tale che l’oncoproteina di fusione (EWS/FLI) si lega a regioni ripetitive del genoma GGAA-microsatellite oltre al motivo ETS di consenso18,19,20. In combinazione con la funzione di reclutamento del co-attivatore, questa attività emergente di legame al DNA di EWS / FLI promuove la formazione di potenziatori de novo nei siti di inizio della trascrizione distale a GGAA -microsatelliti distali (TSS) (microsatelliti “enhancer-like”) e recluta RNA polimerasi II per promuovere la trascrizione a GGAA-microsatelliti prossimali a TSS (microsatelliti “promoter-like”)11,15,16,21.
Presi insieme, questi dati ci hanno portato a ipotizzare che elementi discreti all’interno del dominio EWS contribuiscano al reclutamento di co-regolatori distinti in diversi tipi di siti di legame EWS / FLI. Tuttavia, discernere questi elementi all’interno della porzione EWS di EWS / FLI e come funzionano, è stato ostacolato dalla natura altamente ripetitiva e disordinata del dominio. Qui utilizziamo un sistema di knockdown-rescue precedentemente pubblicato nelle cellule del sarcoma di Ewing per mappare funzionalmente questi elementi nell’IDD EWS. In questo sistema EWS/FLI viene impoverito utilizzando uno shRNA mirato al 3’UTR del gene FLI1, e l’espressione viene salvata con vari costrutti cDNA mutanti EWS/FLI privi del 3’UTR7,17,22. Questi esperimenti si sono concentrati su costrutti con varie delezioni per mappare la relazione struttura-funzione tra l’IDD EWS e importanti fenotipi oncogeni, tra cui l’attivazione di un costrutto reporter GGAA-microsatellite, saggi di formazione di colonie e convalida mirata di geni attivati e repressi da EWS / FLI7,17,22 . Tuttavia, questi studi non sono riusciti a trovare sottodomini discreti all’interno dell’IDD EWS in EWS / FLI che sono di importanza univoca per l’attivazione o la repressione. Tutti i costrutti testati erano in grado di attivare e reprimere specifici geni bersaglio, portando a un’efficiente formazione di colonie, o incapaci di regolare nessuno dei geni bersaglio EWS / FLI, portando alla perdita della formazione della colonia7,17,22.
Le analisi trascrittomiche rese possibili dall’adozione diffusa del sequenziamento di nuova generazione sono comunemente utilizzate per confrontare le firme di espressione genica in due condizioni, spesso nel contesto di screening o studi descrittivi. Volevamo invece sfruttare la capacità di acquisire dati di espressione a livello di genoma utilizzando il sequenziamento dell’RNA (RNA-seq) per caratterizzare i contributi degli IDD alla funzione del fattore di trascrizione. In questo caso RNA-seq è accoppiato con il sistema knockdown-rescue per esplorare la relazione struttura-funzione del dominio EWS. Questo approccio è applicabile ad altri fattori di trascrizione di fusione, comprese altre fusioni EWS o fattori di trascrizione wildtype con funzione poco compresa, e presenta molteplici vantaggi rispetto agli altri saggi utilizzati per studi di mappatura funzionale, come saggi reporter o qRT-PCR mirata. Questi includono il test dei determinanti strutturali della funzione nel contesto della cromatina pertinente, la capacità di testare più tipi di elementi di risposta in un unico test (cioè attivato e represso, GGAA-microsatellite e non microsatellite, ecc.) e la conseguente capacità di rilevare meglio la funzione parziale.
Il successo dell’implementazione di questo approccio dipende da un sistema basato su cellule che cattura i fenotipi di interesse (in questo caso cellule A673 con deplezione EWS/FLI mediata da shRNA) e da un pannello di costrutti mutanti in un vettore di espressione appropriato per il sistema basato su cellule (in questo caso, pMSCV-hygro con vari mutanti EWS/FLI 3x-FLAG-tagged da erogare per trasduzione retrovirale). La trasduzione virale di costrutti di deplezione basati su CRISPR, costrutti di deplezione basati su shRNA e costrutti di espressione del cDNA con una selezione appropriata per generare linee cellulari stabili è raccomandata rispetto alla trasfezione transitoria. L’interpretazione a valle dei risultati è rafforzata quando i dati trascrittomici possono essere abbinati ad altri dati relativi alla localizzazione del fattore di trascrizione e ad altre letture fenotipiche ove disponibili.
In questo articolo, applichiamo questo approccio per caratterizzare l’attività del mutante DAF di EWS / FLI14. Il mutante DAF ha 17 mutazioni da tirosina ad alanina nelle regioni ripetitive dell’EWS IDD di EWS/FLI14. Questo particolare mutante EWS era stato precedentemente riportato e non è in grado di attivare l’espressione genica reporter quando fuso con l’ATF1 DBD14. Tuttavia, i dati preliminari della qRT-PCR hanno suggerito che questo mutante è stato in grado di attivare la trascrizione del bersaglio EWS/FLI NR0B123. L’approccio trascrittomico qui descritto ha permesso di rilevare con successo la funzione parziale del mutante DAF. Accoppiando questi dati trascrittomici con informazioni sui motivi di legame e riconoscimento EWS/FLI dimostriamo inoltre che il mutante DAF mantiene la funzione alle ripetizioni GGAA-microsatellite. Questi risultati identificano DAF come il primo mutante EWS/FLI parzialmente funzionale ed evidenziano la funzione nei geni non microsatelliti come importante per l’oncogenesi (come riportato23). Ciò dimostra la potenza di questo approccio di mappatura struttura-funzione trascrittomica per fornire informazioni sulla funzione dei fattori di trascrizione oncogenici.
Studiare i meccanismi biochimici dei fattori di trascrizione oncogenici è di fondamentale importanza per comprendere le malattie che causano e per progettare nuove strategie terapeutiche. Ciò è particolarmente vero nelle neoplasie maligne caratterizzate da traslocazioni cromosomiche con conseguente fattori di trascrizione della fusione. I domini inclusi in queste proteine chimeriche possono mancare di interazioni significative con i domini regolatori presenti nelle proteine wild-type, complicando la capacità di interpretare le informazioni struttura-funzione nel contesto della fusione26,27,28. Inoltre, molte di queste fusioni oncogeniche sono caratterizzate da domini intrinsecamente disordinati a bassa complessità10,13,29,30.
Il dominio EWS è un esempio di un dominio intrinsecamente disordinato che è coinvolto in una varietà di fusioni oncogeniche10. La natura intrinsecamente disordinata e ripetitiva ha ostacolato gli sforzi per comprendere i meccanismi molecolari impiegati dal dominio EWS. Gli sforzi precedenti per studiare la struttura-funzione hanno in gran parte fatto ricorso all’uso di diversi mutanti nel contesto di saggi genici reporter o in background cellulari che non riescono a ricapitolare il contesto cellulare pertinente, o mancano di variazioni strutturali che producono una funzione parziale significativa11,17,25. Il metodo qui presentato affronta questi problemi. La mappatura struttura-funzione viene eseguita in un contesto cellulare rilevante per la malattia e il sequenziamento di nuova generazione consente la profilazione trascrittomica per valutare la funzione del fattore di trascrizione nel setting della cromatina nativa. Nel caso specifico del mutante DAF di EWS/FLI, DAF è stato segnalato per mostrare poca attività nei saggi reporter utilizzando elementi di risposta isolati, ma per mostrare attività nel contesto del promotore genetico completo, sia in un test reporter che in cromatina nativa, suggerendo un fenotipointeressante 23. L’uso del metodo qui descritto risolve più direttamente la questione di quale tipo di elementi regolatori attraverso il genoma sono più reattivi nel contesto della malattia. Testando contemporaneamente tutti i geni bersaglio candidati nel loro contesto nativo di cromatina, un approccio trascrittomico ha maggiori probabilità di identificare costrutti con funzione parziale.
La forza intrinseca dell’utilizzo di uno sfondo cellulare rilevante per la malattia è forse il più grande limite di questa tecnica. Uno dei fattori più importanti è la scelta del sistema cellulare appropriato per questi esperimenti. Molte linee cellulari derivate da tumori maligni con fattori di trascrizione patognomonici non tollerano prontamente l’abbattimento di quel fattore di trascrizione, e in molti casi, in particolare per i tumori pediatrici, la vera cellula di origine rimane controversa e l’espressione dell’oncogene in altri background cellulari è proibitivamente tossica31,32 . In questi casi, può essere utile eseguire esperimenti in un diverso background cellulare, purché il ricercatore eserciti cautela nell’interpretazione dei risultati e convalidi in modo appropriato qualsiasi risultato rilevante in un tipo di cellula più rilevante per la malattia.
È di fondamentale importanza convalidare attentamente la stabilità e le conseguenze fenotipiche dell’espressione dell’oncogene e presentare solo campioni per il sequenziamento che soddisfano criteri rigorosi. Qui, questo includeva western blot per confermare l’abbattimento e il salvataggio e qRT-PCR di un piccolo numero di geni bersaglio noti per convalidare il controllo positivo (Figura 2). Allo stesso modo è fondamentale ridurre la massima variabilità possibile dei lotti eseguendo attentamente i preparati cellulari e di RNA nel modo più simile possibile attraverso ciascun lotto.
Il metodo qui descritto diventa particolarmente potente se abbinato ad altri tipi di dati genomici che parlano della funzione genome-wide del fattore di trascrizione in studio. Le direzioni future per questo tipo di analisi struttura-funzione si espanderebbero per includere ChIP-seq e ATAC-seq per determinare il legame del fattore di trascrizione e qualsiasi cambiamento indotto nell’accessibilità della cromatina. Come suite, questo tipo di dati può indicare dove diversi componenti strutturali di un fattore di trascrizione oncogenico contribuiscono a diversi aspetti della funzione (cioè legame al DNA vs modifica della cromatina vs reclutamento co-regolatore). Nel complesso, l’utilizzo di approcci basati su NGS per mappare le relazioni struttura-funzione dei fattori di trascrizione della fusione può rivelare nuove intuizioni nei determinanti biochimici della funzione oncogenica di queste proteine. Questo è importante per approfondire la nostra comprensione delle malattie che causano e per consentire lo sviluppo di nuove strategie terapeutiche.
The authors have nothing to disclose.
Questa ricerca è stata supportata dalla High Performance Computing Facility presso l’Abigail Wexner Research Institute del Nationwide Children’s Hospital. Questo lavoro è stato supportato dal National Institutes of Health National Cancer Institute [U54 CA231641 a SLL, R01 CA183776 a SLL]; Alex’s Lemonade Stand Foundation [Young Investigator Award a ERT]; Pelotonia [Fellowship to ERT]; e il National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 a KIP].
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |