Los dominios intrínsecamente desordenados son importantes para la función del factor de transcripción de fusión oncogénica. Para dirigirse terapéuticamente a estas proteínas, se requiere una comprensión más detallada de los mecanismos reguladores empleados por estos dominios. Aquí, utilizamos transcriptómica para mapear características estructurales importantes del dominio EWS intrínsecamente desordenado en el sarcoma de Ewing.
Muchos cánceres se caracterizan por translocaciones cromosómicas que resultan en la expresión de factores de transcripción de fusión oncogénica. Por lo general, estas proteínas contienen un dominio intrínsecamente desordenado (IDD) fusionado con el dominio de unión al ADN (DBD) de otra proteína y orquestan cambios transcripcionales generalizados para promover la malignidad. Estas fusiones son a menudo la única aberración genómica recurrente en los cánceres que causan, lo que las convierte en objetivos terapéuticos atractivos. Sin embargo, apuntar a los factores de transcripción oncogénicos requiere una mejor comprensión del papel mecanicista que desempeñan los IDD de baja complejidad en su función. El dominio N-terminal de EWSR1 es un IDD involucrado en una variedad de factores de transcripción de fusión oncogénica, incluyendo EWS/FLI, EWS/ATF y EWS/WT1. Aquí, utilizamos la secuenciación de ARN para investigar las características estructurales del dominio EWS importante para la función transcripcional de EWS / FLI en el sarcoma de Ewing. Se realiza el primer agotamiento mediado por shRNA de la fusión endógena de las células del sarcoma de Ewing junto con la expresión ectópica de una variedad de construcciones mutantes de EWS. Luego, la secuenciación de ARN se utiliza para analizar los transcriptomas de las células que expresan estas construcciones para caracterizar los déficits funcionales asociados con mutaciones en el dominio EWS. Al integrar los análisis transcriptómicos con información publicada previamente sobre motivos de unión al ADN EWS/FLI y localización genómica, así como ensayos funcionales para la capacidad de transformación, pudimos identificar características estructurales de EWS/FLI importantes para la oncogénesis y definir un nuevo conjunto de genes diana EWS/FLI críticos para el sarcoma de Ewing. Este artículo demuestra el uso de la secuenciación de ARN como método para mapear la relación estructura-función del dominio intrínsecamente desordenado de los factores de transcripción oncogénicos.
Un subconjunto de cánceres, incluyendo muchas neoplasias malignas de la infancia y la adolescencia, se caracterizan por translocaciones cromosómicas que generan nuevos oncogenes defusión1,2,3,4,5,6. Las proteínas de fusión resultantes funcionan con frecuencia como factores de transcripción oncogénicos, orquestando cambios generalizados en la regulación transcripcional para promover la tumorigénesis7,8. Los cánceres con estas translocaciones comúnmente poseen un paisaje mutacional por lo demás tranquilo, con pocas aberraciones genómicas recurrentes aparte de la fusión patognomónica4,9. Como tal, dirigirse directamente a la proteína de fusión es una estrategia terapéutica atractiva en estas enfermedades. Sin embargo, estos factores de transcripción oncogénicos comúnmente consisten en un dominio activador transcripcionalmente de baja complejidad, intrínsecamente desordenado, fusionado con un dominio de unión al ADN (DBD)10,11,12,13,14. Tanto los dominios intrínsecamente desordenados (IDD) como los DBD de estas proteínas han demostrado ser difíciles de atacar con los enfoques farmacológicos convencionales. El desarrollo de nuevos enfoques terapéuticos, por lo tanto, requiere una comprensión molecular más detallada de los mecanismos empleados por estas fusiones para regular aberrantemente la expresión génica.
La porción N-terminal idD de EWSR1 se fusiona comúnmente con una DBD en el cáncer, incluyendo EWS/FLI en el sarcoma de Ewing, EWS/WT1 en el tumor difuso de células pequeñas redondas y EWS/ATF1 en el sarcoma de células claras de partes blandas10. El papel mecanicista del EWS IDD en cada una de estas fusiones no se entiende completamente. La familia de fusiones EWS/ETS, específicamente EWS/FLI, es la más funcionalmente caracterizada hasta la fecha. EWS/FLI coordina los cambios epigenéticos y transcripcionales de todo el genoma que conducen a la activación y represión de miles de genes7,11,15,16. Los estudios han demostrado que el IDD es importante para el reclutamiento tanto de coactivadores transcripcionales (como p300, WDR5 y el complejo BAF), como de co-represores (como el complejo NuRD)11,15,17. La fusión del EWS IDD a la porción C-terminal de FLI1 confiere una nueva especificidad de unión al ADN al ETS DBD de FLI1, de modo que la oncoproteína de fusión (EWS/FLI) se une a regiones repetitivas de GGAA-microsatélites del genoma, además del motivo de consenso ETS18,19,20. Combinado con la función de reclutamiento de coactivadores, esta actividad emergente de unión al ADN de EWS/FLI promueve la formación de potenciadores de novo en los sitios de inicio de GGAA-microsatélites distales a la transcripción (TSS) (microsatélites “similares a potenciadores”) y recluta ARN polimerasa II para promover la transcripción en GGAA-microsatélites proximales a TSS (microsatélites “tipo promotor”)11,15,16,21.
Tomados en conjunto, estos datos nos llevaron a plantear la hipótesis de que los elementos discretos dentro del dominio EWS contribuyen al reclutamiento de distintos co-reguladores para diferentes tipos de sitios de unión EWS / FLI. Sin embargo, el discernimiento de estos elementos dentro de la porción de EWS de EWS / FLI, y cómo funcionan, se ha visto obstaculizado por la naturaleza altamente repetitiva y desordenada del dominio. Aquí utilizamos un sistema de rescate de derribo publicado anteriormente en células de sarcoma de Ewing para mapear funcionalmente estos elementos en el IDD de EWS. En este sistema, EWS / FLI se agota utilizando un shRNA dirigido a los 3’UTR del gen FLI1, y la expresión se rescata con diferentes construcciones de aDNc mutantes EWS / FLI que carecen de los 3’UTR7,17,22. Estos experimentos se centraron en constructos con varias deleciones para mapear la relación estructura-función entre el IDD del EWS y fenotipos oncogénicos importantes, incluida la activación de una construcción de reportero de microsatélites GGAA, ensayos de formación de colonias y validación dirigida de genes activados y reprimidos por EWS / FLI7,17,22 . Sin embargo, estos estudios no lograron encontrar subdominios discretos dentro del IDD de EWS en EWS / FLI que sean de importancia única para la activación o la represión. Todos los constructos probados fueron capaces de activar y reprimir genes diana específicos, lo que llevó a la formación eficiente de colonias, o incapaces de regular cualquiera de los genes diana EWS/FLI, lo que llevó a la pérdida de la formación de colonias7,17,22.
Los análisis transcriptómicos habilitados por la adopción generalizada de la secuenciación de próxima generación se utilizan comúnmente para comparar firmas de expresión génica en dos condiciones, con frecuencia en el contexto de estudios de detección o descriptivos. En su lugar, queríamos aprovechar la capacidad de capturar datos de expresión de todo el genoma utilizando la secuenciación de ARN (RNA-seq) para caracterizar las contribuciones de los IDD a la función del factor de transcripción. En este caso, RNA-seq se empareja con el sistema de derribo-rescate para explorar la relación estructura-función del dominio EWS. Este enfoque es aplicable a otros factores de transcripción de fusión, incluidas otras fusiones de EWS o factores de transcripción de tipo salvaje con una función poco conocida, y tiene múltiples ventajas sobre los otros ensayos utilizados para estudios de mapeo funcional, como ensayos de reportero o qRT-PCR dirigido. Estos incluyen la prueba de determinantes estructurales de la función en el contexto relevante de la cromatina, la capacidad de probar múltiples tipos de elementos de respuesta en un ensayo (es decir, activados y reprimidos, microsatélites GGAA y no microsatélites, etc.), y la capacidad resultante para detectar mejor la función parcial.
La implementación exitosa de este enfoque depende de un sistema basado en células que capture los fenotipos de interés (en este caso células A673 con agotamiento de EWS / FLI mediado por shRNA), y un panel de construcciones mutantes en un vector de expresión apropiado para el sistema basado en células (en este caso, pMSCV-hygro con varios mutantes EWS / FLI marcados con 3x-FLAG que se entregarán por transducción retroviral). Se recomienda la transducción viral de construcciones de agotamiento basadas en CRISPR, construcciones de agotamiento basadas en shRNA y construcciones de expresión de ADNc con la selección adecuada para generar líneas celulares estables sobre transfección transitoria. La interpretación posterior de los resultados se refuerza cuando los datos transcriptómicos se pueden emparejar con otros datos relacionados con la localización del factor de transcripción y otras lecturas fenotípicas cuando estén disponibles.
En este trabajo, aplicamos este enfoque para caracterizar la actividad del mutante DAF de EWS/FLI14. El mutante DAF tiene 17 mutaciones de tirosina a alanina en las regiones repetitivas del EWS IDD de EWS/FLI14. Este mutante EWS en particular había sido reportado previamente y es incapaz de activar la expresión génica del reportero cuando se fusiona con el ATF1 DBD14. Sin embargo, los datos preliminares de qRT-PCR sugirieron que este mutante fue capaz de activar la transcripción del objetivo EWS/FLI NR0B123. El enfoque transcriptómico descrito aquí permitió la detección exitosa de la función parcial del mutante DAF. Al emparejar estos datos transcriptómicos con información sobre motivos de unión y reconocimiento de EWS / FLI, mostramos además que el mutante DAF conserva la función en las repeticiones de microsatélites GGAA. Estos resultados identifican a DAF como el primer mutante EWS/FLI parcialmente funcional y resaltan la función en genes no microsatélites como importante para la oncogénesis (como se informó23). Esto demuestra el poder de este enfoque de mapeo de estructura-función transcriptómica para proporcionar información sobre la función de los factores de transcripción oncogénicos.
El estudio de los mecanismos bioquímicos de los factores de transcripción oncogénicos es de vital importancia para comprender las enfermedades que causan y diseñar nuevas estrategias terapéuticas. Esto es especialmente cierto en las neoplasias malignas caracterizadas por translocaciones cromosómicas que dan lugar a factores de transcripción de fusión. Los dominios incluidos en estas proteínas quiméricas pueden carecer de interacciones significativas con los dominios reguladores presentes en las proteínas de tipo salvaje, lo que complica la capacidad de interpretar la información estructura-función en el contexto de la fusión26,27,28. Además, muchas de estas fusiones oncogénicas se caracterizan por dominios intrínsecamente desordenados de baja complejidad10,13,29,30.
El dominio EWS es un ejemplo de tal dominio intrínsecamente desordenado que está involucrado en una variedad de fusiones oncogénicas10. La naturaleza intrínsecamente desordenada y repetitiva ha obstaculizado los esfuerzos para comprender los mecanismos moleculares empleados por el dominio EWS. Los esfuerzos previos para investigar la estructura-función han recurrido en gran medida al uso de diferentes mutantes en el contexto de ensayos de genes reporteros o en fondos celulares que no logran recapitular el contexto celular relevante, o carecen de variaciones estructurales que producen una función parcial significativa11,17,25. El método que se presenta aquí aborda estas cuestiones. El mapeo estructura-función se realiza en un contexto celular relevante para la enfermedad y la secuenciación de próxima generación permite el perfil transcriptómico para evaluar la función del factor de transcripción en el entorno de la cromatina nativa. En el caso específico del mutante DAF de EWS/FLI, se informó que DAF mostró poca actividad en ensayos reporteros utilizando elementos de respuesta aislados, pero que mostró actividad en el contexto del promotor genético completo, ya sea en un ensayo reportero o en cromatina nativa, lo que sugiere un fenotipo interesante23. El uso del método descrito aquí resuelve más directamente la cuestión de qué tipo de elementos reguladores en todo el genoma son más sensibles en el entorno de la enfermedad. Al probar todos los genes diana candidatos en su contexto de cromatina nativa simultáneamente, es más probable que un enfoque transcriptómico identifique construcciones con función parcial.
La fuerza inherente de usar un fondo celular relevante para la enfermedad es quizás la mayor limitación de esta técnica. Uno de los factores más importantes es elegir el sistema celular apropiado para estos experimentos. Muchas líneas celulares derivadas de neoplasias malignas con factores de transcripción patognomónicos no toleran fácilmente la eliminación de ese factor de transcripción, y en muchos casos, particularmente para los cánceres pediátricos, la verdadera célula de origen sigue siendo controvertida y la expresión del oncogén en otros fondos celulares es prohibitivamente tóxica31,32 . En estos casos, puede ser útil realizar experimentos en un fondo celular diferente, siempre y cuando el investigador tenga cuidado en la interpretación de los resultados y valide adecuadamente cualquier hallazgo relevante en un tipo de célula más relevante para la enfermedad.
Es de vital importancia validar cuidadosamente la estabilidad y las consecuencias fenotípicas de la expresión del oncogén y enviar solo muestras para secuenciación que cumplan con criterios estrictos. Aquí, esto incluyó western blot para confirmar el derribo y rescate, y qRT-PCR de un pequeño número de genes diana conocidos para validar el control positivo(Figura 2). También es crucial disminuir la mayor variabilidad de lotes posible realizando cuidadosamente las preparaciones de células y ARN de la manera más similar posible a través de cada lote.
El método descrito aquí se vuelve especialmente poderoso cuando se combina con otros tipos de datos genómicos que hablan de la función de todo el genoma del factor de transcripción en estudio. Las direcciones futuras para este tipo de análisis de estructura-función se ampliarían para incluir ChIP-seq y ATAC-seq para determinar la unión del factor de transcripción y cualquier cambio inducido en la accesibilidad a la cromatina. Como suite, este tipo de datos pueden apuntar a dónde los diferentes componentes estructurales de un factor de transcripción oncogénico contribuyen a diferentes aspectos de la función (es decir, la unión al ADN frente a la modificación de la cromatina frente al reclutamiento de co-reguladores). En general, el uso de enfoques basados en NGS para mapear las relaciones estructura-función de los factores de transcripción de fusión puede revelar nuevos conocimientos sobre los determinantes bioquímicos de la función oncogénica de estas proteínas. Esto es importante para mejorar nuestra comprensión de las enfermedades que causan y para permitir el desarrollo de nuevas estrategias terapéuticas.
The authors have nothing to disclose.
Esta investigación fue apoyada por el Centro de Computación de Alto Rendimiento en el Instituto de Investigación Abigail Wexner en el Nationwide Children’s Hospital. Este trabajo fue apoyado por el Instituto Nacional del Cáncer de los Institutos Nacionales de Salud [U54 CA231641 a SLL, R01 CA183776 a SLL]; Alex’s Lemonade Stand Foundation [Premio al Joven Investigador a ERT]; Pelotonia [Beca a ERT]; y el National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 a KIP].
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |