Domínios intrinsecamente desordenados são importantes para a função do fator de transcrição de fusão oncogênica. Para atingir terapeuticamente essas proteínas, é necessário uma compreensão mais detalhada dos mecanismos regulatórios utilizados por esses domínios. Aqui, usamos transcrição para mapear características estruturais importantes do domínio EWS intrinsecamente desordenado no sarcoma Ewing.
Muitos cânceres são caracterizados por translocações cromossômicas que resultam na expressão de fatores de transcrição da fusão oncogênica. Tipicamente, essas proteínas contêm um domínio intrinsecamente desordenado (IDD) fundido com o domínio de vinculação de DNA (DBD) de outra proteína e orquestram mudanças transcricionais generalizadas para promover a malignidade. Essas fusões são muitas vezes a única aberração genômica recorrente nos cânceres que causam, tornando-os alvos terapêuticos atraentes. No entanto, direcionar fatores de transcrição oncogênica requer uma melhor compreensão do papel mecanicista que as IDDs de baixa complexidade desempenham em sua função. O domínio n-terminal do EWSR1 é um IDD envolvido em uma variedade de fatores de transcrição de fusão oncogênica, incluindo EWS/FLI, EWS/ATF e EWS/WT1. Aqui, usamos o sequenciamento de RNA para investigar as características estruturais do domínio EWS importante para a função transcricional do EWS/FLI no sarcoma Ewing. Primeiro esgotamento mediado por shRNA da fusão endógena das células de sarcoma de Ewing emparelhadas com expressão ectópica de uma variedade de construções mutantes EWS é realizada. Em seguida, o sequenciamento de RNA é usado para analisar os transcriptomes de células expressando esses construtos para caracterizar os déficits funcionais associados a mutações no domínio EWS. Ao integrar as análises transcriômicas com informações publicadas anteriormente sobre motivos de ligação de DNA EWS/FLI e localização genômica, bem como ensaios funcionais para a transformação da capacidade de transformação, conseguimos identificar características estruturais do EWS/FLI importantes para a oncogênese e definir um novo conjunto de genes-alvo EWS/FLI críticos para sarcoma Ewing. Este artigo demonstra o uso do sequenciamento de RNA como método para mapear a relação estrutura-função do domínio intrinsecamente desordenado de fatores de transcrição oncogênica.
Um subconjunto de cânceres, incluindo muitas malignidades da infância e adolescência, são caracterizados por translocações cromossômicas que geram nova fusão oncogenes1,2,3,4,5,6. As proteínas de fusão resultantes frequentemente funcionam como fatores de transcrição oncogênica, orquestrando mudanças generalizadas na regulação transcricional para promover a tumorigênese7,8. Os cânceres com essas translocações geralmente possuem uma paisagem mutacional silenciosa, com poucas aberrações genômicas recorrentes além da fusão pathognomônica4,9. Como tal, direcionar diretamente a proteína de fusão é uma estratégia terapêutica atraente nessas doenças. No entanto, esses fatores de transcrição oncogênica consistem comumente em um domínio de baixa complexidade, intrinsecamente desordenado, transcriptionalmente ativado fundido com um domínio de vinculação de DNA (DBD)10,11,12,13,14. Tanto os domínios intrinsecamente desordenados (IDDs) quanto os DBDs dessas proteínas têm se mostrado difíceis de atingir com abordagens farmacológicas convencionais. O desenvolvimento de novas abordagens terapêuticas, portanto, requer uma compreensão molecular mais detalhada dos mecanismos empregados por essas fusões para regular aberrantemente a expressão genética.
A porção de IDD N-terminal de EWSR1 é comumente fundida a um DBD em câncer, incluindo EWS/FLI em sarcoma Ewing, EWS/WT1 em tumor de células pequenas e difusas pequenas células redondas, e EWS/ATF1 em sarcoma de células claras de partes macias10. O papel mecanicista do IDD EWS em cada uma dessas fusões é incompletamente compreendido. A família de fusões EWS/ETS, especificamente EWS/FLI, é a mais caracterizada funcionalmente até o momento. O EWS/FLI coordena alterações epigenéticas e transcricionais em todo o genoma que levam à ativação e repressão de milhares de genes7,11,15,16. Estudos têm demonstrado que o IDD é importante para o recrutamento de co-ativadores transcricionais (como p300, WDR5 e o complexo BAF), bem como co-repressores (como o complexo NuRD)11,15,17. A fusão do IDD EWS à porção terminal C do FLI1 confere nova especificidade de vinculação de DNA ao ETS DBD de FLI1, de tal forma que a oncoproteína de fusão (EWS/FLI) se liga a regiões repetitivas GGAA-microsatélites do genoma, além do consenso ETS motivo18,19,20. Combinado com a função de recrutamento do co-ativador, esta atividade emergente de ligação de DNA do EWS/FLI promove a formação de novo melhorador em GGAA-microsatélites distal para locais de início de transcrição (TSS) (microsatélites “melhorador” RNA polymerase II para promover transcrição em GGAA-microsatélites proximal para TSS (microsatélites “promotores”)11,15,16,21.
Juntos, esses dados nos levaram a supor que elementos discretos dentro do domínio EWS contribuem para o recrutamento de co-reguladores distintos para diferentes tipos de sites de vinculação EWS/FLI. No entanto, discernir esses elementos dentro da porção EWS do EWS/FLI, e como eles funcionam, tem sido dificultado pela natureza altamente repetitiva e desordenada do domínio. Aqui utilizamos um sistema de resgate de knockdown publicado anteriormente em células de sarcoma Ewing para mapear funcionalmente esses elementos no IDD EWS. Neste sistema, o EWS/FLI é esgotado usando um shRNA direcionado ao 3’UTR do gene FLI1, e a expressão é resgatada com diferentes construções de CDNA mutantes EWS/FLI sem o 3’UTR7,17,22. Esses experimentos se concentraram em construções com várias exclusões para mapear a relação estrutura-função entre o IDD EWS e os importantes fenótipos oncogênicos, incluindo a ativação de uma construção de repórter GGAA-microsatélite, ensaios de formação de colônias e validação direcionada de genes ativados pelo EWS/FLI7,17,22 . No entanto, esses estudos não conseguiram encontrar sub-domínios discretos dentro do IDD EWS em EWS/FLI que são exclusivamente importantes para ativação ou repressão. Todos os construtos testados foram capazes de ativar e reprimir genes-alvo específicos, levando à formação eficiente de colônias, ou incapazes de regular qualquer um dos genes alvo EWS/FLI, levando à perda da formação decolônias 7,17,22.
Análises transcriômicas habilitadas pela adoção generalizada do sequenciamento da próxima geração são comumente utilizadas para comparar assinaturas de expressão genética em duas condições, frequentemente no contexto de triagem ou estudos descritivos. Em vez disso, queríamos aproveitar a capacidade de capturar dados de expressão em todo o genoma usando RNA-sequencincing (RNA-seq) para caracterizar as contribuições dos IDDs para a função do fator de transcrição. Neste caso, o RNA-seq é emparelhado com o sistema knockdown-rescue para explorar a relação estrutura-função do domínio EWS. Essa abordagem é aplicável a outros fatores de transcrição de fusão, incluindo outras fusões EWS ou fatores de transcrição do tipo selvagem com função mal compreendida, e tem múltiplas vantagens sobre os outros ensaios usados para estudos de mapeamento funcional, como ensaios de repórter ou qRT-PCR direcionado. Estes incluem testar determinantes estruturais de função no contexto de cromatina relevante, a capacidade de testar vários tipos de elementos de resposta em um ensaio (ou seja, ativado e reprimido, GGAA-microsatélite e não-microsatélite, etc.), e a capacidade resultante de detectar melhor a função parcial.
A implementação bem-sucedida dessa abordagem depende de um sistema baseado em células que captura os fenótipos de interesse (neste caso, células A673 com esgotamento EWS/FLI mediado por shRNA) e um painel de construções mutantes em um vetor de expressão apropriado para o sistema baseado em células (neste caso, pMSCV-hygro com vários mutantes EWS/FLI marcados por 3x-FLAG a serem entregues por transdução retroviral). A transdução viral de construções de esgotamento baseadas em CRISPR, construções de esgotamento baseadas em shRNA e construtos de expressão cDNA com seleção apropriada para gerar linhas de células estáveis é recomendada sobre transfecção transitória. A interpretação a jusante dos resultados é reforçada quando os dados transcriômicos podem ser emparelhados com outros dados relacionados à localização do fator de transcrição e outras leituras fenotípicas quando disponíveis.
Neste artigo, aplicamos esta abordagem para caracterizar a atividade do mutante DAF da EWS/FLI14. O mutante DAF tem 17 mutações de tyrosina para alanina nas regiões repetitivas do EWS IDD de EWS/FLI14. Este mutante EWS em particular havia sido relatado anteriormente e é incapaz de ativar a expressão genética do repórter quando fundido ao ATF1 DBD14. No entanto, dados preliminares do QRT-PCR sugeriram que este mutante foi capaz de ativar a transcrição do alvo EWS/FLI NR0B123. A abordagem transcriômica descrita aqui permitiu a detecção bem sucedida da função parcial do mutante DAF. Ao emparelhar esses dados transcriômicos com informações sobre os motivos de vinculação e reconhecimento EWS/FLI, mostramos ainda que o mutante DAF mantém a função em repetições de microsatélites GGAA. Esses resultados identificam o DAF como o primeiro mutante EWS/FLI parcialmente funcional e destacam a função em genes não microsatélites tão importantes para a oncogênese (como relatado23). Isso demonstra o poder desta abordagem de mapeamento de estrutura-função transcriptômica para fornecer insights sobre a função dos fatores de transcrição oncogênica.
Estudar os mecanismos bioquímicos dos fatores de transcrição oncogênica é extremamente importante para entender as doenças que causam e projetar novas estratégias terapêuticas. Isso é especialmente verdade em malignidades caracterizadas por translocações cromossômicas que resultam em fatores de transcrição de fusão. Os domínios incluídos nessas proteínas quimricas podem não ter interações significativas com domínios regulatórios presentes nas proteínas do tipo selvagem, complicando a capacidade de interpretar informações estruturais-funções no contexto da fusão26,27,28. Além disso, muitas dessas fusões oncogênicas são caracterizadas por domínios intrinsecamente desordenados de baixa complexidade10,13,29,30.
O domínio EWS é um exemplo de um domínio tão intrinsecamente desordenado que está envolvido em uma variedade de fusões oncogênicas10. A natureza intrinsecamente desordenada e repetitiva tem dificultado os esforços para entender os mecanismos moleculares empregados pelo domínio EWS. Esforços anteriores para investigar a estrutura-função têm recorrido em grande parte ao uso de diferentes mutantes no contexto de ensaios genéticos de repórteres ou em fundos celulares que não conseguem recapitular o contexto celular relevante, ou não possuem variações estruturais que produzam uma função parcial significativa11,17,25. O método aqui apresentado aborda essas questões. O mapeamento estrutura-função é realizado em um contexto celular relevante para a doença e o sequenciamento de próxima geração permite que o perfil transcriômico avalie a função do fator de transcrição na configuração da cromatina nativa. No caso específico do mutante DAF da EWS/FLI, daf foi relatado para mostrar pouca atividade em ensaios de repórteres usando elementos de resposta isolados, mas para mostrar atividade no contexto do promotor genético completo, seja em um ensaio repórter ou em cromatina nativa, sugerindo um fenótipointeressante 23. O uso do método aqui descrito resolve mais diretamente a questão de qual tipo de elementos regulatórios em todo o genoma são mais responsivos no cenário da doença. Ao testar todos os genes-alvo do candidato em seu contexto nativo de cromatina simultaneamente, uma abordagem transcriômica é mais provável para identificar construções com função parcial.
A força inerente do uso de um fundo celular relevante para a doença é talvez a maior limitação dessa técnica. Um dos fatores mais importantes é a escolha do sistema celular adequado para esses experimentos. Muitas linhas celulares derivadas de malignidades com fatores de transcrição pathognomônica não toleram prontamente o knockdown desse fator de transcrição, e em muitos casos, particularmente para cânceres pediátricos, a verdadeira célula de origem permanece controversa e a expressão do oncogene em outras origens celulares é proibitivamente tóxica31,32 . Nesses casos, pode ser útil realizar experimentos em um fundo celular diferente, desde que o pesquisador exerça cautela na interpretação dos resultados e valide adequadamente quaisquer achados relevantes em um tipo celular mais relevante para a doença.
É extremamente importante validar cuidadosamente a estabilidade e as consequências fenotípicas da expressão do oncogene e submeter apenas amostras para sequenciamento que atendam a critérios rigorosos. Aqui, isso incluiu a mancha ocidental para confirmar o knockdown e o resgate, e qRT-PCR de um pequeno número de genes alvo conhecidos para validar o controle positivo(Figura 2). Da mesma forma, é crucial diminuir o máximo de variabilidade de lote possível, realizando cuidadosamente as preparações de célula e RNA da forma mais semelhante possível através de cada lote.
O método aqui descrito torna-se especialmente poderoso quando emparelhado com outros tipos de dados genômicos que falam da função genoma do fator de transcrição em estudo. As direções futuras para este tipo de análise estrutura-função se expandiriam para incluir ChIP-seq e ATAC-seq para determinar a vinculação do fator de transcrição e quaisquer alterações induzidas na acessibilidade da cromatina. Como um conjunto, esse tipo de dados pode apontar para onde diferentes componentes estruturais de um fator de transcrição oncogênica contribuem para diferentes aspectos da função (ou seja, vinculação de DNA vs. modificação de cromatina versus recrutamento co-regulador). No geral, o uso de abordagens baseadas em NGS para mapear as relações estrutura-função dos fatores de transcrição de fusão pode revelar novos insights nos determinantes bioquímicos da função oncogênica dessas proteínas. Isso é importante para aprofundar nossa compreensão das doenças que causam e possibilitar o desenvolvimento de novas estratégias terapêuticas.
The authors have nothing to disclose.
Esta pesquisa foi apoiada pelo Centro de Computação de Alto Desempenho do Instituto de Pesquisa Abigail Wexner do Nationalwide Children’s Hospital. Este trabalho foi apoiado pelo Instituto Nacional de Saúde Instituto Nacional de Câncer [U54 CA231641 para SLL, R01 CA183776 para SLL]; Alex’s Lemonade Stand Foundation [Prêmio Jovem Investigador para ERT]; Pelotonia [Bolsa para ERT]; e o Conselho Nacional de Saúde e Pesquisa Médica CJ Martin Overseas Biomedical Fellowship [APP1111032 to KIP].
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |