Este manuscrito descreve uma abordagem de triagem baseada em células em escala de genoma para identificar interações receptor-ligantes extracelulares.
A comunicação intercelular mediada por interações diretas entre receptores de superfície celular incorporados por membrana é crucial para o desenvolvimento normal e o funcionamento de organismos multicelulares. A detecção dessas interações permanece tecnicamente desafiadora, no entanto. Este manuscrito descreve uma abordagem sistemática de triagem genética de destruição em escala de genoma CRISPR/Cas9 que revela vias celulares necessárias para eventos específicos de reconhecimento da superfície celular. Este ensaio utiliza proteínas recombinantes produzidas em um sistema de expressão de proteínas mamíferas como sondas ávidas de ligação para identificar parceiros de interação em uma tela genética baseada em células. Este método pode ser usado para identificar os genes necessários para interações de superfície celular detectadas por sondas de ligação recombinantes correspondentes aos ectodomínios de receptores incorporados por membrana. É importante ressaltar que, dada a natureza em escala de genoma dessa abordagem, ele também tem a vantagem de não apenas identificar o receptor direto, mas também os componentes celulares necessários para a apresentação do receptor na superfície celular, fornecendo assim insights valiosos sobre a biologia do receptor.
Interações extracelulares por proteínas receptoras de superfície celular direcionam processos biológicos importantes, como organização tecidual, reconhecimento de patógenos hospedeiros e regulação imunológica. Investigar essas interações é de interesse para a comunidade biomédica mais ampla, pois os receptores de membrana são alvos acionáveis de terapêuticas sistematicamente entregues, como anticorpos monoclonais. Apesar de sua importância, estudar essas interações continua sendo tecnicamente desafiador. Isso ocorre principalmente porque os receptores embutidos em membrana são anfípaticos, tornando-os difíceis de isolar das membranas biológicas para manipulação bioquímica, e suas interações são tipificadas pelas fracas afinidades de interação (KDs na faixa μM-mM)1. Consequentemente, muitos métodos comumente utilizados são inadequados para detectar essa classe de interações proteicas1,,2.
Uma série de métodos foi desenvolvida para investigar especificamente interações receptor-ligantes extracelulares que levam em consideração suas propriedades bioquímicas únicas3. Algumas dessas abordagens envolvem expressar todo o ectodomínio de um receptor como uma proteína recombinante solúvel em sistemas baseados em mamíferos ou células de insetos para garantir que essas proteínas contenham modificações pós-transicionais que são estruturalmente importantes, como glicanos e ligações de dissulfeto. Para superar a ligação de baixa afinidade, os ectodomínios são muitas vezes oligomerizados para aumentar sua avidalidade vinculante. Os ectodomínios de proteína ávida têm sido usados com sucesso como sondas de ligação para identificar parceiros de interação em telas diretas de interação proteína-proteína recombinante4,,5,,6,7. Embora métodos amplamente bem sucedidos e recombinantes à base de proteínas requerem que a ectodomina de um receptor de membrana seja produzida como uma proteína solúvel. Portanto, ele só é geralmente aplicável a proteínas que contêm uma região extracelular contígua (por exemplo, tipo de passe único I, tipo II ou ancorado em GPI) e não é geralmente adequado para complexos receptores e proteínas de membrana que abrangem a membrana várias vezes.
Técnicas de clonagem de expressão nas quais uma biblioteca de DNAs complementares (cDNAs) é transfeita em células e testada para um fenótipo de ganho de vinculação também foram usadas para identificar interações proteicas extracelulares8. A disponibilidade de grandes coleções de plasmídeos clonados e sequenciados de expressão cDNA nos últimos anos facilitou métodos nos quais linhas celulares que superexpressam cDNAs codificando receptores de superfície celular são rastreados para a ligação de proteínas recombinantes para identificar interações9,,10. As abordagens baseadas em cDNA, ao contrário dos métodos recombinantes à base de proteínas, oferecem a possibilidade de identificar interações no contexto da membrana plasmática. No entanto, o sucesso do uso de construções de expressão cDNA depende da capacidade das células de superexpressar a proteína na forma corretamente dobrada, mas isso muitas vezes requer fatores acessórios celulares, como transportadores, acompanhantes e montagem oligomerica correta. Transfetar um único cDNA pode, portanto, não ser suficiente para alcançar a expressão da superfície celular.
As técnicas de triagem que utilizam construções cDNA ou sondas de proteína recombinante são intensivas em recursos e requerem grandes coleções de bibliotecas de proteínas cDNA ou recombinante. Métodos específicos projetados baseados em espectrometria de massa foram utilizados recentemente para identificar interações extracelulares que não requerem a montagem de grandes bibliotecas. No entanto, essas técnicas requerem manipulação química da superfície celular, que pode alterar a natureza bioquímica das moléculas presentes na superfície das células e atualmente são aplicáveis apenas para interações mediadas pelas proteínas glicosiladas11,12. A maioria dos métodos disponíveis atualmente também se concentra fortemente nas interações entre proteínas, ignorando em grande parte a contribuição do microambiente da membrana, incluindo moléculas como glicanos, lipídios e colesterol.
O desenvolvimento recente de segmentação biallelelica altamente eficiente usando abordagens baseadas em CRISPR permitiu bibliotecas em escala de genoma de células sem genes definidos em uma única piscina que podem ser rastreadas de forma sistemática e imparcial para identificar componentes celulares envolvidos em diferentes contextos, incluindo dissecação de processos de sinalização celular, identificação de perturbações que conferem resistência a drogas, toxinas e patógenos, e determinação da especificidade dos anticorpos13,,14,,15,16. Aqui, descrevemos um ensaio de triagem de células eliminatórias baseadas em CRISPR em escala genoma que fornece uma alternativa às abordagens bioquímicas atuais para identificar interações receptor-ligantes extracelulares. Essa abordagem de identificar interações mediadas por receptores de membrana por telas genéticas é particularmente adequada para pesquisadores que têm um interesse focado em ligantes individuais, pois evita a necessidade de compilar grandes bibliotecas de CDNAs ou proteínas recombinantes.
Este ensaio consiste em três passos principais: 1) Sondas de ligação de proteína recombinantes altamente ávidas que consistem nas regiões extracelulares de um receptor de interesse são produzidas e usadas em ensaios de ligação baseados em citometria de fluxo baseados em fluorescência; 2) Os ensaios de ligação são utilizados para identificar uma linha celular que expresse o parceiro de interação da sonda de proteína recombinante; 3) Uma versão expressadora cas9 da linha celular que interage com a proteína de interesse é produzida e uma tela de nocaute baseada em GENOMA CRISPR/Cas9 é realizada(Figura 1). Nesta tela genética, a ligação de uma proteína recombinante às linhas celulares é usada como um fenótipo mensurável no qual as células dentro da biblioteca de nocautes que perderam a capacidade de ligar a sonda são classificadas usando a classificação celular ativada baseada em fluorescência (FACS) e os genes que causaram a perda do fenótipo de ligação identificado pelo sequenciamento. Em princípio, os genes que codificam o receptor responsável pela ligação da ávida sonda e os necessários para sua exibição de superfície celular são identificados.
O primeiro passo deste protocolo envolve a produção de ávidas sondas proteicas recombinantes representando a ectodomina dos receptores ligados à membrana. Esses receptores são conhecidos por frequentemente manter suas funções de ligação extracelular quando seus ectodomínios são expressos como uma proteína solúvel recombinante1. Para uma proteína de interesse, proteínas recombinantes solúveis podem ser produzidas em qualquer sistema adequado de expressão de proteína eucariótica em qualquer formato, desde que possa ser oligomerizada para maior avideidade de ligação, e contém tags que podem ser usadas em ensaios de ligação baseados em fluorescência baseadas em citometria de fluxo (por exemplo, bandeira-tag, biotin-tag). Protocolos detalhados para a produção de ectodomínios solúveis de receptores de membrana utilizando o sistema de expressão proteica HEK293, bem como diferentes técnicas de multimerização e construtos de expressão proteica para a produção de proteínas pentaméricas e proteínas monoméricas foram previamente descritos1,,17. O protocolo aqui descreverá os passos para a geração de sondas ávidas fluorescentes a partir de proteínas biotinilatas monoméricas, conjugando-as a streptavidin conjugadas a um fluorocromo (por exemplo, ficoerthrina ou PE), que pode ser usado diretamente em ensaios de ligação baseados em células e tem a vantagem de não exigir um anticorpo secundário para detecção. Protocolos gerais para a realização de telas em escala de genoma já foram descritos20,,21, portanto, o protocolo se concentra principalmente nas especificidades da realização de telas de ligação de proteína recombinante baseadas em citometria de fluxo usando o sistema de triagem de nocaute CRISPR/Cas9 usando a biblioteca Humana V1 (“Yusa”)18.
Uma estratégia de triagem baseada em CRISPR para identificar genes codificando componentes celulares envolvidos no reconhecimento celular é descrita. Uma abordagem semelhante usando a ativação do CRISPR também fornece uma alternativa genética para identificar receptores diretamente interagindo de proteínas recombinantes sem a necessidade de gerar grandes bibliotecas proteicas26. No entanto, uma grande vantagem dessa abordagem é que ela é aplicável às interações mediadas por moléculas superficiais nativamente exibidas na célula e não depende da superexpressão dos receptores, o que pode influenciar a avidez vinculante do receptor. Ao contrário de outros métodos, portanto, essa técnica não faz suposições sobre a natureza bioquímica ou biologia celular dos receptores e oferece uma oportunidade de estudar interações mediadas por proteínas que normalmente são difíceis de estudar usando abordagens bioquímicas, como proteínas muito grandes, ou aquelas que atravessam a membrana várias vezes ou formam complexos com outras proteínas, e moléculas diferentes de proteínas como glicanos, glicólipídios e fosfolipídios. Dada a natureza em escala genoma do método, essa abordagem também tem a vantagem de não apenas identificar o receptor, mas também componentes celulares adicionais que são necessários para o evento de ligação, fornecendo assim insights sobre a biologia celular do receptor.
Uma das principais limitações deste método ao usá-lo para identificar o receptor de uma proteína órfã é o requisito inicial para identificar primeiro uma linha celular que se liga à proteína. Isso nem sempre é fácil e identificar uma linha celular que exibe um fenótipo de ligação que também é permissivo às telas genéticas pode ser o passo que limita o tempo para a implantação deste ensaio. Algumas linhas celulares tendem a se ligar a mais proteínas do que outras. Isso é especialmente relevante para proteínas que ligam HS, porque essas proteínas tendem a se ligar a qualquer linha celular que exiba cadeias laterais de HS, independentemente do contexto de ligação nativa. Além disso, observamos que a regulação dos sindecanos (ou seja, proteoglycans que contêm HS) nas linhas celulares leva ao aumento da vinculação das proteínas de ligação de SH26. Isso pode ser um fator a ser levado em consideração ao selecionar a linha celular para triagem. No entanto, também é importante notar que a ligação aditiva do HS não interfere na vinculação a um receptor específico. Isso significa que, se a vinculação for observada, é possível que seja mediada unicamente pelo SS porque a vinculação mediada pelo HS neste ensaio é aditiva e não codependente19. Nesse cenário, a abordagem de bloqueio de heparina descrita pode identificar tais comportamentos sem ter a necessidade de realizar uma tela genética completa.
Um recurso útil para a escolha de linhas celulares é o Cell Model Passport, que contém informações genômicas, transcriômicas e condições de cultura para ~1.000 linhas de células cancerígenas27. Dependendo do contexto biológico, as células podem ser escolhidas com base em seus perfis de expressão. Para auxiliar na seleção de linhas celulares, agrupamos ~1.000 linhas celulares no Cell Model Passport de acordo com a expressão de ~1.500 glicoproteínas de superfície de células humanas pré-anotadas28 (Figura Suplementar 2; informações de cluster para cada linha celular juntamente com condições de crescimento são fornecidas na Tabela Suplementar 2). Ao testar a ligação de uma proteína com função desconhecida, é útil selecionar um painel de linhas celulares representativas de cada cluster para aumentar a chance de cobrir uma ampla gama de receptores. Dada a escolha, recomenda-se escolher linhas celulares fáceis de cultivar e fáceis de transduzir. Como essas linhas celulares serão usadas na triagem em escala de genoma, é preferível que elas possam ser cultivadas facilmente em grandes quantidades e sejam permissivas à transdução lentiviral, pois é o método mais comumente disponível para a entrega de sgRNA para triagem genética baseada em CRISPR nas etapas posteriores.
Geralmente, as seleções de fenótipo são realizadas em um único tipo. No entanto, isso é determinado pelo brilho da população celular manchada em comparação com o controle. Rodadas iterativas de seleções poderiam ser adotadas para cenários em que a relação sinal-ruído do fenótipo desejado é baixa, ou quando o objetivo da tela é identificar mutantes que têm fenótipos fortes. Ao usar uma abordagem de seleção iterativa para telas baseadas em FACS, é importante considerar que o processo de classificação pode causar morte celular, principalmente devido à força do classificador. Assim, nem todas as células coletadas serão representadas na próxima rodada de triagem.
A complexidade da biblioteca é um fator muito importante na realização de telas genéticas bem sucedidas, especialmente para telas de seleção negativas, pois a extensão do esgotamento nelas só pode ser determinada comparando resultados com o que estava presente na biblioteca inicial. Para telas de seleção negativas, é comum manter bibliotecas de 500-1.000 x de complexidade. Telas de seleção positivas, no entanto, são mais robustas para tamanhos de biblioteca, porque nessas telas apenas um pequeno número de mutantes são esperados para ser selecionado para um fenótipo específico. Portanto, na tela de seleção positiva descrita aqui, o tamanho da biblioteca pode ser reduzido para 50-100x de complexidade sem comprometer a qualidade da tela. Além disso, nessas telas também é possível usar uma biblioteca de controle para uma determinada linha celular em um determinado dia como um “controle geral” para todas as amostras classificadas no dia para aquela linha celular dada. Isso reduzirá o número de bibliotecas de controle que precisam ser produzidas e sequenciadas.
Outra consideração importante para o uso dessa abordagem são as limitações das telas de perda de função na identificação de genes essenciais para o crescimento celular in vitro. O tempo das telas é crucial nesse sentido, pois quanto mais tempo as células mutantes são mantidas na cultura, maior a probabilidade de que células com mutações em genes essenciais se tornem inviáveis e não sejam mais representadas na biblioteca mutante. As recentes telas genéticas realizadas como parte da iniciativa Project Score em mais de 300 linhas celulares mostram que múltiplos genes na secreção de proteínas anotadas pelo KEGG e na via de glicossylação N-glicossylation são frequentemente identificados como essenciais para uma série de linhas celulares (Figura Suplementar 3)29. Isso pode ser levado em consideração ao projetar telas se o efeito dos genes necessários para a proliferação e viabilidade deve ser investigado no contexto do processo de reconhecimento celular. Neste caso, a realização de telas em um ponto de tempo antecipado (por exemplo, dia 9 pós-tradução) seria geralmente apropriada. No entanto, se a abordagem for usada para identificar alguns alvos com efeitos de tamanho forte em vez de vias celulares gerais, pode ser apropriado executar telas em um ponto de tempo posterior (por exemplo, dia 15-16 pós-tradução).
Os resultados da triagem são muito robustos; em oito telas de ligação de proteína recombinantes realizadas no passado, o receptor de superfície celular foi o principal atingido em cada caso19. Ao utilizar essa abordagem para identificar o parceiro de interação, deve-se, portanto, esperar que o receptor e os fatores que contribuem para sua apresentação na superfície sejam identificados com alta confiança estatística. Uma vez que a tela é realizada e um hit é validado usando um único nocaute de gRNA, outros acompanhamentos podem ser realizados usando métodos bioquímicos existentes, como AVEXIS4 e ligação satural direta de proteínas purificadas usando ressonância de plasmon superficial. A abordagem aqui descrita é aplicável para todas as proteínas para as quais é possível gerar uma sonda de ligação recombinante solúvel.
Em resumo, esta é uma abordagem de nocaute CRISPR em escala de genoma para identificar interações mediadas por proteínas da superfície celular. Este método é geralmente aplicável para identificar vias celulares necessárias para o reconhecimento da superfície celular em uma ampla gama de diferentes contextos biológicos, incluindo entre as células próprias de um organismo (por exemplo, reconhecimento neural e imunológico), bem como entre células hospedeiras e proteínas patógenas. Este método fornece uma alternativa genética às abordagens bioquímicas projetadas para identificação de receptores, e por não exigir quaisquer suposições prévias sobre a natureza bioquímica ou biologia celular dos receptores, tem grande potencial para fazer descobertas completamente inesperadas.
The authors have nothing to disclose.
Este trabalho foi apoiado pela bolsa wellcome trust número 206194 concedida à GJW. Agradecemos à instalação do Núcleo de Citometria: Bee Ling Ng, Jennifer Graham, Sam Thompson e Christopher Hall por ajuda com a FACS.
Anti-mouse alkaline phosphatase | Sigma | A4656 | |
Blasticidin | Chem-Cruz | SC-204655 | |
Blood & Cell Culture DNA Maxi Kit | Qiagen | 13362 | |
BSA | Sigma | A9647-100G | |
Diethanolamine | Sigma | 398179 | |
DMEM | Gibco | 31966-021 | |
Dneasy Blood and Tissue kit | Qiagen | 69504 | |
DynaMag-96 Side Magnet | Invitrogen | 12331D | |
HEK293T packaging cells | ATCC | CRL-3216 | |
Heparin | Sigma | H4784-1G | |
KAPA HiFi HotStart ReadyMix | Kapa | KK2602 | |
Lipofectamine LTX with PLUS reagent | Invitrogen | 15338100 | |
MoFlo XDP cell sorter | BD | ||
Ni2+-NTA agarose beads | Jena Bioscience | AC-501-25 | |
OPTI-MEM | Life Technologies | 31985-070 | |
OX-68 antibody | AbD Serotec | MCA1022R | |
p-nitrophenyl phosphate | Sigma | 1040-506 | |
PD-10 desalting columns | GE healthcare | 17085101 | |
Polybrene | Millipore | TR-1003-G | |
Polypropylene tubes with 5 mL bed volume | Qiagen | 34964 | |
Proteinase K, recombinant, PCR Grade | Roche | 3115879001 | |
Puromycin | Gibco | A11138-03 | |
Q5 Hot Start High-Fidelity 2× Master Mix | NEB | M0494L | |
QIAquick PCR purification kit | Qiagen | 28104 | |
SCFA filter | Nalgene | 190-2545 | |
Sony Cell sorter | Sony | ||
SPRI beads (Agencourt AMPure XP beads) | Beckman | A63881 | |
Streptavidin-coated microtitre plates | Nalgene | 734-1284 | |
Streptavidin-PE | Biolegend | 405204 |