Questo manoscritto descrive un approccio di screening basato sulle cellule su scala genomica per identificare le interazioni recettore-ligando extracellulari.
La comunicazione intercellulare mediata da interazioni dirette tra i recettori della superficie cellulare incorporati nella membrana è fondamentale per il normale sviluppo e funzionamento degli organismi multicellulari. Tuttavia, il rilevamento di queste interazioni rimane tecnicamente impegnativo. Questo manoscritto descrive un approccio sistematico di screening genetico CRISPR/Cas9 su scala genomica che rivela i percorsi cellulari necessari per eventi specifici di riconoscimento della superficie cellulare. Questo saggio utilizza proteine ricombinanti prodotte in un sistema di espressione proteica dei mammiferi come acconde di legame avido per identificare i partner di interazione in uno schermo genetico basato sulle cellule. Questo metodo può essere utilizzato per identificare i geni necessari per le interazioni della superficie cellulare rilevate dalle sonde di legame ricombinanti corrispondenti agli ectodomini dei recettori incorporati nella membrana. È importante sottolineare che, data la natura su scala del genoma di questo approccio, ha anche il vantaggio di identificare non solo il recettore diretto, ma anche i componenti cellulari necessari per la presentazione del recettore sulla superficie cellulare, fornendo così preziose informazioni sulla biologia del recettore.
Le interazioni extracellulari delle proteine del recettore della superficie cellulare dirigono importanti processi biologici come l’organizzazione dei tessuti, il riconoscimento ospite-patogeno e la regolazione immunitaria. Lo studio di queste interazioni è di interesse per la comunità biomedica più ampia, perché i recettori della membrana sono obiettivi utilizzabili di terapie sistematicamente consegnate come gli anticorpi monoclonali. Nonostante la loro importanza, lo studio di queste interazioni rimane tecnicamente impegnativo. Ciò è dovuto principalmente al fatto che i recettori incorporati nella membrana sono anfipatici, rendendoli difficili da isolare dalle membrane biologiche per la manipolazione biochimica, e le loro interazioni sono caratterizzate dalle affinità di interazione deboli (KDs nella gamma M-MM)1. Di conseguenza, molti metodi comunemente utilizzati non sono adatti a rilevare questa classe di interazioni proteiche1,2.
È stata sviluppata una serie di metodi per studiare specificamente le interazioni recettore-ligando extracellulare che prendono in considerazione le loro proprietà biochimiche uniche3 . Alcuni di questi approcci prevedono l’espressione dell’intero ectodominio di un recettore come proteina ricombinante solubile nei sistemi basati su mammiferi o cellule di insetti per garantire che queste proteine contengano modifiche post-traduzionali strutturalmente importanti, come glicani e legami disulfide. Per superare l’associazione a bassa affinità, gli ectodomains sono spesso oligomerizzati per aumentare la loro avidità vincolante. Gli ectoscopi delle proteine avide sono stati utilizzati con successo come sonde di legame per identificare i partner di interazione negli schermi di interazione proteina-proteina ricombinanti diretti4,5,6,7.7 Anche se ampiamente riusciti, i metodi a base di proteine ricombinanti richiedono che l’ectodominio di un recettore della membrana sia prodotto come proteina solubile. Pertanto, è generalmente applicabile solo alle proteine che contengono una regione extracellulare contigua (ad esempio, tipo i, tipo II o ancoraggio gpI) e non è generalmente adatto per i complessi recettori alpinisti e le proteine della membrana che si estendono più volte sulla membrana.
Tecniche di clonazione dell’espressione in cui una libreria di DNA complementari (cDANA) viene trasinfezione in cellule e testata per un fenotipo di guadagno-di-legante sono state utilizzate anche per identificare le interazioni extracellulari-proteine8. La disponibilità di grandi collezioni di plasmidi di espressione cDNA clonati e in sequenza negli ultimi anni ha facilitato metodi in cui le linee cellulari che sovraesprimono i cDNA che codificano i recettori della superficie cellulare vengono sottoposte a screening per l’associazione di proteine ricombinanti per identificare le interazioni9,10. Gli approcci basati sulla sovraespressione del cDNA, a differenza dei metodi ricombinanti basati sulle proteine, offrono la possibilità di identificare le interazioni nel contesto della membrana plasmatica. Tuttavia, il successo dell’utilizzo di costrutti di espressione cDNA dipende dalla capacità delle cellule di sovraesprimere la proteina nella forma correttamente piegata, ma questo spesso richiede fattori accessori cellulari come trasportatori, chaperones e corretto assemblaggio oligomerico. Tradurre un singolo cDNA potrebbe quindi non essere sufficiente per ottenere l’espressione della superficie cellulare.
Le tecniche di screening con costrutti cDNA o sonde proteiche ricombinanti sono ad alta intensità di risorse e richiedono grandi raccolte di cDNA o librerie proteiche ricombinanti. I metodi basati sulla spettrometria di massa specificamente progettati sono stati utilizzati di recente per identificare le interazioni extracellulari che non richiedono l’assemblaggio di grandi librerie. Tuttavia, queste tecniche richiedono la manipolazione chimica della superficie cellulare, che può alterare la natura biochimica delle molecole presenti sulla superficie delle cellule e sono attualmente applicabili solo alle interazioni mediate dalle proteine glicosillate11,12. La maggior parte dei metodi attualmente disponibili si concentra anche pesantemente sulle interazioni tra le proteine, ignorando in gran parte il contributo del microambiente della membrana, comprese molecole come glicani, lipidi e colesterolo.
Il recente sviluppo di un targeting bialleleico altamente efficiente utilizzando approcci basati su CRISPR ha permesso a librerie su scala genomica di cellule prive di geni definiti in un unico pool che possono essere esaminati in modo sistematico e imparziale per identificare i componenti cellulari coinvolti in contesti diversi, tra cui sezionare i processi di segnalazione cellulare, l’identificazione di perturbazioni che conferiscono resistenza a farmaci, tossine e patogeni, e determinare la specificità degli anticorpi13,14,15,16. Qui, descriviamo un test dello screening delle cellule a eliminazione di knockout basato su CRISPR su scala genomica che fornisce un’alternativa agli attuali approcci biochimici per identificare le interazioni recettore-ligando extracellulari. Questo approccio di identificazione delle interazioni mediate dai recettori della membrana da parte dei recettori genetici è particolarmente adatto per i ricercatori che hanno un interesse mirato sui singoli ligandi perché evita la necessità di compilare grandi librerie di cDNA o proteine ricombinanti.
Questo saggio è costituito da tre passaggi principali: 1) Le sonde di legame proteico ricombinante altamente accanite costituite dalle regioni extracellulari di un recettore di interesse sono prodotte e utilizzate nei saggi di legame basati sulla citometria del flusso a fluorescenza; 2) I saggi vincolanti vengono utilizzati per identificare una linea cellulare che esprime il partner di interazione della sonda proteica ricombinante; 3) Viene prodotta una versione che esprime Cas9 della linea cellulare che interagisce con la proteina di interesse e viene eseguita una schermata di knockout basata su genomica CRISPR/Cas9 (Figura 1). In questo screening genetico, il legame di una proteina ricombinante alle linee cellulari viene utilizzato come fenotipo misurabile in cui le cellule all’interno della libreria knockout che hanno perso la capacità di legare la sonda vengono ordinate utilizzando lo smistamento cellulare attivato basato sulla fluorescenza (FACS) e i geni che hanno causato la perdita del fenotipo legante identificato dal sequenziamento. In linea di principio, vengono identificati i geni che codificano il recettore responsabile del legame della sonda avida e quelli necessari per il suo display di superficie cellulare.
Il primo passo di questo protocollo prevede la produzione di acconde proteiche ricombinanti accanite che rappresentano l’ectodominio dei recettori legati alla membrana. Questi recettori sono noti per mantenere frequentemente le loro funzioni di legame extracellulare quando i loro ectodomini sono espressi come una proteina solubile ricombinante1. Per una proteina di interesse, le proteine ricombinanti solubili possono essere prodotte in qualsiasi sistema di espressione proteica eucariotica adatto in qualsiasi formato a condizione che possa essere oligomerizzato per una maggiore avidità vincolante e contiene tag che possono essere utilizzati nei saggi di legame basati sulla citometria basata sulla flutura (ad esempio, tag FLAG, biotina-tag). Protocolli dettagliati per la produzione di ectodomains solubili di recettori della membrana utilizzando il sistema di espressione proteica HEK293, così come diverse tecniche di multimerizzazione e costrutti di espressione proteica per la produzione di proteine penameriche e proteine monomeriche sono stati precedentemente descritti1,17. Il protocollo qui descriverà i passaggi per generare sonde avide fluorescenti da proteine biopoiriche monomeriche coniugandole a streptavidina coniugate a un fluorocro (ad esempio, ficoerythrin, o PE), che può essere utilizzato direttamente nei testdi di legame cellulare e ha il vantaggio di non richiedere un anticorpo secondario per il rilevamento. Sono già stati descritti protocolli generali per l’esecuzione di schermi su scala genomica20,21, quindi il protocollo si concentra principalmente sulle specifiche dell’esecuzione di schermi di legame proteico ricombinanti basati sulla citometria a flusso utilizzando il sistema di screening a eliminazione diretta CRISPR/Cas9 utilizzando la libreria Human V1 (“Yusa”)18.
Viene descritta una strategia di screening basata su CRISPR per identificare i geni che codificano i componenti cellulari coinvolti nel riconoscimento cellulare. Un approccio simile che utilizza l’attivazione CRISPR fornisce anche un’alternativa genetica per identificare i recettori che interagiscono direttamente delle proteine ricombinanti senza la necessità di generare grandi librerie proteiche26. Tuttavia, uno dei principali vantaggi di questo approccio è che è applicabile alle interazioni mediate da molecole di superficie originariamente visualizzate sulla cellula e non dipende dalla sovraespressione dei recettori, che può influenzare l’avidità di legame del recettore. A differenza di altri metodi, quindi, questa tecnica non fa supposizioni per quanto riguarda la natura biochimica o la biologia cellulare dei recettori e offre l’opportunità di studiare le interazioni mediate da proteine normalmente difficili da studiare utilizzando approcci biochimici, come proteine molto grandi, o quelli che attraversano la membrana più volte o formano complessi con altre proteine e molecole diverse da proteine come glicani, glicolipidi e fosfoipi. Data la natura della scala genomica del metodo, questo approccio ha anche il vantaggio di identificare non solo il recettore, ma anche componenti cellulari aggiuntivi necessari per l’evento di legame, fornendo così approfondimenti sulla biologia cellulare del recettore.
Una delle principali limitazioni di questo metodo quando lo si utilizza per identificare il recettore di una proteina orfana è il requisito iniziale per identificare prima una linea cellulare che si lega alla proteina. Questo non è sempre facile e identificare una linea cellulare che visualizza un fenotipo vincolante che è anche permissivo agli schermi genetici può essere il passo che limita il tempo per l’implementazione di questo saggio. Alcune linee cellulari tendono a legarsi a più proteine rispetto ad altre. Ciò è particolarmente rilevante per le proteine che legano l’HS, perché queste proteine tendono a legarsi a qualsiasi linea cellulare che visualizza catene laterali HS, indipendentemente dal contesto di legame nativo. Inoltre, abbiamo osservato che l’upregulation dei syndecan (cioè i proteoglicani che contengono HS) nelle linee cellulari porta ad un maggiore legame delle proteine leganti HS26. Questo potrebbe essere un fattore da prendere in considerazione quando si seleziona la linea cellulare per lo screening. Tuttavia, anche importante notare è che il legame additivo di HS non interferisce con il legame a un recettore specifico. Ciò significa che se si osserva l’associazione, è possibile che sia mediata esclusivamente da HS perché l’associazione mediata da HS in questo saggio è additiva piuttosto che codipendente19. In uno scenario di questo tipo, l’approccio di blocco dell’eparina descritto può identificare tali comportamenti senza dover eseguire uno schermo genetico completo.
Una risorsa utile per la scelta delle linee cellulari è Cell Model Passport, che contiene informazioni sulla genomica, la trascrittomica e le condizioni di coltura per le linee cellulari tumorali da 1.000 dollari27. A seconda del contesto biologico, le cellule possono essere scelte in base ai loro profili di espressione. Per facilitare la selezione delle linee cellulari, abbiamo raggruppato 1.000 linee cellulari in Cell Model Passport in base all’espressione di 1.500 dollari di glicoproteine superficiali delle cellule umane preantate28 (Figura supplementare 2; le informazioni sul cluster per ogni linea cellulare insieme alle condizioni di crescita sono fornite nella tabella supplementare 2). Durante il test del legame di una proteina con funzione sconosciuta, è utile selezionare un pannello di linee cellulari rappresentative da ogni cluster per aumentare la possibilità di coprire una vasta gamma di recettori. Data una scelta, si consiglia di scegliere linee cellulari facili da coltura e facili da trasdurare. Poiché queste linee cellulari saranno utilizzate nello screening su scala del genoma, è preferibile che possano essere coltivate facilmente in grandi quantità e siano permissive alla trasduzione lentivirale, perché è il metodo più comunemente disponibile per la consegna di sgRNA per lo screening genetico basato su CRISPR nelle fasi successive.
Generalmente, le selezioni di fenotipi vengono effettuate in un unico tipo. Tuttavia, questo è determinato dalla luminosità della popolazione di cellule macchiate rispetto al controllo. I cicli iterativi delle selezioni potrebbero essere adottati per scenari in cui il rapporto segnale-rumore del fenotipo desiderato è basso, o quando lo scopo dello schermo è quello di identificare mutanti con fenotipi forti. Quando si utilizza un approccio di selezione iterativa per schermi basati su FACS, è importante considerare che il processo di ordinamento può causare la morte delle cellule, principalmente a causa della pura forza della selezionatrice. Pertanto, non tutte le celle raccolte saranno rappresentate nel prossimo ciclo di ordinamento.
La complessità della biblioteca è un fattore molto importante nell’esecuzione di schermi genetici di successo, soprattutto per schermi di selezione negativi perché l’entità dell’esaurimento in questi può essere determinata solo confrontando i risultati con quelli che erano presenti nella libreria di partenza. Per le schermate di selezione negativa, è comune mantenere librerie di complessità 500-1.000. Le schermate di selezione positive, tuttavia, sono più robuste alle dimensioni delle librerie, perché in tali schermi solo un piccolo numero di mutanti dovrebbe essere selezionato per un particolare fenotipo. Pertanto, nella schermata di selezione positiva descritta di seguito, le dimensioni della libreria possono essere ridotte a una complessità di 50-100 volte senza compromettere la qualità dello schermo. Inoltre, in queste schermate è anche possibile utilizzare una libreria di controlli per una determinata linea cellulare in un determinato giorno come “controllo generale” per tutti i campioni ordinati nel giorno per quella determinata linea cellulare. In questo modo si riduce il numero di librerie di controllo che devono essere prodotte e sequenziate.
Un’altra considerazione importante per l’utilizzo di questo approccio sono i limiti degli schermi di perdita di funzione nell’identificazione dei geni essenziali per la crescita delle cellule in vitro. La tempistica degli schermi è cruciale a questo proposito, poiché più a lungo le cellule mutanti sono mantenute in coltura, maggiore è la probabilità che le cellule con mutazioni nei geni essenziali diventino non vitali e non siano più rappresentate nella libreria dei mutanti. I recenti screening genetici eseguiti nell’ambito dell’iniziativa Project Score in oltre 300 linee cellulari mostrano che più geni nella secrezione proteica con annotato da KEGG e nel percorso di glicosilazione N sono spesso identificati come essenziali per un certo numero di linee cellulari (Supplementary Figure 3)29. Questo può essere preso in considerazione quando si progettano schermi se l’effetto dei geni necessari per la proliferazione e la vitalità deve essere studiato nel contesto del processo di riconoscimento cellulare. In questo caso, l’esecuzione di schermi in un momento precoce (ad esempio, giorno 9 posttraduzione) sarebbe generalmente appropriato. Tuttavia, se l’approccio viene utilizzato per identificare alcuni obiettivi con effetti di dimensioni forti anziché percorsi cellulari generali, potrebbe essere opportuno eseguire schermi in un momento successivo (ad esempio, giorno 15-16 posttrasduzione).
I risultati dello screening sono molto robusti; in otto schermi di legame proteico ricombinanti eseguiti in passato, il recettore della superficie cellulare è stato il colpo più alto in ogni caso19. Quando si utilizza questo approccio per identificare il partner di interazione, ci si dovrebbe quindi aspettare che il recettore e i fattori che contribuiscono alla sua presentazione sulla superficie siano identificati con un’elevata fiducia statistica. Una volta eseguito lo schermo e convalidato un colpo utilizzando un singolo knockout di gRNA, è possibile eseguire ulteriori follow-up utilizzando metodi biochimici esistenti come AVEXIS4 e legame saturable diretto di proteine purificate utilizzando la risonanza del plasmone superficiale. L’approccio qui descritto è applicabile a tutte le proteine per le quali è possibile generare una sonda di legame ricombinante solubile.
In sintesi, questo è un approccio knockout CRISPR su scala genomica per identificare le interazioni mediate dalle proteine della superficie cellulare. Questo metodo è generalmente applicabile per identificare le vie cellulari necessarie per il riconoscimento della superficie cellulare in una vasta gamma di contesti biologici diversi, tra cui le cellule proprie di un organismo (ad esempio, il riconoscimento neurale e immunologico), nonché tra le cellule ospiti e le proteine patogene. Questo metodo fornisce un’alternativa genetica agli approcci biochimici progettati per l’identificazione dei recettori, e poiché non richiede alcuna ipotesi preliminare per quanto riguarda la natura biochimica o la biologia cellulare dei recettori ha un grande potenziale per fare scoperte completamente inaspettate.
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dalla sovvenzione Wellcome Trust numero 206194 assegnata alla GJW. Ringraziamo la struttura Cytometry Core: Bee Ling Ng, Jennifer Graham, Sam Thompson e Christopher Hall per l’aiuto con FACS.
Anti-mouse alkaline phosphatase | Sigma | A4656 | |
Blasticidin | Chem-Cruz | SC-204655 | |
Blood & Cell Culture DNA Maxi Kit | Qiagen | 13362 | |
BSA | Sigma | A9647-100G | |
Diethanolamine | Sigma | 398179 | |
DMEM | Gibco | 31966-021 | |
Dneasy Blood and Tissue kit | Qiagen | 69504 | |
DynaMag-96 Side Magnet | Invitrogen | 12331D | |
HEK293T packaging cells | ATCC | CRL-3216 | |
Heparin | Sigma | H4784-1G | |
KAPA HiFi HotStart ReadyMix | Kapa | KK2602 | |
Lipofectamine LTX with PLUS reagent | Invitrogen | 15338100 | |
MoFlo XDP cell sorter | BD | ||
Ni2+-NTA agarose beads | Jena Bioscience | AC-501-25 | |
OPTI-MEM | Life Technologies | 31985-070 | |
OX-68 antibody | AbD Serotec | MCA1022R | |
p-nitrophenyl phosphate | Sigma | 1040-506 | |
PD-10 desalting columns | GE healthcare | 17085101 | |
Polybrene | Millipore | TR-1003-G | |
Polypropylene tubes with 5 mL bed volume | Qiagen | 34964 | |
Proteinase K, recombinant, PCR Grade | Roche | 3115879001 | |
Puromycin | Gibco | A11138-03 | |
Q5 Hot Start High-Fidelity 2× Master Mix | NEB | M0494L | |
QIAquick PCR purification kit | Qiagen | 28104 | |
SCFA filter | Nalgene | 190-2545 | |
Sony Cell sorter | Sony | ||
SPRI beads (Agencourt AMPure XP beads) | Beckman | A63881 | |
Streptavidin-coated microtitre plates | Nalgene | 734-1284 | |
Streptavidin-PE | Biolegend | 405204 |