Questo studio mirava a presentare una strategia per identificare le interazioni farmaco-peptidico. La strategia prevede la biopanning di peptidi corti che riconoscono farmaci basati su un biosensore QCM (Quartz-Crystal Microbalance), seguito da un’analisi bioinformatica per valutare quantitativamente le informazioni ottenute per il riconoscimento del farmaco e l’annotazione dei siti di legame farmacologico sulle proteine.
I recettori e le proteine enzimatiche sono importanti biomolecole che fungono da bersagli vincolanti per piccole molecole bioattive. Pertanto, la convalida rapida e globale delle interazioni farmaco-proteina è altamente auspicabile non solo per comprendere i meccanismi molecolari alla base dell’efficacia terapeutica, ma anche per valutare le caratteristiche del farmaco, come adsorbimento, distribuzione, metabolismo, escrezione e tossicità (ADMET) per uso clinico. Qui, presentiamo una strategia ad alta produttività basata su biosensore per la biopanning di peptidi corti visualizzati dal fago T7 che possono essere facilmente visualizzati sul capsid del fago. Viene anche mostrata la successiva analisi delle sequenze di amminoacidi dei peptidi contenenti brevi segmenti, come “reliquie rotte”, dei siti di legame farmacologico che utilizzano programmi di bioinformatica nella suite di contatto con ligando recettore (RELIC). Applicando questo metodo a due farmaci clinicamente approvati, un irinotecan antitumoro e un oseltamivir anti-influenzale, il processo dettagliato per la raccolta delle sequenze peptidiche che riconoscono i farmaci e l’evidenziazione dei siti di legame farmacologico delle proteine bersaglio sono spiegati in questo documento. La strategia descritta nel presente documento può essere applicata per qualsiasi piccola molecola di interesse.
L’identificazione di obiettivi vincolanti per i farmaci è essenziale per lo sviluppo di farmaci e per la comprensione dei meccanismi molecolari delle malattie. In particolare, i recettori e le proteine enzimatiche sono i più importanti bersagli molecolari delle piccole molecolebioattive 1. Sebbene la cattura dell’affinità sia una tecnica ben consolidata per identificare le proteine legantifarmaci 2, i limiti tecnici, come la bassa solubilità delle proteine, spesso ostacolano la convalida degli obiettivi del farmaco2. Ancora più importante, le piccole molecole immobilizzate perdono il grado di libertà necessario per l’attracco e possono essere inaccessibili ai siti di legame situati internamente su proteine bersaglio più grandi. Inoltre, il misfolding proteico, l’incapacità di analizzare le condizioni di co-cristallizzazione e le limitazioni dovute alle dimensioni molecolari spesso ostacolano l’uso della cristallografia a raggi X, della risonanza magnetica nucleare (NMR) e di altre analisi sperimentali per lo studio delle interazioni farmaco-proteina.
L’uso della biopanning del display del fago T7 è un modo efficiente per determinare il sito di legame sulle proteine per le esche di piccole molecole3. In particolare, una libreria peptidica casuale visualizzata dal fago T7, che può essere costruita inserendo DNA sintetico in un sito multi-clonazione, è efficace. Rispetto alla libreria di fago T7 che mostra proteine, i peptidi corti possono essere facilmente progettati per essere visualizzati sul capsid del fago T7 senza restrizioni fisiche, che può stericamente contatto con qualsiasi farmaco di piccola molecola fissato su un supporto solido2. Inoltre, l’introduzione di un biosensore qcm (quartz-crystal microbalance) nella piattaforma di biopanning del display del fago T7 consente l’identificazione di interazioni così deboli ma specifiche di peptidi corti con farmaci monitorando la riduzione della frequenza QCM4,5. Il fago T7 legato viene quindi recuperato direttamente infettando l’ospite Escherichia coli (BLT5615), e viene determinata la sequenza di DNA della regione che codifica il peptide selezionato dall’affinità che ospita brevi segmenti che riconoscono i farmaci. L’analisi successiva della sequenza amminoacidica della popolazione peptidica fornisce informazioni sul riconoscimento dei farmaci. Nel silico l’allineamento a coppie delle sequenze di amminoacidi salvati può essere utilizzato per ottenere informazioni sul bersaglio biologico del farmaco all’interno di un proteoma selezionato. Questa identificazione ad alta produttività di frammenti proteici con affinità verso un farmaco può essere utilizzata per ricostruire euristicamente il sito di legame farmacologico in modo simile a quello della ricostruzione di un antico manufatto da frammenti di ceramica6. In particolare, questo approccio unico può essere utile quando gli approcci proteomici convenzionali falliscono.
Qui presentiamo una strategia basata sul biosensore per la biopanning dei peptidi visualizzati dal fago T7 e l’analisi bioinformatica per la convalida target delle piccole molecole. Al di là delle limitazioni tecniche sui metodi convenzionali, questa strategia consente l’identificazione di siti di legame farmacologico sulle proteine bersaglio per qualsiasi piccola molecola di interesse secondo lo stesso protocollo.
Qui è stata presentata una strategia per la biopanning a base di biosensore QCM dei peptidi che riconoscono i farmaci, seguita da un’analisi bioinformatica per la convalida delle interazioni farmaco-proteina utilizzando i peptidi identificati. Progettare i derivati delle piccole molecole per l’immobilizzazione sull’elettrodo d’oro del biosensore è un passo importante, in quanto il linker introdotto può ostacolare il legame e la raccolta del peptide che riconosce il farmaco. Per evitare questo, vengono preparate derivate con diverse posizioni del linker introdotto23. In alternativa, per immobilizzare piccole molecole idrofobiche, il chip del sensore viene immerso nell’acqua sfusa in una piastra di Petri di 10 cm e una soluzione da 20 μL della piccola molecola (soluzione da 10 mM nel solfossido di dimetile) viene lasciata cadere sull’elettrodo d’oro del biosensore, per coprirne la superficie, e incubata per 5 minuti. Ciò consente la ritenzione di una frequenza intrinseca sottocento hertz di piccole molecole, che viene trattenuta per almeno 10 minuti durante la biopanning. Infatti, utilizzando tale immobilizzazione, i peptidi selezionati per l’affinità di Osel hanno evidenziato chiaramente il sito di legame dell’Osel nella NA (Figura 3).
Il fago T7 utilizzato per preparare la libreria peptidica qui è geneticamente modificato utilizzando la cassetta NNK15 che codifica 32 codoni per tutti i 20 amminoacidi standard e reprime l’emergere di 2 codoni stop (UAA, UGA) ed emerge solo UAG(Figura 1)6,7. Questo è importante per visualizzare peptidi a figura intera di 15 anni e aumentare la diversità della libreria. Il sistema di visualizzazione del fago T7 ha un limite tecnico di visualizzazione di10 7-109 fagi T7. Tuttavia, la diversità della libreria peptidica di 15 anni è teoricamente di 2015 (3,27 × 1019); pertanto, non può essere utilizzato per la costruzione completa della biblioteca. Tuttavia, la ricerca di somiglianza o l’estrazione di motivi conservati consente di rilevare gli amminoacidi che comprendono i siti di legame farmacologico delle proteine anche con questa limitata diversità di peptidi in biblioteca. Inoltre, 3-5 amminoacidi si estendono all’interno del peptide della libreria (il tasso di aspetto è compreso tra 1/203 e 1/ 205, che può essere realizzato utilizzando il sistema di visualizzazione del fago T7) sono coinvolti nel riconoscimento di farmaci di piccole molecole; pertanto, non è necessaria una corrispondenza al 100% delle sequenze peptidiche con sequenze di amminoacidi 15-mer che costituiscono il sito di legame farmacologico della proteina bersaglio. Infatti, circa 30 peptidi selezionati per affinità hanno evidenziato con successo il sito di legame della proteina bersaglio per ciascun farmaco testato (Figura 4). Pertanto, la diversità della libreria di fagi T7 madre utilizzata (1,7 × 107 pfu/mL) può essere utilizzata per ricostruire euristicamente il sito di legame farmacologico.
Tipicamente, 3-5 copie di fagi T7 che mostravano le stesse sequenze di quelle delle sequenze di amminoacidi di 15 anni che ospitavano tratti di amminoacidi che riconoscevano farmaci emersero all’interno delle 16 placche arbitrariamente isolate, indicando il successo della selezione di affinità secondo il nostro protocollo. Ciò indica che 18-30 diverse sequenze peptidiche che riconoscono i farmaci vengono raccolte all’interno delle 96 placche isolate (il numero è associato al formato micropiatta), che vengono identificate successivamente utilizzando il sequenziamento del DNA e ottenendo la corrispondente sequenza di amminoacidi. Nella strategia attuale, l’iniezione di 8 μL della libreria di fago T7 nella cuvetta contenente tampone da 8 mL (diluizione di 1000 volte della libreria) è adatta a ridurre il legame non specifico dei fagi T7. Per aumentare la diversità dei peptidi selezionati dall’affinità, ripetere più volte la selezione a un ciclo e utilizzare 16 o 32 isolamenti della placca per screening si è rivelato più efficace dell’isolamento da una singola soluzione alla volta. Ad esempio, per raccogliere efficacemente circa 30 peptidi selezionati dall’affinità sequenziati in modo diverso, sono stati condotti 3-6 set di selezione a un ciclo, 16 o 32 placche sono state isolate in ogni esperimento. L’aspetto di sequenze identiche in tutte le placche di fago 16 o 32 T7 è indicato come rilevamento accidentale dello sfondo o potrebbe contaminazione come riporto. Al contrario, l’assenza di fagi T7 con la stessa sequenza o comparsa di molti fagi T7 con peptidi più corti rispetto alla lunghezza di 15-mer indica che i fagi T7 nella popolazione non sono emersi specificamente con alta probabilità. Poiché la riduzione della frequenza QCM avviene nella stessa misura anche in questi casi, il successo della selezione dovrebbe essere valutato in modo completo sequenziando il DNA del fago T7 isolato, seguito dall’analisi bioinformatica delle sequenze amminoacidiche dei peptidi. Inoltre, a differenza del protocollo di visualizzazione del fago T7 convenzionale, i cicli ripetuti di selezione sono meno efficaci, in quanto la variazione e il numero dei fagi T7 sono piccoli e non si concentrano anche dopo aver ripetuto le fasi di amplificazione eselezione 23.
È importante sottolineare che questo metodo è applicabile per l’estrazione di piccoli siti di legame molecolare nei proteomi dell’uomo, virus patogeni e persino piante. È interessante notare che la breve lunghezza di visualizzazione possibilmente non strutturata dei peptidi sul capsid del fago T7 può imitare la dinamica molecolare dei peptidi delle proteine durante l’aggancio con una piccola molecola; questo può riflettere l’associazionedinamica 24. Oltre ai limiti tecnici dei metodi convenzionali, questa strategia, applicabile a protocolli identici per piccole molecole, può espandere il proteoma farmaco-beneficio e fornire una maggiore granularità per quanto riguarda l’analisi dell’interazione farmaco-proteina.
Si dovrebbero prendere in considerazione alcune limitazioni tecniche di questo approccio. La sintesi organica è necessaria per l’immobilizzazione di piccole molecole sulla superficie dell’elettrodo d’oro del chip del biosensore. Per i non esperti di chimica organica, alcuni reagenti di immobilizzazione sono commercialmente disponibili per fissare meccanicamente la piccola molecola accoppiando. Inoltre, alcune porzioni senza senso dei peptidi potrebbero comportare il rilevamento di una porzione della proteina non rilevante per l’attracco dei farmaci come falsi positivi. Ciò corrisponde empiricamente a domini ricchi di beta-fogli o leucine ricchi di leucina o residui di valine, che sono codificati da più codoni rispetto ad altri amminoacidi standard, quando vengono prodotte copie del fago T7. Il controllo della lunghezza peptidica della libreria potrebbe controllare il verificarsi di falsi positivi. Al contrario, ci possono essere casi in cui non vengono rilevati residui di amminoacidi nel sito di legame farmacologico coinvolti nell’attracco, come dimostrato utilizzando la cristallografia a raggi X o l’analisi NMR. Questo può essere risolto raccogliendo un maggior numero di peptidi che riconoscono il farmaco o cambiando la direzione di fissaggio delle piccole molecole sull’elettrodo d’oro.
Molte interazioni farmaco-proteina correlate ai principali e secondari effetti del consumo di stupefacenti possono ancora non essere identificate nel proteoma; inoltre, anche gli enzimi e i trasportatori responsabili dell’assorbimento, della distribuzione, del metabolismo, dell’escrezione e della tossicità dei farmaci potrebbero non essere ancora identificati. Il legame proteico non è sempre responsabile della bioattività di un farmaco. Pertanto, una combinazione di altre informazioni provenienti da saggi biologici migliorerà l’identificazione degli obiettivi essenziali in materia di farmaci responsabili degli effetti principali e negativi dei farmaci. Ulteriori adattamenti di questa tecnica concisa aumenteranno la praticità e la produttività per l’estrazione dei siti di legame proteico di una vasta gamma di farmaci a piccole molecole. Il metodo qui presentato contribuirà in gran parte non solo a condurre ricerche di base nei campi correlati, ma chiarirà anche i meccanismi molecolari alla base dell’efficacia terapeutica o di altri effetti biologici dei farmaci nell’uso clinico.
The authors have nothing to disclose.
L’autore ringrazia i Dottori Yujiro Hayashi e Hayato Ishikawa per aver fornito oseltamivir, e il Dr. Lee Makowski per aver fornito i programmi RELIC autonomi. L’autore riconosce anche Tetsuya Kawagoe per l’assistenza tecnica dell’esperimento QCM. Questo lavoro è stato parzialmente supportato dal numero di sovvenzione JSPS KAKENHI 17K01363 (Y.T.).
DICHIARAZIONE DI DISPONIBILITÀ DEI DATI
I programmi RELIC autonomi e i dati di sequenza dei peptidi selezionati per l’affinità per i farmaci, nonché le sequenze proteiche dal database del proteoma utilizzato in questo documento sono disponibili su richiesta di questo autore (tkksg@rs.noda.tus.ac.jp).
AFFINIXQN | ULVAC, Inc. (Tokyo, Japan) | QCM2008-STKIT | Contains Glass cuvette, stir magnet, operation and analysis software with a Windows PC |
AADIV | Northeastern University (Lee Makowski) |
AADIV.exe | Calculates the frequency of occurrence of each of the 20 amino acids at each recombinant insert position, as well as the overall position-independent frequency of each amino acid within that set of peptide sequences. Also roughly estimates the sequence diversity of a display library by statistical sampling method based upon sequences obtained from a limited number of randomly sampled members of the library. |
Ceramic Sensor Chip | ULVAC, Inc. (Tokyo, Japan) | QCMST27C | 4 sensor chips/package |
Dimethyl sulfoxide | Sigma-Aldrich (St. Louis, MO, USA) |
D8418 | |
Ethanol | Merck (Kenilworth, NJ, USA) | 09-0850 | |
FASTAcon | Northeastern University (Lee Makowski) |
FASTAcon.exe | Identifies proteins from a population with short consensus sequences. |
FASTAskan | Northeastern University (Lee Makowski) |
FASTAskan.exe | Lists proteins with high similarity to a peptide population. |
Immiblization kit for AFFINIX | ULVAC, Inc. (Tokyo, Japan) | QCMIMKT | SAM reagent and amine coupling reagent |
INFO | Northeastern University (Lee Makowski) |
INFO.exe | Provides mathematical measure of the probability of observing a particular peptide sequence by random chance (i.e., nonspecific binding) as opposed to by selection for a specific property (affinity to small molecule). |
Liguid LB medium | Sigma-Aldrich (St. Louis, MO, USA) |
L3522 | Autoclave for 20 min |
MATCH | Northeastern University (Lee Makowski) |
MATCH.exe | Identifies any stretches of amino acid residues within a particular protein that exhibit significant similarity to a group of affinity-selected peptides. Outputs as cluster dia- gram and cumulative similarity plot calculated from a modified BLOSUM62 matrix with a short window (5–6 amino acids in length). |
MOTIF1 | Northeastern University (Lee Makowski) |
MOTIF1.exe | Searches for three continuous amino acid sequence motifs within a peptide population. |
MOTIF2 | Northeastern University (Lee Makowski) |
MOTIF2.exe | Searches for patterns of three amino acids and does not allow conservative amino acid substitutions, but does allow identical gap lengths. |
NaCl | Merck (Kenilworth, NJ, USA) | S3014 | |
Recptor ligand contacts (RELIC) | Argonne National Laboratory (Lemont, IL, USA) |
https://www.relic.anl.gov | Currently unavailable (Stand-alone program can be used from correspondence author upon request) |
Tris | Merck (Kenilworth, NJ, USA) | 252859 |