Deze studie was gericht op het presenteren van een strategie voor het identificeren van drug-peptide interacties. De strategie omvat het biopanning van drug-herkennende korte peptiden op basis van een kwarts-kristal microbalans (QCM) biosensor, gevolgd door bioinformatica analyse voor het kwantitatief beoordelen van de informatie verkregen voor de drugherkenning en annotatie van de drug-bindende sites op eiwitten.
Receptoren en enzymeiwitten zijn belangrijke biomoleculen die fungeren als bindende doelen voor bioactieve kleine moleculen. De snelle en wereldwijde validatie van de geneesmiddel-eiwitinteracties is dus zeer wenselijk om niet alleen de moleculaire mechanismen te begrijpen die ten grondslag liggen aan de therapeutische werkzaamheid, maar ook voor het beoordelen van geneesmiddelkenmerken, zoals adsorptie, distributie, metabolisme, excretie en toxiciteit (ADMET) voor klinisch gebruik. Hier presenteren we een biosensorgebaseerde high throughput-strategie voor het biopanning van T7 faag-weergegeven korte peptiden die gemakkelijk kunnen worden weergegeven op de phage capsid. Daaropvolgende analyse van de aminozuursequenties van peptiden die korte segmenten bevatten, als “gebroken relikwieën”, van de medicijnbindende sites met behulp van bioinformaticaprogramma’s in receptor ligand contact (RELIC) suite, wordt ook getoond. Door deze methode toe te passen op twee klinisch goedgekeurde geneesmiddelen, een anti-tumor irinotecan en een anti-griep oseltamivir, wordt het gedetailleerde proces voor het verzamelen van de medicijnherkenningspeptidesequenties en het benadrukken van de medicijnbindende plaatsen van de doeleiwitten in dit artikel uitgelegd. De hierin beschreven strategie kan worden toegepast voor alle kleine moleculen die van belang zijn.
Identificatie van drugsbindende doelstellingen is van essentieel belang voor de ontwikkeling van geneesmiddelen en voor het begrijpen van de moleculaire mechanismen van ziekten. Met name receptor- en enzymeiwitten zijn de belangrijkste moleculaire doelwitten van bioactieve kleinemoleculen 1. Hoewel affinity capture een gevestigde techniek is voor het identificeren van de geneesmiddelbindende eiwitten2, belemmeren technische beperkingen, zoals een lage oplosbaarheid van eiwitten , vaak de validatie van geneesmiddeldoelen2. Het belangrijkste is dat de geïmmobiliseerde kleine moleculen de mate van vrijheid verliezen die nodig is om aan te meren en ontoegankelijk kunnen zijn voor de intern gelegen bindingsplaatsen op grotere doeleiwitten. Bovendien belemmeren eiwitmisvouwen, onvermogen om co-kristallisatieomstandigheden te analyseren en beperkingen als gevolg van moleculaire grootte vaak het gebruik van röntgenkristallografie, nucleaire magnetische resonantie (NMR) en andere dergelijke experimentele analyses voor het bestuderen van geneesmiddel-eiwitinteracties.
Het gebruik van de T7 faag display biopanning is een efficiënte manier voor het bepalen van de bindingsplaats op eiwitten voor klein molecuul aas3. In het bijzonder is een T7-faag-weergegeven willekeurige peptidebibliotheek, die kan worden geconstrueerd door synthetisch DNA in een multi-kloonplaats in te voegen, effectief. In vergelijking met de T7 faagbibliotheek met eiwitten, kunnen de korte peptiden gemakkelijk worden ontworpen om zonder fysieke beperkingen op de T7-faagkapseizen te worden weergegeven, die sterisch contact kunnen maken met elk klein molecuulgeneesmiddel dat op een vaste ondersteuning is bevestigd2. Bovendien maakt de introductie van een kwartskristal microbalans (QCM) biosensor in het T7 faag display biopanning platform het mogelijk om dergelijke zwakke maar specifieke interacties van korte peptiden met geneesmiddelen te identificeren door de vermindering van QCM-frequentie4,5te monitoren. De gebonden T7-faag wordt vervolgens direct hersteld door de gastheer Escherichia coli (BLT5615) te infecteren, en de DNA-sequentie van de regio die het door affiniteit geselecteerde peptide codeert dat medicijnherkenning korte segmenten herbergt, wordt bepaald. Latere analyse van de aminozuursequentie van de peptidepopulatie geeft informatie over medicijnherkenning. In silico pairwise uitlijning van de geredde aminozuursequenties kunnen worden gebruikt om informatie te verkrijgen over het biologische doel van het medicijn binnen een geselecteerd proteoom. Deze hoge doorvoeridentificatie van eiwitfragmenten met affiniteit voor een medicijn kan worden gebruikt om de drugsbindende plaats heuristisch te reconstrueren op een manier die vergelijkbaar is met die van het reconstrueren van een oud artefact van aardewerkscherven6. Deze unieke aanpak kan met name nuttig zijn wanneer conventionele proteomics-benaderingen mislukken.
Hier presenteren we een biosensor-gebaseerde strategie voor het biopanning van T7 faag-weergegeven peptiden en bioinformatica analyse voor de doelvalidatie van de kleine moleculen. Afgezien van technische beperkingen op conventionele methoden, maakt deze strategie de identificatie mogelijk van geneesmiddelbindende locaties op doeleiwitten voor elk klein molecuul dat volgens het identieke protocol van belang is.
Hier is een strategie gepresenteerd voor de QCM biosensor-gebaseerde biopanning van drug-herkennende peptiden, gevolgd door bioinformatica-analyse voor het valideren van geneesmiddel-eiwitinteracties met behulp van de geïdentificeerde peptiden. Het ontwerpen van de kleine molecuulderivaten voor immobilisatie op de gouden elektrode van de biosensor is een belangrijke stap, omdat de geïntroduceerde linker de binding en verzameling van het peptide dat het medicijn herkent, kan belemmeren. Om dit te voorkomen, worden derivaten met verschillende posities van de geïntroduceerde linker bereid23. Als alternatief, voor het immobiliseren van hydrofobe kleine moleculen, wordt de sensorchip ondergedompeld in bulkwater in een Petri-schaal van 10 cm, en een 20 μL-oplossing van het kleine molecuul (10 mM-oplossing in dimethylsulfoxide) wordt op de gouden elektrode van de biosensor gedropt, om het oppervlak te bedekken en gedurende 5 minuten geïncubeerd. Dit maakt het mogelijk om een intrinsieke frequentie van kleine moleculen van onder de honderd hertz te behouden, die tijdens het biopanning minstens 10 minuten wordt vastgehouden. Inderdaad, met behulp van een dergelijke immobilisatie, de Osel affiniteit-geselecteerde peptiden duidelijk benadrukt de Osel-bindende site in NA (Figuur 3).
De T7-faag die hier wordt gebruikt voor het bereiden van de peptidebibliotheek is genetisch gemanipuleerd met behulp van de NNK15-cassette die 32 codons codeert voor alle 20 standaard aminozuren en de opkomst van 2 stopcodons (UAA, UGA) onderdrukt en alleen UAG(figuur 1)6,7naar voren komt. Dit is belangrijk voor het weergeven van 15-mer full-length peptiden en het vergroten van de diversiteit van de bibliotheek. Het T7 faag display systeem heeft een technische display limiet van 107—109 T7 fages. De diversiteit van de 15-mer peptidebibliotheek is echter theoretisch 2015 (3,27 × 1019); het kan dus niet worden gebruikt voor volledige bibliotheekbouw. Niettemin, gelijkenis zoeken of mijnbouw van geconserveerde motieven maakt de detectie van de aminozuren bestaande uit de drug-bindende sites van eiwitten, zelfs met deze beperkte diversiteit van peptiden in de bibliotheek. Bovendien rekt 3-5 aminozuur zich uit in het bibliotheekpeptide (het uiterlijk ligt tussen 1/203 en 1/205, wat kan worden gerealiseerd met behulp van het T7-faagweergavesysteem) zijn betrokken bij de herkenning van geneesmiddelen met kleine moleculen; daarom is een 100% match van de peptidesequenties met 15-mer aminozuursequenties die de medicijnbindende plaats van het doeleiwit vormen niet vereist. Ongeveer 30 door affiniteit geselecteerde peptiden hebben met succes de bindingsplaats van het doeleiwit voor elk getest geneesmiddel benadrukt (figuur 4). Zo kan de diversiteit van de gebruikte T7-faagbibliotheek (1,7 × 107 pfu/ml) worden gebruikt om de medicijnbindende site heuristisch te reconstrueren.
Typisch, 3-5 kopieën van T7 fagen die dezelfde sequenties vertoonden als die van de 15-mer aminozuursequenties met geneesmiddel-herkennende aminozuur rekoefeningen kwamen naar voren in de 16 plaques willekeurig geïsoleerd, wat wijst op het succes van de affiniteit selectie onder ons protocol. Dit geeft aan dat 18-30 verschillende geneesmiddelherkenningspeptidesequenties worden verzameld in de 96 geïsoleerde plaques (het aantal wordt geassocieerd met het microplaatformaat), die vervolgens worden geïdentificeerd met behulp van sequencing van het DNA en het verkrijgen van de overeenkomstige aminozuursequentie. In de huidige strategie is injectie van 8 μL van de T7-faagbibliotheek in de cuvette met 8 ml buffer (1000-voudige verdunning van de bibliotheek) geschikt voor het verminderen van de niet-specifieke binding van T7-fagen. Om de diversiteit van de door affiniteit geselecteerde peptiden te vergroten, bleek het meerdere keren herhalen van een cyclusselectie en het gebruik van 16 of 32 plaque-isolaties per screening effectiever dan isolatie van één oplossing tegelijk. Om bijvoorbeeld effectief ongeveer 30 verschillend gesequentieerde affiniteitsgeselecteerde peptiden te verzamelen, werden 3-6 sets van een cyclusselectie uitgevoerd, 16 of 32 plaques werden geïsoleerd in elk experiment. Het verschijnen van identieke sequenties in alle 16 of 32 T7 faagplaques is geïndiceerd per ongeluk detectie van achtergrond of kan besmetting als een overdracht. Daarentegen geeft de afwezigheid van T7-fagen met dezelfde sequentie of verschijning van veel T7-fagen met kortere peptiden dan de 15-mer-lengte aan dat T7-fagen in de populatie niet specifiek met grote waarschijnlijkheid zijn ontstaan. Aangezien QCM-frequentiereductie zelfs in dergelijke gevallen in dezelfde mate plaatsvindt, moet het succes van de selectie volledig worden geëvalueerd door het DNA van de geïsoleerde T7-faag te sequentiëren, gevolgd door bioinformaticaanalyse van de aminozuursequenties van de peptiden. Bovendien is het herhalen van selectierondes, in tegenstelling tot het conventionele T7-faagweergaveprotocol, minder effectief, omdat de variatie en het aantal T7-fagen klein zijn en zelfs na het herhalen van de versterkings- en selectiestappen niet geconcentreerd zijn23.
Belangrijk is dat deze methode van toepassing is op het delven van kleine molecuulbindende plaatsen in de proteomen van mensen, pathogene virussen en zelfs planten. Interessant is dat de mogelijk ongestructureerde korte weergavelengte van peptiden op de T7-faagcapsid de moleculaire dynamiek van peptiden van eiwitten kan nabootsen tijdens het aanmeren met een klein molecuul; dit kan dynamische bindingweerspiegelen 24. Afgezien van de technische beperkingen van conventionele methoden, kan deze strategie, die van toepassing is op identieke protocollen voor kleine moleculen, het druggable proteoom uitbreiden en meer granulariteit bieden met betrekking tot de analyse van de interactie tussen geneesmiddelen en eiwitten.
Er moet rekening worden gehouden met bepaalde technische beperkingen van deze aanpak. Organische synthese is noodzakelijk voor immobilisatie van kleine moleculen op het gouden elektrodeoppervlak van de biosensorchip. Voor de niet-experts in de organische chemie zijn sommige immobilisatiereagentia in de handel verkrijgbaar om het kleine molecuul mechanisch te fixeren door koppeling. Bovendien kunnen bepaalde onzingedeelten van de peptiden resulteren in de detectie van een deel van het eiwit dat niet relevant is voor het dokken van geneesmiddelen als valse positieven. Dit komt empirisch overeen met bètablad- of leucinerijke domeinen die rijk zijn aan leucine- of valineresiduen, die worden gecodeerd door meer codons dan andere standaard aminozuren, wanneer kopieën van de T7-faag worden geproduceerd. Het controleren van de lengte van het bibliotheekpeptide kan het optreden van valse positieven regelen. Er kunnen daarentegen gevallen zijn waarin aminozuurresiduen op de geneesmiddelbindende plaats die betrokken zijn bij het aanmeren, zoals aangetoond met behulp van röntgenkristallografie of NMR-analyse, niet worden gedetecteerd. Dit kan worden opgelost door het verzamelen van een groter aantal van de drug-herkennende peptiden of het veranderen van de richting van het bevestigen van de kleine moleculen op de gouden elektrode.
Veel geneesmiddel-eiwit interacties die gerelateerd zijn aan de belangrijkste en secundaire effecten van drugsgebruik kunnen nog niet geïdentificeerd zijn in het proteoom; bovendien kunnen enzymen en transporteurs die verantwoordelijk zijn voor de absorptie, distributie, stofwisseling, uitscheiding en toxiciteit van geneesmiddelen, ook nog steeds niet geïdentificeerd zijn. Eiwitbinding is niet altijd verantwoordelijk voor de bioactiviteit van een medicijn. Een combinatie van andere informatie uit biologische tests zal dus de identificatie verbeteren van essentiële geneesmiddelendoelstellingen die verantwoordelijk zijn voor de belangrijkste en nadelige effecten van geneesmiddelen. Verdere aanpassingen van deze beknopte techniek zullen de bruikbaarheid en doorvoer voor de mijnbouw van de eiwitbindende plaatsen van een breed scala aan kleine molecuulgeneesmiddelen vergroten. De hierin gepresenteerde methode zal grotendeels bijdragen tot niet alleen het uitvoeren van fundamenteel onderzoek op de gerelateerde gebieden, maar ook de moleculaire mechanismen verduidelijken die ten grondslag liggen aan therapeutische werkzaamheid of andere biologische effecten van geneesmiddelen bij klinisch gebruik.
The authors have nothing to disclose.
De auteur bedankt Drs. Yujiro Hayashi en Hayato Ishikawa voor het leveren van oseltamivir, en Dr. Lee Makowski voor het leveren van de zelfstandige RELIC-programma’s. De auteur erkent ook Tetsuya Kawagoe voor de technische ondersteuning van het QCM-experiment. Dit werk werd gedeeltelijk ondersteund door JSPS KAKENHI Grant Number 17K01363 (Y.T.).
GEGEVENSBESCHIKBAARHEIDSVERKLARING
De stand-alone RELIC-programma’s en de sequentiegegevens van door affiniteit geselecteerde peptiden voor geneesmiddelen en de eiwitsequenties uit de proteoomdatabase die in dit artikel worden gebruikt, zijn op verzoek verkrijgbaar bij deze auteur (tkksg@rs.noda.tus.ac.jp).
AFFINIXQN | ULVAC, Inc. (Tokyo, Japan) | QCM2008-STKIT | Contains Glass cuvette, stir magnet, operation and analysis software with a Windows PC |
AADIV | Northeastern University (Lee Makowski) |
AADIV.exe | Calculates the frequency of occurrence of each of the 20 amino acids at each recombinant insert position, as well as the overall position-independent frequency of each amino acid within that set of peptide sequences. Also roughly estimates the sequence diversity of a display library by statistical sampling method based upon sequences obtained from a limited number of randomly sampled members of the library. |
Ceramic Sensor Chip | ULVAC, Inc. (Tokyo, Japan) | QCMST27C | 4 sensor chips/package |
Dimethyl sulfoxide | Sigma-Aldrich (St. Louis, MO, USA) |
D8418 | |
Ethanol | Merck (Kenilworth, NJ, USA) | 09-0850 | |
FASTAcon | Northeastern University (Lee Makowski) |
FASTAcon.exe | Identifies proteins from a population with short consensus sequences. |
FASTAskan | Northeastern University (Lee Makowski) |
FASTAskan.exe | Lists proteins with high similarity to a peptide population. |
Immiblization kit for AFFINIX | ULVAC, Inc. (Tokyo, Japan) | QCMIMKT | SAM reagent and amine coupling reagent |
INFO | Northeastern University (Lee Makowski) |
INFO.exe | Provides mathematical measure of the probability of observing a particular peptide sequence by random chance (i.e., nonspecific binding) as opposed to by selection for a specific property (affinity to small molecule). |
Liguid LB medium | Sigma-Aldrich (St. Louis, MO, USA) |
L3522 | Autoclave for 20 min |
MATCH | Northeastern University (Lee Makowski) |
MATCH.exe | Identifies any stretches of amino acid residues within a particular protein that exhibit significant similarity to a group of affinity-selected peptides. Outputs as cluster dia- gram and cumulative similarity plot calculated from a modified BLOSUM62 matrix with a short window (5–6 amino acids in length). |
MOTIF1 | Northeastern University (Lee Makowski) |
MOTIF1.exe | Searches for three continuous amino acid sequence motifs within a peptide population. |
MOTIF2 | Northeastern University (Lee Makowski) |
MOTIF2.exe | Searches for patterns of three amino acids and does not allow conservative amino acid substitutions, but does allow identical gap lengths. |
NaCl | Merck (Kenilworth, NJ, USA) | S3014 | |
Recptor ligand contacts (RELIC) | Argonne National Laboratory (Lemont, IL, USA) |
https://www.relic.anl.gov | Currently unavailable (Stand-alone program can be used from correspondence author upon request) |
Tris | Merck (Kenilworth, NJ, USA) | 252859 |