Este estudo teve como objetivo apresentar uma estratégia para identificar interações medicamentosa-peptídeos. A estratégia envolve o biopanning de peptídeos curtos que reconhecem drogas com base em um biosensor de microequilísã de quartzo-cristal (QCM), seguido de análise bioinformática para avaliação quantitativa das informações obtidas para o reconhecimento de medicamentos e anotação dos locais de ligação medicamentosa em proteínas.
Receptores e proteínas enzimáticas são biomoléculas importantes que atuam como alvos vinculantes para pequenas moléculas bioativas. Assim, a validação rápida e global das interações medicamentosa-proteína é altamente desejável não apenas para compreender os mecanismos moleculares subjacentes à eficácia terapêutica, mas também para avaliar características medicamentosas, como adsorção, distribuição, metabolismo, excreção e toxicidade (ADMET) para uso clínico. Aqui, apresentamos uma estratégia de alto rendimento baseada em biosensor para a biopanning de peptídeos curtos exibidos com phage T7 que podem ser facilmente exibidos no capsídeo phage. A análise subsequente das sequências de aminoácidos de peptídeos contendo segmentos curtos, como “relíquias quebradas”, dos locais de ligação de drogas utilizando programas bioinforáticos no conjunto de ligamento receptor e contato (RELIC). Aplicando este método a dois medicamentos clinicamente aprovados, um irinotecano anti-tumor e um oseltamivir anti-flu, o processo detalhado para a coleta das sequências de peptídeos que reconhecem a droga e destacam os locais de ligação medicamentosa das proteínas-alvo são explicados neste artigo. A estratégia aqui descrita pode ser aplicada para quaisquer pequenas moléculas de interesse.
A identificação de alvos de ligação de drogas é essencial para o desenvolvimento de drogas, bem como para a compreensão dos mecanismos moleculares das doenças. Em particular, as proteínas receptoras e enzimáticas são os alvos moleculares mais importantes das pequenas moléculas bioativas1. Embora a captura de afinidade seja uma técnica bem estabelecida para identificar as proteínas de ligação medicamentosa2, limitações técnicas, como baixa solubilidade de proteínas, muitas vezes dificultam a validação de alvos medicamentosos2. Mais importante, as pequenas moléculas imobilizadas perdem o grau de liberdade necessário para o acoplamento e podem ser inacessíveis aos locais de ligação localizados internamente em proteínas alvo maiores. Além disso, a incompatibilidade de proteínas, a incapacidade de analisar as condições de co-cristalização e as limitações devido ao tamanho molecular muitas vezes dificultam o uso de cristalografia de raios-X, ressonância magnética nuclear (RMN) e outras análises experimentais para o estudo de interações medicamentosa-proteína.
O uso do biopanning de exibição de phage T7 é uma maneira eficiente de determinar o local de ligação em proteínas para iscas de moléculas pequenas3. Em particular, uma biblioteca de peptídeos aleatórios exibida por T7, que pode ser construída inserindo DNA sintético em um local de multi-clonagem, é eficaz. Em comparação com a biblioteca de phage T7 que exibe proteínas, os peptídeos curtos podem ser facilmente projetados para serem exibidos no capsídeo de phage T7 sem restrições físicas, que podem ter contato com qualquer droga de molécula pequena fixada em um suporte sólido2. Além disso, a introdução de um biosensor de microequilísão de quartzo-cristal (QCM) na plataforma de biopanning de exibição de phage T7 permite a identificação de interações tão fracas, mas específicas, de peptídeos curtos com drogas, monitorando a redução da frequência QCM4,5. O phage T7 vinculado é então diretamente recuperado infectando o hospedeiro Escherichia coli (BLT5615), e a sequência de DNA da região que codifica o peptídeo selecionado pela afinidade que abriga segmentos curtos que reconhecem drogas é determinada. A análise subsequente da sequência de aminoácidos da população de peptídeos fornece informações sobre o reconhecimento de drogas. No alinhamento silico pairwise das sequências de aminoácidos resgatados pode ser usado para obter informações sobre o alvo biológico da droga dentro de um proteome selecionado. Esta alta identificação de fragmentos de proteína com afinidade com uma droga pode ser usada para reconstruir heusristicamente o local de ligação de drogas de forma semelhante à da reconstrução de um artefato antigo a partir de fragmentos de cerâmica6. Em particular, essa abordagem única pode ser útil quando as abordagens convencionais de proteômica falham.
Aqui, apresentamos uma estratégia baseada em biosensor para a biopanização de peptídeos e análises bioinformáticas exibidas por físeras T7 para a validação alvo das pequenas moléculas. Além das limitações técnicas sobre os métodos convencionais, essa estratégia permite a identificação de locais de ligação de drogas em proteínas-alvo para qualquer pequena molécula de interesse sob o protocolo idêntico.
Aqui, foi apresentada uma estratégia para o biopanning baseado em biosensor de peptídeos que reconhecem drogas, seguida de análise bioinformática para validação de interações medicamentosa-proteína usando os peptídeos identificados. Projetar os derivados de pequenas moléculas para imobilização no eletrodo de ouro do biosensor é um passo importante, pois o linker introduzido pode dificultar a ligação e a coleta do peptídeo que reconhece a droga. Para evitar isso, derivativos com diferentes posições do linker introduzido são preparados23. Alternativamente, para imobilizar pequenas moléculas hidrofóbicas, o chip do sensor é imerso em água a granel em uma placa de Petri de 10 cm, e uma solução de 20 μL da pequena molécula (solução de 10 mM em sulfóxido de dimetila) é lançada sobre o eletrodo de ouro do biosensor, para cobrir sua superfície, e incubada por 5 minutos. Isso permite a retenção de uma frequência intrínseca de hertz sub-cem de pequenas moléculas, que é mantida por pelo menos 10 minutos durante o biopanning. De fato, utilizando tal imobilização, os peptídeos selecionados pela afinidade osel destacaram claramente o local de vinculação de Osel em NA (Figura 3).
O phage T7 usado para preparar a biblioteca de peptídeos aqui é geneticamente modificado usando o NNK15 que codifica 32 códons para todos os 20 aminoácidos padrão e reprime o surgimento de 2 códons de parada (UAA, UGA) e emerge apenas UAG (Figura 1)6,7. Isso é importante para exibir peptídeos de 15-mer e aumentar a diversidade da biblioteca. O sistema de exibição de phage T7 tem um limite técnico de exibição de 107—109 phages T7. No entanto, a diversidade da biblioteca de peptídeos de 15-mer é teoricamente 2015 (3,27 × 1019); assim, não pode ser usado para construção completa da biblioteca. No entanto, a busca por similaridade ou mineração de motivos conservados permite a detecção dos aminoácidos que compreendem os locais de ligação de drogas de proteínas, mesmo com essa limitada diversidade de peptídeos na biblioteca. Além disso, 3-5 aminoácidos se estendem dentro do peptídeo da biblioteca (a taxa de aparência é entre 1/203 e 1/ 205, que pode ser realizado usando o sistema de exibição de phage T7) estão envolvidos no reconhecimento de pequenas moléculas drogas; portanto, não é necessário um 100% de correspondência das sequências de peptídeos com sequências de aminoácidos de 15-mer que constituem o local de ligação medicamentosa da proteína alvo. De fato, aproximadamente 30 peptídeos selecionados por afinidade destacaram com sucesso o local de ligação da proteína alvo para cada droga testada(Figura 4). Assim, a diversidade da biblioteca de phage T7 pai utilizada (1,7 × 107 pfu/mL) pode ser usada para reconstruir heuristicamente o local de ligação de drogas.
Tipicamente, 3-5 cópias de phages T7 que exibiam as mesmas sequências das sequências de aminoácidos de 15-mer que abrigam trechos de aminoácidos que reconhecem drogas surgiram dentro das 16 placas arbitrariamente isoladas, indicando o sucesso da seleção de afinidade sob nosso protocolo. Isso indica que 18-30 sequências diferentes de peptídeos que reconhecem drogas são coletadas dentro das 96 placas isoladas (o número está associado ao formato microplaca), que são identificados posteriormente usando sequenciamento do DNA e obtenção da sequência de aminoácidos correspondente. Na estratégia atual, a injeção de 8 μL da biblioteca de phage T7 no cuvette contendo tampão de 8 mL (diluição de 1000 vezes da biblioteca) é adequada para reduzir a ligação não específica de phages T7. Para aumentar a diversidade dos peptídeos selecionados por afinidade, repetir a seleção de um ciclo várias vezes e usar 16 ou 32 isolamentos de placas por triagem mostrou-se mais eficaz do que o isolamento de uma única solução de cada vez. Por exemplo, para coletar efetivamente aproximadamente 30 peptídeos selecionados por afinidade sequenciados de forma diferente, foram realizados 3-6 conjuntos de seleção de um ciclo, 16 ou 32 placas foram isoladas em cada experimento. A aparência de sequências idênticas em todas as placas de 16 ou 32 placas de phage T7 são indicadas detecção acidental de fundo ou pode contaminar como uma transferência. Em contraste, a ausência de phages T7 com a mesma sequência ou aparência de muitos phages T7 com peptídeos mais curtos do que o comprimento de 15-mer indica que os phages T7 na população não especificamente emergiram com alta probabilidade. Como a redução da frequência do QCM ocorre na mesma medida mesmo nesses casos, o sucesso da seleção deve ser amplamente avaliado sequenciando o DNA da praga isolada T7, seguida pela análise bioinformática das sequências de aminoácidos dos peptídeos. Além disso, ao contrário do protocolo convencional de exibição de phage T7, repetir rodadas de seleção é menos eficaz, pois a variação e o número dos phages T7 são pequenos e não estão concentrados mesmo após a repetição das etapas de amplificação e seleção23.
É importante ressaltar que este método é aplicável para a mineração de pequenos sítios de ligação de moléculas nos proteomes de humanos, vírus patogênicos e até plantas. Curiosamente, o comprimento de exibição curta possivelmente não estruturado de peptídeos no capsídeo de phage T7 pode imitar a dinâmica molecular dos peptídeos de proteínas durante o acoplamento com uma pequena molécula; isso pode refletir a ligação dinâmica24. Além das limitações técnicas dos métodos convencionais, essa estratégia, aplicável a protocolos idênticos para pequenas moléculas, pode expandir o proteome drogado, bem como proporcionar mais granularidade em relação à análise de interação drogada-proteína.
Algumas limitações técnicas dessa abordagem devem ser consideradas. A síntese orgânica é necessária para a imobilização de pequenas moléculas na superfície do eletrodo de ouro do chip biosensor. Para os não especialistas em química orgânica, alguns reagentes de imobilização estão disponíveis comercialmente para fixar mecanicamente a pequena molécula por acoplamento. Além disso, certas porções sem sentido dos peptídeos podem resultar na detecção de uma porção da proteína não relevante para o acoplamento de drogas como falsos positivos. Isso corresponde empiricamente a domínios ricos em folha beta ou leucinas ricos em resíduos de leucina ou valina, que são codificados por mais códons do que outros aminoácidos padrão, quando cópias do phage T7 são produzidas. Controlar o comprimento do peptídeo da biblioteca pode controlar a ocorrência de falsos positivos. Em contraste, pode haver casos em que resíduos de aminoácidos no local de ligação de drogas que estão envolvidos no acoplamento, como demonstrado usando cristalografia de raios-X ou análise de RMN, não são detectados. Isso pode ser resolvido coletando um número maior dos peptídeos que reconhecem a droga ou mudando a direção da fixação das pequenas moléculas no eletrodo de ouro.
Muitas interações medicamentosa-proteínas que estão relacionadas aos principais e secundários efeitos do uso de drogas ainda podem não ser identificadas no proteome; além disso, enzimas e transportadores responsáveis pela absorção de medicamentos, distribuição, metabolismo, excreção e toxicidade, também podem ainda não ser identificados. A ligação proteica nem sempre é responsável pela bioatividade de uma droga. Assim, uma combinação de outras informações de ensaios biológicos melhorará a identificação de alvos essenciais de drogas responsáveis pelos principais e adversos efeitos das drogas. Outras adaptações desta técnica concisa aumentarão a praticidade e o throughput para a mineração dos locais de ligação proteica de uma ampla gama de pequenas moléculas. O método aqui apresentado contribuirá em grande parte para não apenas realizar pesquisas básicas nos campos relacionados, mas também esclarecer os mecanismos moleculares subjacentes à eficácia terapêutica ou outros efeitos biológicos de drogas no uso clínico.
The authors have nothing to disclose.
O autor agradece aos Drs. Yujiro Hayashi e Hayato Ishikawa por fornecerem oseltamivir, e o Dr. Lee Makowski por fornecer os programas autônomos de RELÍQUIAS. O autor também reconhece Tetsuya Kawagoe pela assistência técnica do experimento QCM. Este trabalho foi parcialmente apoiado pelo JSPS KAKENHI Grant Número 17K01363 (Y.T.).
DECLARAÇÃO DE DISPONIBILIDADE DE DADOS
Os programas relic autônomos e os dados sequenciais de peptídeos selecionados por afinidade para medicamentos, bem como as sequências proteicas do banco de dados proteome utilizado neste artigo estão disponíveis a partir deste autor mediante solicitação (tkksg@rs.noda.tus.ac.jp).
AFFINIXQN | ULVAC, Inc. (Tokyo, Japan) | QCM2008-STKIT | Contains Glass cuvette, stir magnet, operation and analysis software with a Windows PC |
AADIV | Northeastern University (Lee Makowski) |
AADIV.exe | Calculates the frequency of occurrence of each of the 20 amino acids at each recombinant insert position, as well as the overall position-independent frequency of each amino acid within that set of peptide sequences. Also roughly estimates the sequence diversity of a display library by statistical sampling method based upon sequences obtained from a limited number of randomly sampled members of the library. |
Ceramic Sensor Chip | ULVAC, Inc. (Tokyo, Japan) | QCMST27C | 4 sensor chips/package |
Dimethyl sulfoxide | Sigma-Aldrich (St. Louis, MO, USA) |
D8418 | |
Ethanol | Merck (Kenilworth, NJ, USA) | 09-0850 | |
FASTAcon | Northeastern University (Lee Makowski) |
FASTAcon.exe | Identifies proteins from a population with short consensus sequences. |
FASTAskan | Northeastern University (Lee Makowski) |
FASTAskan.exe | Lists proteins with high similarity to a peptide population. |
Immiblization kit for AFFINIX | ULVAC, Inc. (Tokyo, Japan) | QCMIMKT | SAM reagent and amine coupling reagent |
INFO | Northeastern University (Lee Makowski) |
INFO.exe | Provides mathematical measure of the probability of observing a particular peptide sequence by random chance (i.e., nonspecific binding) as opposed to by selection for a specific property (affinity to small molecule). |
Liguid LB medium | Sigma-Aldrich (St. Louis, MO, USA) |
L3522 | Autoclave for 20 min |
MATCH | Northeastern University (Lee Makowski) |
MATCH.exe | Identifies any stretches of amino acid residues within a particular protein that exhibit significant similarity to a group of affinity-selected peptides. Outputs as cluster dia- gram and cumulative similarity plot calculated from a modified BLOSUM62 matrix with a short window (5–6 amino acids in length). |
MOTIF1 | Northeastern University (Lee Makowski) |
MOTIF1.exe | Searches for three continuous amino acid sequence motifs within a peptide population. |
MOTIF2 | Northeastern University (Lee Makowski) |
MOTIF2.exe | Searches for patterns of three amino acids and does not allow conservative amino acid substitutions, but does allow identical gap lengths. |
NaCl | Merck (Kenilworth, NJ, USA) | S3014 | |
Recptor ligand contacts (RELIC) | Argonne National Laboratory (Lemont, IL, USA) |
https://www.relic.anl.gov | Currently unavailable (Stand-alone program can be used from correspondence author upon request) |
Tris | Merck (Kenilworth, NJ, USA) | 252859 |