Summary

Troca específica de resíduo de Proline por Análogos Proline em Proteínas Fluorescentes: Como a "Cirurgia Molecular" da espinha dorsal afeta o dobrável e a estabilidade

Published: February 03, 2022
doi:

Summary

Para superar as limitações da mutagênese clássica dirigida ao local, os análogos proline com modificações específicas foram incorporados em várias proteínas fluorescentes. Mostramos como a substituição do hidrogênio por flúor ou do single por dupla ligação em resíduos de prolina (“cirurgia molecular”) afeta propriedades proteicas fundamentais, incluindo sua dobra e interação com a luz.

Abstract

A substituição de resíduos proline (Pro) em proteínas pela mutagênese tradicional dirigida ao local por qualquer um dos 19 aminoácidos canônicos restantes é muitas vezes prejudicial à dobra de proteínas e, em particular, à maturação do cromoforino em proteínas fluorescentes verdes e variantes relacionadas. Uma alternativa razoável é manipular a tradução da proteína para que todos os resíduos Pro sejam substituídos especificamente por análogos, um método conhecido como incorporação de pressão seletiva (SPI). As modificações químicas incorporadas podem ser usadas como uma espécie de “cirurgia molecular” para dissecar finamente mudanças mensuráveis ou mesmo manipular racionalmente diferentes propriedades proteicas. Aqui, o estudo demonstra a utilidade do método SPI para estudar o papel das prolines na organização da estrutura típica β-barril de variantes espectrais da proteína fluorescente verde (GFP) com prolines 10-15 em sua sequência: proteína fluorescente verde aprimorada (EGFP), NowGFP e KillerOrange. Os resíduos pro estão presentes na conexão de seções entre β-fios individuais e constituem as tampas de fechamento do andaime do barril, sendo assim responsável pelo isolamento do cromoforo da água, ou seja, propriedades de fluorescência. Experimentos seletivos de incorporação de pressão com (4R)-fluoroproline (R-Flp), (4S)-fluoroproline (S-Flp), 4,4-difluoroproline (Dfp) e 3,4-dehidroproline (Dhp) foram realizados utilizando uma cepa proline-auxotropo E. coli como hospedeiro de expressão. Descobrimos que as proteínas fluorescentes com S-Flp e Dhp são ativas (ou seja, fluorescentes), enquanto os outros dois análogos (Dfp e R-Flp) produziram proteínas disfuncionais e mal dobradas. A inspeção dos perfis de absorção e emissão de fluorescência UV-Vis mostrou poucas alterações características nas proteínas que contêm análogos Pro. O exame dos perfis cinéticos dobráveis nas variantes EGFP mostrou um processo acelerado de re dobrar na presença de S-Flp, enquanto o processo foi semelhante ao tipo selvagem na proteína que contém Dhp. Este estudo mostra a capacidade do método SPI de produzir modificações sutis de resíduos proteicos a um nível atômico (“cirurgia molecular”), que podem ser adotadas para o estudo de outras proteínas de interesse. Ilustra os resultados das substituições de prolina com análogos químicos próximos nas propriedades dobráveis e espectroscópicas na classe de proteínas fluorescentes de β barris.

Introduction

Mutagênese clássica dirigida por local permite a permutação de qualquer sequência de proteína codificada por genes existentes por manipulação de codon no nível de DNA. Para estudar a dobra de proteínas e a estabilidade, muitas vezes é desejável substituir aminoácidos semelhantes por contrapartes semelhantes. No entanto, a mutagênese proteica tradicional é definitivamente limitada a substituições estruturalmente semelhantes entre aminoácidos canônicos como Ser/Ala/Cys, Thr/Val, Glu/Gln, Asp/Asn, Tyr/Phe, que estão presentes no repertório padrão do código genético. Por outro lado, não existem tais possibilidades para outros aminoácidos canônicos como Trp, Met, His ou Pro, que muitas vezes desempenham papéis estruturais e funcionais essenciais nas proteínas1. Uma abordagem ideal para estudar essas interações no contexto da arquitetura interna altamente específica das proteínas e seu processo de dobramento é gerar modificações isostericas sem interrupções. De fato, quando os análogos isotéricos desses aminoácidos canônicos, também conhecidos como aminoácidos não canônicos (ncAAs), são inseridos em proteínas, permitem mudanças sutis mesmo no nível de átomos únicos ou grupos átomos como H/F, CH2/S/Se/Te conhecidos como “mutações atômicas”2. Essa “cirurgia molecular” produz proteínas alteradas cujas propriedades resultam apenas da troca de átomos únicos ou grupos de átomos, que em casos favoráveis podem ser analisados, e as alterações detectadas podem ser racionalizadas. Dessa forma, o escopo da síntese proteica para estudar a dobra de proteínas e a estrutura é estendido muito além da mutagênese clássica do DNA. Observe que as proteínas geradas pela mutagênese dirigida ao local são geralmente referidas como “mutantes”, enquanto proteínas com aminoácidos canônicos substituídos são referidas como “variantes” 3, “aoproteínas”4 ou “congêneres proteicos”5.

A proteína fluorescente verde (GFP), identificada pela primeira vez no organismo marinho Aequorea victoria, exibe fluorescência verde brilhante quando exposta à luz ultravioleta-azul 6,7. Hoje em dia, o GFP é comumente usado como uma ferramenta de rotulagem altamente sensível para visualização rotineira da expressão genética e localização de proteínas em células através de microscopia fluorescente. A GFP também se mostrou útil em diversos estudos biofísicos 8,9,10 e biomédicos11,12, bem como em engenharia de proteínas 13,14,15. A análise rigorosa da estrutura GFP possibilitou a criação de inúmeras variantes caracterizadas pela estabilidade variada e fluorescência máxima16,17. A maioria das variantes GFP utilizadas na biologia celular e molecular são proteínas monoméricas tanto em solução quanto no cristal18. Sua principal organização estrutural é típica para todos os membros da família GFP, independente de sua origem filogenética, e consiste em 11 β-strands formando um chamado β-barril, enquanto uma α-hélice torcido está correndo pelo centro do barril e carrega o cromoforeiro (Figura 1A). A maturação autocatática do cromoóforo (Figura 1B) requer o posicionamento preciso das cadeias laterais ao seu redor no local central da proteína; muitas dessas cadeias laterais são altamente conservadas em outras variantes GFP19. Na maioria das proteínas fluorescentes de águas-vivas como a Aequorea victoria, o cromoóforo emissor verde consiste de dois anéis aromáticos, incluindo um anel de fenol de Tyr66 e a estrutura heterocíclica de cinco membros de imidazolinona (Figura 1B). O cromoforo, quando devidamente incorporado na matriz proteica, é responsável pela fluorescência característica de toda a proteína. Está localizada no centro da estrutura, enquanto a estrutura do barril a isola do meioaquoso 20. A exposição do cromoforo à água a granel resultaria em fluorescência saciando, ou seja, perda de fluorescência21.

A dobra adequada da estrutura semelhante ao barril é essencial para proteger o cromoforoforo contra a fluorescência saciando22. Os resíduos proline (Pro) desempenham um papel especial na organização estrutural da GFP23. Por serem incapazes de suportar uma β-fios, eles constituem laços de conexão responsáveis pela manutenção da estrutura proteica como um todo. Não surpreende que 10-15 resíduos de prolina são encontrados tanto em GFPs derivados de Aequorea quanto em Anthoathecata; alguns deles são altamente conservados em outros tipos de proteínas fluorescentes β-barril. Espera-se que as prolines influenciem criticamente as propriedades dobráveis devido às suas características geométricas peculiares. Por exemplo, em GFPs derivados da Aequorea, dos dez resíduos proline (Figura 2A), nove formam trans e apenas um forma uma ligação cis-peptídeo (Pro89). Pro58 é essencial, ou seja, não intercambiável com o resto dos 19 aminoácidos canônicos. Este resíduo pode ser responsável pelo posicionamento correto do resíduo Trp57, que tem sido relatado como crucial para a maturação do cromoforo e o GFP total dobrável24. O fragmento PVPWP com três resíduos de prolina (Pro54, Pro56, Pro58) e Trp57 é a parte essencial da “tampa inferior” na estrutura GFP da Figura 1A. O motivo estrutural PVPWP é encontrado em várias proteínas, como citocromias e canais de potássio ativados por tensão eucariótica25. Substituições pró-alanina nas posições 75 e 89 também são prejudiciais à expressão proteica e à dobra e abolim a maturação do cromoforino. Pro75 e Pro89 fazem parte da “tampa superior” que enterra o cromoforo (Figura 1A) e são conservados em proteínas fluorescentes de 11 canções β barris23. Essas duas “tampas” mantêm o cromoforoforo excluído do solvente aquoso, mesmo quando a estrutura terciária estável foi parcialmente quebrada26. Tal arquitetura molecular específica protege o fluoróforo da fluorescência collisional (dinâmica) saciando, por exemplo, por água, oxigênio ou outros ligantes difusíveis.

Para realizar a engenharia molecular da estrutura GFP, deve-se introduzir substituições de aminoácidos na estrutura primária da proteína. Inúmeras mutações foram realizadas no GFP, fornecendo variantes com estabilidade elevada, dobramento rápido e confiável e propriedades de fluorescênciavariável 17. No entanto, na maioria dos casos, a mutação de resíduos de prolina é considerada uma abordagem arriscada devido ao fato de que nenhum dos 19 aminoácidos canônicos restantes pode restaurar adequadamente o perfil conformacional do resíduo proline27. Assim, desenvolve-se uma abordagem alternativa, na qual os resíduos de prolina são substituídos por outras estruturas baseadas em prolina, apelidadas de análogos proline28. Devido à sua estrutura química cíclica única, a proline exibe duas transições conformais características (Figura 1C): 1) o enrijecimento do anel proline, um processo rápido que implica a organização da espinha dorsal, que afeta principalmente o ângulo de torção φ, e 2) a isomerização de ligação de peptídeo cis/trans, um processo lento que impacta a dobra da espinha dorsal através dos ângulos de torção ωrs. Devido à sua natureza lenta, a última transição é comumente responsável pelas etapas limitantes da taxa no processo de dobramento de toda a proteína. Foi demonstrado anteriormente que a isomerização de laços/trans de peptídeos em torno de alguns resíduos de prolinação apresenta passos lentos na dobra de variantes GFP. Por exemplo, a formação do vínculo cis-peptídeo no Pro89 apresenta o passo lento no processo de dobramento porque depende da transição de vínculo de trans para cis29. Uma redobramento mais rápida pode ser alcançada após a substituição do Pro89 por um loop de peptídeo totalmente trans, ou seja, abolindo um evento de isomerização cis-to-trans 30. Além da isomerização cis/trans, as transições mais pucker também podem gerar mudanças profundas na dobra de proteínas devido à organização da espinha dorsal e embalagem dentro do interior da proteína27,31.

Modificações químicas resultam em alteração das transições conformais intrínsecas dos resíduos prolinais, afetando assim a capacidade da proteína de dobrar. Certos análogos prolinas são candidatos particularmente atraentes para a substituição de proline em proteínas, pois permitem a manipulação e estudo das propriedades dobráveis. Por exemplo, (4R)-fluoroprolina (R-Flp), (4S)-fluoroprolina (S-Flp), 4,4-difluoroprolina (Dfp) e 3,4-dehydroproline (Dhp) são quatro análogos (Figura 1D) que diferem minimamente da prolina em termos de volume molecular e polaridade32. Ao mesmo tempo, cada análogo exibe um toque distinto: S-Flp estabiliza o disco C 4-endo, R-Flp estabiliza o disco C4-exo, Dfp não exibe nenhuma preferência aparente de pucker, enquanto Dhp aboli o puckering (Figura 1D)33. Usando esses análogos na estrutura proteica, pode-se manipular com a transição conformacional dos resíduos prolinais, e com isso, afetar as propriedades das variantes GFP resultantes.

Neste trabalho, pretendemos incorporar o conjunto designado de análogos proline (Figura 1D) na estrutura das variantes GFP utilizando o método de incorporação de pressão seletiva (SPI, Figura 3)34. A substituição de resíduos de aminoácidos por seus análogos isoestruturais mais próximos é um conceito biotecnológico aplicado no desenhode proteínas 35,36. Assim, os efeitos dos análogos prolinatos em uma proteína modelo ilustram seu potencial para servir como ferramentas na engenharia de proteínas37. A produção de proteínas contendo análogos desejados foi realizada em cepas modificadas de E. coli que não são capazes de produzir proline (proline-auxotrofia). Assim, poderiam ser forçados a aceitar a substituição de substratos no processo de biosíntese proteica38. Esta substituição global de prolina é habilitada pela flexibilidade natural do substrato das sintetizações aminoáclicas endogensas39, as enzimas-chave catalisando a esterificação de tRNAs com aminoácidosapropriados 40. Em geral, conforme descrito na Figura 3, o crescimento celular é realizado em meio definido até que a fase de crescimento logarítmico seja alcançada. Na etapa seguinte, o aminoácido a ser substituído é intracelularmente esgotado do sistema de expressão durante a fermentação e posteriormente trocado pelo analógico ou ncAA desejado. A expressão proteica-alvo é então induzida para incorporação de aminoácidos não canônicos específicos de resíduos. A substituição do aminoácido cognato pelo seu análogo ocorre de forma proteome-wide. Embora esse efeito colateral possa ter um impacto negativo no crescimento da cepa hospedeira, a qualidade da produção de proteína-alvo não é afetada principalmente, uma vez que, na expressão recombinante, os recursos celulares são principalmente direcionados para a produção da proteína-alvo41,42. Portanto, um sistema de expressão fortemente regulado e indutível e fortes promotores são cruciais para a alta eficiência de incorporação43. Nossa abordagem baseia-se na incorporação de múltiplos ncAAs específicos em resposta a códons de sentido (redesignação de códons de sentido), pelo qual, dentro do gene alvo, o número de posições para inserção analógica Pro pode ser manipulado através da mutagênese direcionada ao local44. Uma abordagem semelhante foi aplicada em nosso relatório anterior sobre a preparação de peptídeos recombinantes com propriedades antimicrobianas45. Neste trabalho, aplicamos o método SPI, que permite que todos os resíduos de prolina sejam substituídos por análogos relacionados, para gerar proteínas que se espera possuir propriedades físico-químicas distintas não presentes em proteínas sintetizadas com o repertório de aminoácidos canônicos. Ao caracterizar o perfil de dobra e fluorescência das variantes resultantes, pretendemos mostrar os efeitos das substituições atômicas em variantes de GFP.

Protocol

1. Introdução de plasmídeos de expressão em células E. coli pró-auxotróficas competentes Misture 1ng de cada pládide de cada amostra, pQE-80L H 6-EGFP, pQE-80L H6-NowGFP, e pQE-80L H6-KillerOrange, com 50 μL de células quimicamente competentes ou eletrocompetntes do Pro-auxotrophic E. coli K12- cepa derivada JM83 (Addgene #50348, ou ATCC #35607) para transformação pelo método de choque térmico ou eletroporação de acordo com os protocolos disponíveis 46, 47.NOTA: A expressão vetorial pQE-80L EGFP-H6 codifica uma proteína fluorescente verde aprimorada com etiqueta C 6xHis (EGFP), os vetores de expressão pQE-80L H6-Now PQFP e pQE-80L H 6-KillerOrange codificam um NowGFP 48 com marca N-terminal ou um KillerOrange 49 com marca N-terminal ou um KillerOrange49 com marca N-terminal, respectivamente, cada um em uma espinha dorsal plasmid pQE-80L. Todos os genes alvo estão sob o controle de um promotor T5 bacteriano regulado pelo operador de lac. A resistência à ampicilina foi usada como marcador de seleção e colE1 como a origem da replicação. Consulte a Tabela de Materiais para obter mais informações sobre o plasmídeo pQE-80L. Alternativa Pró-auxotrófica E. coli originária das cepas K-12 e B também pode ser usada para expressão e deve produzir resultados semelhantes. A massa molecular calculada das proteínas do tipo selvagem singada([M+H]+) (após a maturação do cromoforo) são de 27.745,33 Da (EGFP- H6), 27.931,50 Da (H 6-NowGFP) e 27.606,09 Da (H6-KillerOrange). As estruturas primárias das proteínas-alvo são dadas na Tabela 1 (Sua tag sublinhada). A glutamina (Q) dentro da sequência de Sua tag do NowGFP foi identificada por sequenciamento de DNA após subclora do CDNA NowGFP recebido de Pletnev et al.51 no plasmídeo pQE-80L. Não impede a purificação de proteínas ou as propriedades da proteína fluorescente. Recupere as células em 950 μL de soc médio a 37 °C por 1 h. Espalhe 50 μL das células recuperadas em placas médias de Luria Agar (LA) (ver Material Suplementar) contendo glicose (10 g/L) e ampicillina (100 μg/mL). Incubar as placas médias de LA a 37 °C durante a noite ou 30 °C por 24 h. 2. Produção de proteínas fluorescentes do tipo selvagem recombinante (abrigando proline canônica) e procedimento para incorporação de pressão seletiva (SPI) para produzir proteínas fluorescentes com análogos prolinas (S-Flp, R-Flp, Dfp, Dhp) Cultura noturna da cepa pro-auxotrophic E. coli K12-derivado JM83 abrigando pQE-80L EGFP-H6, pQE-80L H 6-NowGFP, e pQE-80L H 6-KillerOrange Use uma ponta de pipeta estéril ou laço de inoculação para selecionar uma única colônia a partir de uma placa média de LA e resuspenque as células em 5 mL de caldo de lysogeny (LB) médio (ver Material Suplementar; contendo 10 g/L glicose, 100 μg/mL ampicillin) em um tubo de cultura de poliestireno estéril de 14 mL.NOTA: Colônias recém-transformadas são recomendadas para a inoculação. As células em placas médias la (a partir da etapa 2.2.) armazenadas a 4 °C devem ser usadas dentro de alguns dias. Cresça a cultura celular durante a noite a 37 °C em um agitador orbital a 200-250 rpm. Produção de EGFP-H recombinante6, H6-NowGFP e H6-KillerOrange com prolina nativa e as variantes de proteína correspondentes com análogos prolinasInoculado 200 mL de médio NMM fresco (7,5 mM (NH4)2SO4, 50 mM K2HPO4 e 22 mM KH2PO4, 8,5 mM NaCl, 1 mM MgSO4, 20 mM D-glicose, 1 μg/mL FeCl2, 1 μg/mL CaCl2, 10 μg/mL thiamine, 10 μg/mL biotin, 0,01 μg/mL traços (CuSO4, ZnCl2, MnCl2, (NH4)2MoO4), pH ~7.2) com todos os l-aminoácidos canônicos (50 mg/L); ver Material Suplementar) suplementado com 100 μg/mL ampicillin com 2 mL da cultura da noite para o dia em um frasco 2-L Erlenmeyer.NOTA: Dependendo do tipo de proteína, podem ser testadas mídias alternativas de cultivo como MOPS médio52, sais glicentas-minerais médios53, meio mínimode Davis 54, M9 médio mínimo55 ou GMML56 para otimizar o rendimento da proteína. Incubar as células a 37 °C em um agitador orbital a 220 rpm por ~3 h 30 min. Meça a densidade óptica a 600 nm (OD600) em um espectrômetro a cada 30 minutos até que um valor de600 OD de ~ 0,7 seja atingido.NOTA: Para determinação de OD600 em um espectrômetro, o cuvette deve ter um comprimento de caminho de 1 cm. O meio de cultivo correspondente é utilizado para a medição de referência (“zero”). O tempo de incubação até que um valor de600 OD de ~ 0,7 seja atingido pode depender do volume cultural. 3 h 30 min é um valor aproximado. Numa variação do protocolo subpassa 2.2.1-2.2.3., a cultura do subpasso 2.1.2. é usado para inocular o meio NMMΔPro fresco (ver Material Suplementar) complementado com uma concentração limitada de proline (por exemplo, 5 mg/L em vez de 50 mg/L), e as células são cultivadas durante a noite a 37 °C em um agitador orbital a 220 rpm. No dia seguinte, a determinação do OD600 é realizada a cada 30 minutos até que as diferenças entre as medidas sejam inferiores a 0,05. O valor máximo de600 OD deve ficar em torno de 1 (± 0,3). A concentração proline inicial e limitada pode ser ajustada dependendo da expressão e do meio de cultivo (ver Discussão). Gire a suspensão da célula por 10 min a 3.000 x g e 4 °C. Gentilmente decantar o supernatante em desperdício. Etapa de lavagem: Resuspense as células em 50 mL de NMMΔAA (sem qualquer aminoácido, consulte Material Suplementar) ou NMMΔPro (sem proline, consulte Material Suplementar) médio por pipetação cuidadosa.NOTA: Para esta etapa de lavagem, qualquer um dos dois buffers indicados pode ser usado, uma vez que é apenas importante se livrar da prolina residual no meio de incubação. Separe as células do meio por sedimentação a 4 °C em uma centrífuga a 3.000 x g por 10 min. Gentilmente decantar o supernatante em desperdício. Pipeta suavemente para cima e para baixo para resuspensar a pelota celular em 200 mL de NMMΔPro médio suplementado com 100 μg/mL ampicillin em um frasco 2-L Erlenmeyer.NOTA: A suspensão celular resultante pode ser separada em várias amostras de volume igual para obter culturas de início idênticas para comparar a expressão proteica na presença de análogos Pro ou proline (por exemplo, separação em frascos de 4 x 50 mL em frascos de Erlenmeyer de 100 mL). Incubar por 30 min a 37 °C em um agitador orbital a 220 rpm para o esgotamento completo do Pro.NOTA: Este passo é fundamental para esgotar completamente o Pro das células. Adicione um volume apropriado de solução de estoque L-proline ou R-Flp, S-Flp, Dfp e Dhp a partir de 50 mM para ajustar a concentração final de 1 mM na suspensão celular.NOTA: Como regra geral, as novas soluções de estoque de 50 mM de derivativos Pro ou proline devem estar sempre preparadas antes do uso. Somente se a hidrólise do aminoácido canônico ou não canônico em uma solução aquosa não for uma preocupação, os estoques congelados também podem ser usados. Adicione 0,5 mM IPTG de uma solução de estoque de 1 M para induzir a expressão proteica alvo. Expresse a proteína alvo durante a noite (12 h) a 37 °C em um agitador orbital a 220 rpm. Medir OD600 no dia seguinte.NOTA: A determinação de OD600 é feita para quantificar a quantidade de células após a expressão proteica. Um valor de600 OD menor em relação ao valor medido antes da etapa de lavagem 2.2.3 indica citotoxicidade do aminoácido fornecido. Neste caso, o procedimento deve ser repetido com a concentração do aminoácido fornecido minimizado (até 0,1 mM). Centrifugar e coletar as células bacterianas a 5.000 x g e 4 °C por 10 min e decantar o sobrenante em resíduos. Etapa de lavagem: Resuspenque as células por tubos cuidadosos em 50 mL de tampão de ligação (50 mM Tris-HCl, pH 8.0, 150 mM NaCl, 1 mM DTT) contendo 10% de glicerol e transfira a suspensão da célula para um tubo de poliestireno cônico de 50 mL. Centrifugar e coletar as células bacterianas a 5.000 x g e 4 °C por 10 min e decantar o sobrenante em resíduos. Armazene a pelota celular em um tubo de poliestireno cônico de 50 mL a -20 °C ou -80 °C até que use mais (purificação de proteínas, veja abaixo). 3. Procedimento de purificação de amostras de proteína por cromatografia de afinidade de íons metálicos imobilizados (IMAC) Lise celular bacterianaNOTA: Realize todas as etapas da lise celular no gelo ou a 4 °C para evitar a degradação da proteína alvo. Descongele a pelota de célula bacteriana no gelo ou a 4 °C em um tubo de poliestireno cônico de 50 mL por 10-20 min. Adicione 10 mL de tampão de ligação gelada (ver Material Suplementar) e pipeta suavemente para cima e para baixo para resuspensar a pelota da célula. Adicione 100 μL de 50 mg/mL lysozyme, 100 μL de 1 mg/mL DNase I, 100 μL de 1 mg/mL RNase A, 30 μL de 1 MMMML2. Inverta cuidadosamente a suspensão da célula cinco vezes, e mantenha o tubo fechado no gelo ou a 4 °C por 60 min.NOTA: A linsozyme induz a lise celular química ao interromper a parede celular bacteriana. Sonicar a amostra para interrupção celular usando um homogeneizador de ultrassom (por exemplo, 3 vezes por 3 min em um tubo de poliestireno de 50 mL em uma mistura de água gelada, pulso 2 s/pause 4 s, 45% de amplitude).NOTA: Alternativamente, outros métodos de interrupção celular podem ser usados, por exemplo, homogeneização de alta pressão em 20 ciclos a 14.000 psi. Se necessário, diluir usando um tampão de ligação (ver Material Suplementar) para atingir o volume mínimo do instrumento. Além disso, reagentes de extração de proteínas podem ser usados para perturbação celular. Consulte a Tabela de Materiais , por exemplo. Centrifugar por 60 min a 18.000 x g, 4 °C. Observe o volume líquido para o subpass 3.1.9. e despeje o supernatante em um tubo de poliestireno fresco de 50 mL. Limpe o supernatante usando um filtro de membrana com 0,45 μm de diâmetro de poros. Pegue uma amostra de “lysate” para SDS-PAGE (ver seção 4. abaixo); isso corresponde à “fração de proteína solúvel”, o sobrenatante do subseto 3.1.6. Adicione um volume igual de ddH2O conforme determinado na subpresto 3.1.6. para resuspensar os detritos celulares a fim de manter a mesma diluição das amostras para análise subsequente de SDS-PAGE. Pegue uma amostra de “pelota” para SDS-PAGE (ver seção 4. abaixo); isso corresponde à “fração proteica insolúvel”, a suspensão dos detritos celulares do subpasso 3.1.9. Purificação de cromatografia de afinidade metálica imobilizada (IMAC)NOTA: A purificação da proteína fluorescente alvo pode ser realizada a 4 °C ou à temperatura ambiente (TR). Para esta última opção, aguarde que o lise, coluna e todos os buffers se equilibrem no RT para evitar a formação de bolhas de ar devido à vaporização do ar preso em solução fria após a colocação em uma coluna quente. Purifique a amostra usando uma coluna IMAC FPLC pré-embalada ou auto-embalada de 1 mL (cromatografia líquida de proteína rápida [ou desempenho]) de acordo com as instruções do fabricante; definir a pressão máxima da coluna para 0,3 MPa, e taxa de fluxo para 1 mL/min; usar tampão de ligação (ver Material Suplementar) para equilíbrio da coluna, tampão de lavagem (ver Material Suplementar) para a etapa de lavagem e tampão de eluição (ver Material Suplementar) para eluição proteica alvo.NOTA: Alternativamente, um sistema FPLC automatizado pode ser aplicado para elutar a proteína alvo com tampão de elução executando um gradiente de concentração de imidazol linear (20-200 mM). Coletar e juntar as frações eluadas com proteínas fluorescentes (escolha pela cor verde ou laranja visível). Transfira as frações agrupadas para uma membrana de diálise (corte de peso molecular (MWCO) de 5.000-10.000) de acordo com as instruções do fabricante e digele pelo menos três vezes contra tampão de diálise ou tampão de MS (ver Material Suplementar). Por exemplo, realize a diálise de uma amostra de 1 mL três vezes contra 100 mL de tampão por pelo menos 2 h a cada rodada. Para um protocolo detalhado, consulte Budisa et al.34. Prepare uma diluição de 1:100 vezes da fração de elução dialisada no buffer PBS (ver Material Suplementar). Registose o espectro de absorvência das amostras diluídas em um espectrômetro UV-Vis. Calcule a concentração proteica com base na lei Lambert-Beer da seguinte forma, utilizando valores de literatura dos coeficientes de extinção molar ε em comprimento de onda específico (para EGFP a 488 nm ε488 = 55.000 cm-1· M-1, NowGFP a 493 nm ε493 = 53.600 cm-1· M-1, KillerOrange a 514 nm ε514 = 22.600 cm-1· M-1): (Lei Lambert-Beer)c proteína = concentração de proteínas [mg/mL]A = absorvância em comprimento de onda específicoε = coeficiente de extinção molar em comprimento de onda específico [M-1·cm-1]d = comprimento do caminho cuvette, aqui 1 cmMW = peso molecular da proteína [g/mol]Use tampão de diálise (ver Material Suplementar) para a medição de referência (“zero”). Pegue uma amostra de “eluato” para SDS-PAGE (ver seção 4 abaixo), carregue 1-10 μg de proteína (calculada de acordo com a etapa anterior) por poço de amostra para gels cor-de-pente coomassie brilhantes manchados de azul.NOTA: Ajuste as quantidades da amostra SDS dependendo do método de coloração aplicada e sensibilidade do corante se compostos diferentes do Coomassie Brilliant Blue forem usados para coloração de banda proteica. Congele e armazene a amostra de proteína no tampão de diálise (ver Material Suplementar) a -80 °C.NOTA: Nesta condição de armazenamento, as amostras de proteína devem ser estáveis por pelo menos 6 meses. Espectrofotometros UV-Vis de laboratório alternativos e espectrofotômetros de fluorescência podem ser usados para o registro de espectros de emissão de absorção e fluorescência de proteínas-alvo. Os seguintes comprimentos de onda de excitação podem ser aplicados para medições de emissão de fluorescência: 488 nm (EGFP), 493 nm (NowGFP) e 510 nm (KillerOrange). 4. Preparação da amostra SDS-PAGE Determine a absorção A a 280 nm (A280nm) para amostras “elunato”, “lysate” e “pelota” da seção 3. Ajuste o volume da sonda para atingir A280nm = 2 adicionando uma quantidade apropriada de buffer de eluição (o volume final da sonda deve ser de pelo menos 80 μL). Misture a amostra em uma proporção de 4:1 (v/v) com 5x tampão de corante de carregamento SDS (ver Material Suplementar) por pipetação, por exemplo, 80 μL da amostra com 20 μL de tampão de carregamento SDS 5x. Ferva as amostras de SDS a 95 °C por 5 minutos em banho-maria ou bloco de calor para desnaturar as proteínas. Deixe as amostras esfriarem para RT e gire as sondas a 13.000 x g por 1 min em um microcentrifuso antes de carregar no gel. Use 5-10 μL para Coomassie Brilliant Blue-manchado SDS-PAGE. Para obter detalhes sobre o procedimento SDS-PAGE, consulte57.NOTA: Ajuste os valores da amostra SDS dependendo do método de coloração aplicado e sensibilidade do corante. O resultado do SDS-PAGE deve ser verificado cuidadosamente para garantir que as amostras contenham mais de 95% da proteína total em uma banda correspondente ao peso molecular esperado da proteína desejada. Para isso, tire uma foto do gel manchado de Coomassie e compare a intensidade da faixa proteica do peso molecular desejado com a intensidade de todas as outras bandas na pista (se houver) por densitometria. Para avaliação densitométrica das intensidades da banda, o software ImageJ pode ser usado58. Para comprovar experimentalmente a incorporação das NCAAs desejadas na proteína de interesse, a análise de massa de proteínas intactas por cromatografia líquida de alto desempenho (HPLC) acoplada à espectrometria de massa eletropray tempo de voo (LC-ESI-TOF-MS) deve ser realizada conforme descrito59 (ver protocolo seção 5 e Tabela de Materiais nele para equipamento exemplar). 5. Emissão de fluorescência de variantes proteicas Antes do procedimento, verifique o resultado do experimento SDS-PAGE para ter certeza de que a pureza da amostra está >95% (consulte a NOTA após a etapa 4.5.) Ajuste as amostras de cada variante proteica purificada a uma concentração de 0,3 μM, tomando o valor de absorção calculado no comprimento de onda apropriado como referência (subpass 3.2.5.). Certifique-se de que o volume final aproximado da amostra seja de 200 μL. Deixe as amostras diluídas equilibrarem por 1h no RT. Transfira as amostras para um cuvette de quartzo de 1 cm e meça um espectro de emissão de fluorescência das amostras usando um espectrômetro de fluorescência (ver Tabela de Materiais) aplicando os seguintes comprimentos de onda de excitação: 488 nm (para EGFP), 493 nm (para NowGFP), 510 nm (para KillerOrange). 6. Desnaturação e redobramento de variantes EGFP Antes do procedimento, verifique o resultado do experimento SDS-PAGE para ter certeza de que a pureza da amostra está >95% (consulte a NOTA após a etapa 4.5.) Prepare-se para cada variante proteica purificada duas amostras de 2 μL de volume final a uma concentração de 300 μM (ver determinação de concentração de proteína em subpassos 3.2.4-3.2.6). Adicione 18 μL de tampão PBS de 1,11x (ver Material Suplementar) contendo 8,89 M de ureia e 5,56 mM DTT a 2 μL de cada variante proteica purificada (para obter 1x PBS contendo 8 M de ureia e 5 mM DTT) para induzir a desnaturação.NOTA: Para as etapas 6.4-6.6, processe cada amostra separadamente. Incubar as amostras por 5 min a 95 °C. Diluir as amostras de 20 μL 100 vezes adicionando 1980 μL de 1x PBS (ver Material Suplementar) contendo 5 mM DTT para induzir renaturação, produzindo 0,3 μM de concentração de proteína final e transferência imediata de 200 μL das amostras em um cuvette de quartzo de 1 cm.NOTA: É muito importante trabalhar rápido aqui, já que a renaturação começa imediatamente. Insira o cuvette de quartzo em um espectrômetro de fluorescência apropriado (ver Tabela de Materiais) e monitore a redobramento de proteínas nas amostras adquirindo um espectro de fluorescência a cada 3 s acima de 30 minutos. Para cada variante proteica, use 295 nm de fluorescência para a primeira amostra e excitação de fluorescência de 488 nm para a segunda. Transfira as amostras de reabascamento em tubos de microcentrifuus de 1,5 mL, feche a tampa e armazene as amostras em RT no escuro por 24 horas para permitir a redobramento completa das variantes EGFP. Medir a emissão de fluorescência de amostras de proteína reamosssada de acordo com a etapa 6.6 usando o mesmo comprimento de onda de excitação de antes para capturar o ponto final temporal da recuperação da fluorescência.

Representative Results

No início do estudo, selecionamos três diferentes variantes de proteína fluorescente compartilhando a arquitetura GFP pai. A primeira proteína selecionada foi o EGFP, que é uma variante projetada derivada do GFP original da água-viva Aequorea victoria contendo mutações Phe64Leu/Ser65Thr. A segunda proteína selecionada foi o NowGFP51,60. É também uma variante de A. victoria GFP derivada pela mutagênese em várias etapas através de proteínas fluorescentes anteriores. O NowGFP contém 18 mutações em comparação com sua proteína fluorescente antecessora imediata “Cerulean”61. Por sua vez, a proteína “Cerulean” é um derivado da proteína fluorescente de ciano aumentada (ECFP)62,63, uma proteína previamente selecionada pela evolução laboratorial dirigida e contendo um cromoforo à base de triptofano. Ambos, EGFP e NowGFP são amplamente utilizados em biologia celular e estudos biofísicos, e contêm dez resíduos de prolina conservados em suas estruturas. Além disso, o NowGFP tem um décimo primeiro resíduo de prolina na posição 230, que apareceu devido ao extenso histórico de mutação desta variante proteica. A terceira proteína selecionada foi a proteína fluorescente KillerOrange64,65. É um derivado da cromoproteína anm2CP do gênero hidrozoário Anthoathecata. A sequência proteica contém 15 resíduos de prolina, e o cromoforo é baseado em um triptofano em vez de um resíduo de tyrosina. Estruturas de raios-X de alta resolução foram relatadas para todas as três proteínas selecionadas (Figura 2)51,65,66. Na primeira etapa, os análogos proline (Figura 1D) foram incorporados em todas as posições proline de três proteínas modelo (EGFP, NowGFP e KillerOrange) por incorporação de pressão seletiva (SPI, um esquema do procedimento é dado na Figura 3). Instrumentalmente, a cepa proline-auxotrophic E. coli K12 JM8367 foi utilizada para a expressão das proteínas na presença de proline e análogos (Figura 1D), produzindo proteínas do tipo selvagem e modificadas, respectivamente. Pelotas de células expressando a proteína nativa e variantes com S-Flp e Dhp tinham a cor brilhante típica devido ao cromoforo intacto, enquanto as variantes contendo R-Flp e Dfp permaneceram incolores, indicando dobras erradas e deposição de proteína desdobrada em corpos de inclusão (Figura 4A). A análise da SDS-PAGE das amostras expressas verificou a presença de proteínas insolúveis contendo R-Flp (Figura 4B-D), o que impediu novas investigações. Embora isso esteja além do escopo do presente estudo, deve-se notar que a solubilidade da proteína e as questões de dobra podem ser aliviadas, em certa medida, pelos procedimentos de reabastebramento in vitro 68. Em contraste, proteínas nativas, bem como variantes de rolamento de S-Flp e Dhp foram encontradas principalmente nas frações solúveis (Figura 4B-D). O tipo selvagem, bem como as variantes contendo S-Flp e Dhp, poderiam ser ainda mais isoladas e caracterizadas em estudos de fluorescência. As proteínas solúveis foram purificadas pela cromatografia de afinidade de íons metálicos imobilizados (IMAC), produzindo 20-30 mg/L de volume de cultura para EGFP, 60-80 mgs para NowGFP e KillerOrange, cujos rendimentos para proteínas selvagens e modificadas foram muito semelhantes. A análise acoplada à cromatografia-massografia líquida (LC-MS) confirmou a identidade e a pureza esperadas dos isolados obtidos desta forma (Figura 5). No espectro de massa, cada substituição proline por S-Flp produziu um câmbio de +18 Da por cada resíduo de prolina na sequência, enquanto para a substituição proline-para-Dhp, a mudança foi −2 Da por resíduo. No passo seguinte, foram registrados espectros de absorção de luz e emissões para analisar os efeitos potenciais da incorporação de análogos proline não canônicos nas propriedades espectroscópicas das proteínas fluorescentes dos pais (Figura 6). Os espectros de absorção UV-Vis mostraram uma banda típica em torno de 280 nm característica para resíduos aromáticos, tyrosina e triptofano, enquanto a absorvência cromophore foi encontrada em 488 nm para EGFP, e 493 nm para NowGFP (Figura 6A,B). Em KillerOrange, a região de absorção de cromoforeiro compreendeu duas bandas (Figura 6C), que correspondem a dois estados configurais possíveis e de carga do complexo cromoóforo. A banda em torno de 510 nm é conhecida como o estado de onde ocorre a fluorescência com alto rendimento quântico49,65. Nas variantes de substituição de prolina, observou-se: A incorporação de Dhp não alterou o espectro de absorção de EGFP e NowGFP, enquanto o S-Flp produziu uma absorção UV aprimorada. Este último pode ser explicado por diferenças induzidas nos microambientes de resíduos de triptofano, particularmente Trp57 sanduíche entre três S-Flp no motivo PVPWP (Figura 6A,B)69. Uma explicação mais trivial para uma maior absorção uv, no entanto, pode decorrer de uma fração aumentada de proteína dobrada inadequadamente. Uma vez que a concentração da proteína foi avaliada pela quantificação das características de absorvência, a presença de uma proteína com cromoforotoso inadequadamente maduro pode aumentar a absorvância, enquanto esta fração não é contada na concentração global (Figura 6A,B). Apoiando essa hipótese, observou-se que o EGFP contendo S-Flp apresentou uma razão significativamente reduzida de cromoforo ao triptofano combinado e absorvimento de tyrosina (ε(CRO)/ε(Tyr+Trp) = 0,96) em comparação com um valor mais alto (1,57) na proteína dos pais (Tabela 2)70. A presença de uma fração não fluorescente no EGFP contendo S-Flp será um importante fator contribuinte na análise mais aprofundada das propriedades proteicas. Na variante KillerOrange contendo S-Flp, observou-se uma absorvência aprimorada ao lado de uma mudança vermelha na banda cromofora. Este fato indicou que a formação cromoforo favoreceu uma configuração com um grande rendimento quântico de fluorescência (Figura 6C). Posteriormente, analisamos os espectros de fluorescência das proteínas registradas após excitação nos comprimentos de onda máximo de absorção correspondentes. Os resultados mostram que os espectros permaneceram essencialmente idênticos para as variantes de proteína fluorescente examinadas com proline e substituições, S-Flp e Dhp. Este desfecho implica que os análogos não alteraram o ambiente químico do cromóforo em qualquer caso (Figura 6G-I). Apesar disso, diferenças acentuadas foram observadas no espectro de fluorescência de KillerOrange registrado após excitação em 295 nm, daí após a excitação triptofano. Este experimento rastreia a transferência de energia de ressonância fluorescência (FRET) ou o acoplamento excitado direto que ocorre entre as cadeias laterais do triptofano e o cromoforo maduro, pois ambos estão localizados a uma curta distância de não mais de 25 Å. Para as variantes EGFP e NowGFP, quando os espectros de emissões foram medidos usando excitação de 295 nm, observou-se uma forte emissão de cromophore, juntamente com quase nenhuma emissão de triptofano (Figura 6D,E). No entanto, as variantes contendo S-Flp apresentaram uma emissão um pouco maior de triptofano específico. Esta observação pode estar ligada a uma contribuição incontável da apoproteína desdobrada que contém triptofanos, mas não o cromoforo maduro. O aumento substancial da emissão específica do triptofano foi visto em KillerOrange, indicando a falta de fluorescência saciando através do mecanismo esperado de transferência de energia excitação ou acoplamento excitônico. As variantes proteicas contendo proline e S-Flp apresentaram emissão de triptofano comparável ao lado da característica de fluorescência deslocada pelo vermelho favorecida de um alto rendimento quântico. Em contraste, a variante que continha Dhp mostrou uma diminuição drástica na intensidade de fluorescência cromoforo, presumivelmente devido a pequenos efeitos estruturais (Figura 6F). Em seguida, comparamos as propriedades dobráveis das proteínas realizando um experimento de desdobramento/renaturação. Os espectros de emissão de fluorescência foram registrados no estado dobrado (seção 5 do protocolo), após desnaturação química e, posteriormente, no processo de redobramento monitorado durante um período de 24 h (seção de protocolo 6). Os espectros foram registrados após excitação em ambos os comprimentos de onda relevantes, 295 nm, e na máxima do espectro de absorção dos cromóforos, enquanto a fluorescência resultante é apresentada como normalizada ao valor máximo para cada proteína (Figura 7). No final do protocolo, observamos que as variantes EGFP poderiam se revater, enquanto as variantes NowGFP e KillerOrange – uma vez desnaturadas – permaneceram desdobradas (dados não mostrados). Assim, o recobramento das capacidades das proteínas originais da fluorescência variou substancialmente. Note-se que KillerOrange foi desenvolvido como um fotoensibilizador a partir da variante hidrozoária de cromoproteína KillerRed65,71, e seu remato normalmente fica para trás, apesar da robusta estrutura de β-barril. Em nossos experimentos, descobrimos que a fluorescência cromopária do tipo selvagem EGFP recuperou-se apenas parcialmente, embora a fluorescência específica do triptofano tenha sido maior após a renaturação (Figura 7A,D). Comportamento essencialmente semelhante foi observado na variante contendo Dhp (Figura 7C,F). No EGFP contendo S-Flp, um resultado semelhante foi observado quando a excitação foi realizada no comprimento de onda específico do triptofano de 295 nm (Figura 7B). Surpreendentemente, a fluorescência recuperou-se a um prolongador muito maior quando o cromoforeiro estava animado em 488 nm (Figura 7E). Parece que a S-Flp induz um rendimento muito melhor de revasagem em comparação com as outras duas variantes. No entanto, esse efeito benéfico não foi visto ao utilizar excitação de 295 nm devido a interações moleculares desconhecidas. Posteriormente, a velocidade de redobramento foi monitorada por fluorescência de ambos os triptofanos, e o cromoforo, separadamente, enquanto o ponto final do processo foi determinado às 24 horas após o início da renaturação. Apenas as variantes EGFP mostraram uma cinética de redobramento relativamente rápida que poderia ser avaliada de forma confiável, enquanto nenhuma das variantes desnaturadas do NowGFP e do KillerOrange poderia se recuperar a um valor que permitisse novas medições quantitativas. No EGFP, a recuperação das emissões de triptofano foi duas vezes mais rápida (concluída em 750 s) em comparação com a recuperação da emissão de cromóforos (concluída em 1.500 s), indicando a complexidade dos processos subjacentes (Figura 8). Em ambos os comprimentos de onda de excitação, a taxa de revasamento foi elevada pela presença de S-Flp, de acordo com os dados da literatura25. Ao mesmo tempo, a variante contendo Dhp mostrou um perfil de redobramento semelhante ao tipo selvagem. Figura 1: Andaime estrutural de proteína fluorescente verde (GFP), construção de cromoforino, transições conformacionais prólinas e análogos sintéticos utilizados neste estudo. (A) A estrutura do GFP consiste nos fios de β formando um barril quase perfeito (ou seja, uma “lata” com dimensões de 4,2 nm x 2,4 nm) que é tampada em ambas as extremidades por α-helical. A proteína GFP de 27 kDa mostra uma estrutura terciária composta por onze β fios, duas baceiras de α curtas e o cromoforo no meio. Os estados conformais de prolines adjacentes estão ligados à formação de cromoforo. (B) A maturação autocatalítica (condensação) do cromophore ocorre nos resíduos Ser65, Tyr66 e Gly67, e prossegue em várias etapas: Primeiro, ajustes torcionais na espinha dorsal do polipeptídeo para trazer o carbono carboxílado de Thr65 para perto do nitrogênio amido de Gly67. Em seguida, a formação de um sistema de anéis imidazolina-5-um heterocíclico ocorre após ataque nucleofílico neste átomo de carbono pelo nitrogênio amido da glicina e desidratação subsequente. Finalmente, o sistema ganha fluorescência visível quando a oxidação da ligação de carbono alfa-beta de tirasina por oxigênio molecular leva à extensão do sistema conjugado do sistema de anéis imidazolina, no final incluindo o anel de fenil de tirasina e seu substituto para-oxigênio. O cromo para-hidroxibenzylidene imidazolinone no centro do β-barril está completamente separado do solvente a granel. (C) As fórmulas e geometrias da estrutura esquelética de 1) o anel proline (puckers) e 2) o vínculo de amida anterior representa as principais transições conformais do resíduo proline. (D) Os análogos proline utilizados neste trabalho com os discos de anel proline designados. A figura foi gerada usando ChemDraw e Discovery Studio Visualizer. A estrutura GFP é da entrada da estrutura PDB 2T6P. Clique aqui para ver uma versão maior desta figura. Figura 2: Proteínas fluorescentes utilizadas neste estudo. Os painéis mostram a representação da fita das estruturas típicas de β-barril de três variantes diferentes de proteínas fluorescentes: EGFP, NowGFP e KillerOrange, com cor de fita representando a cor da emissão de fluorescência de cada variante. Os resíduos proline (código de uma letra) são destacados como varas, e as posições apropriadas são anotadas. Cromoforas são mostrados com composição inicial de aminoácidos em negrito. Todas as representações da estrutura foram produzidas com pymol com base nas seguintes entradas de estrutura PDB: 2Q6P para EGFP, 4RYS para NowGFP, 4ZFS para KillerOrange. Clique aqui para ver uma versão maior desta figura. Figura 3: Apresentação do gráfico de fluxo do método SPI para incorporação específica de resíduos de análogos proline não canônicos. Uma cepa proline-auxotrophic Escherichia coli (E. coli) que carrega o gene de interesse em uma expressão plasmid é cultivada em um meio mínimo definido com todos os 20 aminoácidos canônicos até que um OD600 de ~0,7 seja alcançado no qual a cultura celular está em fase de crescimento logarítmico. As células são colhidas e transferidas para um meio mínimo fresco contendo 19 aminoácidos canônicos e um analógico prolina. Após a adição de um indutor, a expressão proteica é realizada durante a noite. Finalmente, a proteína alvo é isolada por lise celular e purificada antes de uma análise mais aprofundada. Em uma variação do protocolo, as células são cultivadas em um meio mínimo definido com 19 aminoácidos canônicos, e a prolina é adicionada em uma quantidade limitada (por exemplo, um quinto da concentração dos outros aminoácidos). Por esta medida, as células esgotam proline no meio antes que possam sair da fase de crescimento logarítmico, e então, posteriormente, o analógico é adicionado, e a proteína da produção de juros é induzida. Clique aqui para ver uma versão maior desta figura. Figura 4: Análise de expressão das variantes EGFP, NowGFP e KillerOrange. (A) Pelotas celulares de 1 mL de cultura de expressão, normalizadas a600 OD 2. Análise SDS-PAGE das variantes (B) EGFP, (C) NowGFP e (D) KillerOrange. Frações solúveis (S) e insolúveis (I) de cada derivado de proteína fluorescente foram carregadas em gel de acrilamida de 15%, bem como frações eluidas (E) do IMAC de proteínas solúveis. PageRuler Untained Protein Ladder foi usado como marcador (M) nas pistas denotadas por (M). As regiões esperadas da proteína em particular são emolduradas. Aminoácidos incorporados em posições proline são pro, R-Flp, S-Flp e Dhp (em (A) pelotas celulares de variantes de proteína fluorescente incorporando Dfp em vez de Dhp são mostrados). Os géis foram manchados por 1% (w/v) Coomassie Brillant Blue. Clique aqui para ver uma versão maior desta figura. Figura 5: Análise espectrométrica em massa de variantes de proteína fluorescente. (A) Espectros ESI-MS deconvolutados representativos de H6-tagged EGFP (preto), S-Flp-EGFP (laranja) e Dhp-EGFP (ciano) com a localização dos principais picos de massa fornecidos como números (em Da). As massas moleculares calculadas [M+H]+ das proteínas H6 são: Para EGFP 27.745,33 Da (observadas 27.746,15 Da); para S-Flp-EGFP 27.925,33 Da (observado 27.925,73 Da); para Dhp-EGFP 27.725,33 Da (observado 27.726,01 Da). (B) Os espectros ESI-MS deconvolutados representativos de H6-tagged NowGFP (preto), S-Flp-NowGFP (laranja) e Dhp-NowGFP (ciano) com a localização dos principais picos de massa fornecidos como números (em Da). As massas calculadas das proteínas H6 são: Para NowGFP 27.931,50 Da (observadas 27.946,46 Da; a diferença de ~16 Da é provavelmente devido à oxidação de uma metionina na proteína); para S-Flp-NowGFP 28.129,50 Da (observado 28.130,08 Da); para Dhp-NowGFP 27.909,50 Da (observado 27.910,22 Da). (C) Representante desconvolucido espectroS ESI-MS de H6-tagged KillerOrange (preto), S-Flp-KillerOrange (laranja) e Dhp-KillerOrange (ciano) com a localização dos principais picos de massa fornecidos como números (em Da). As massas calculadas das proteínas H 6-tagged são: Para KillerOrange 27.606,09 Da (observado 27.605,91 Da); para S-Flp-KillerOrange 27.876,09 Da (observado 27.876,08 Da); para Dhp-KillerOrange 27.576,09 Da (observado 27.575,93 Da). Os desvios entre as massas moleculares observadas e calculadas de cerca de 1 Da estão dentro da faixa de erro do equipamento ESI-MS. Clique aqui para ver uma versão maior desta figura. Figura 6: Espectros de emissão de absorção de luz e fluorescência de variantes de proteína fluorescente. Espectros de absorção UV-Vis normalizados são mostrados para as variantes (A) de EGFP, (B) do NowGFP e (C) de KillerOrange. Os espectros foram normalizados ao máximo de absorvância cromófora (cerca de 500 nm). Espectros de emissão de fluorescência normalizados são mostrados das variantes (D,G) do EGFP, (E,H) do NowGFP e (F,I) do KillerOrange. Os espectros em (D,E,F) foram medidos após a excitação com luz ultravioleta (295 nm), para os espectros em (G,H,I) 488 nm, 493 nm e 510 nm de luz foram utilizados para excitação, respectivamente, e os espectros foram normalizados para as respectivas máximas de emissão de cromóforo (cerca de 500 nm). Em cada painel, as curvas pretas correspondem aos espectros da variante de proteína fluorescente com prolina nativa, as curvas laranjas indicam o espectro de proteínas substituídas por S-Flp, e as curvas azuis correspondem às proteínas substituídas pelo DHP. Clique aqui para ver uma versão maior desta figura. Figura 7: Espectros de emissão de fluorescência de variantes EGFP em experimentos de revagação. Espectros de emissão de fluorescência normalizados de 0,3 μM soluções de variantes de proteína fluorescente no estado nativo e após a desnaturação e redobramento: Spectra in (A,B,C) foram medidos após excitação com luz ultravioleta (295 nm) (A) para EGFP, (B) para S-Flp-EGFP e (C) para Dhp-EGFP. Os espectros em (D,E,F) foram medidos após excitação com luz verde (488 nm) (D) para EFGP, (E) para S-Flp-EGFP e (F) para Dhp-EGFP. Os espectros de emissão das amostras nativas (curvas pretas) e reamosquecidas (verde corresponde ao EGFP, laranja ao S-Flp-EGFP e azul ao Dhp-EGFP, respectivamente) de cada variante proteica são normalizados ao máximo fluorescência do estado nativo apropriado. Clique aqui para ver uma versão maior desta figura. Figura 8: Monitoramento da dobra de proteínas e maturação cromofora de variantes EGFP com fluorescência. (A) Emissão de fluorescência na região da fluorescência trp (emissão foi definida para 330 nm) registrada após excitação com luz ultravioleta (295 nm). (B) Desenvolvimento da amplitude da fluorescência na região da emissão de cromoforo ao final da excitação com luz verde (488 nm). Os traços de fluorescência dependentes do tempo foram normalizados até a unidade (100%), de acordo com a amplitude de fluorescência alcançada no final do intervalo de monitoramento. Em cada painel, as curvas pretas correspondem ao espectro da variante de proteína fluorescente com prolina nativa, as curvas laranjas indicam que os espectros de proteínas substituídas por S-Flp e curvas azuis correspondem a proteínas substituídas por DHP. Clique aqui para ver uma versão maior desta figura. Construir Sequências de aminoácidos (6xHis tag sublinhado): EGFP-H6 MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKHHHHHHHHH H6-NowGFP MRGSHHQHHHGSGSGSKGEKLFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKMSLKFICTTGKLPVPWPTLKTTTTTWGMQCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGVDFKEDGNILGHKLEYNAISGNANITADKQKNGIKAYFTIRHDVEDGSVLLADHYQQNTPIGDGPVLLPDNHYLSTQSKQSKDPNEKRDHMVLLEFVTAAGIPLGADELYK H6-KillerOrange MRGSHHHHHHGSECGPALFQSDMTFKIFIDGEVNGQKFTIVADGSSKFPHGDFNVHAVCETGKKLPMSWKPICHLIQWGEPFFARYPDGISHFAQECFPEGLSIDRTVRFENDGTMTSHHTYELSDTCVVSRITVNCDGFQPDGPIMRDQLVDILPSETHMFPHGPNAVRQLAFIGFTTADGGLMMGHLDSKMTFNGSRAIEIPGPHFVTIITKQMRDTSDKRDHVCQREVAHAHSVPRITSAIGSDQD Tabela 1: Estruturas primárias das proteínas-alvo. Suas etiquetas são sublinhadas em cada sequência. λ [nm] ε [M-1·cm-1] (EGFP) ε [M-1·cm-1] (S-Flp-EGFP) ε [M-1·cm-1] (Dhp-EGFP) 488 (≡ CRO) 31.657 (± 1.341) 22.950 (± 290) 27.800 (± 542) 280 (≡ Tyr+Trp) 20.116 (± 172) 23.800 (± 715) 17.300 (± 554) Os valores para o coeficiente de extinção ε (em M-1·cm-1) são calculados a partir de espectros de absorção UV-Vis registrados de variantes EGFP apropriadas usando concentrações proteicas conhecidas. O comprimento de onda selecionado a 280 nm corresponde à absorção máxima de resíduos aromáticos, tyrosina e triptofano, e 488 nm representa o comprimento de onda de absorção do cromoforo. Tabela 2: Coeficientes de extinção (ε) de variantes EGFP em comprimentos de onda selecionados. Os valores para o coeficiente de extinção ε (em M-1·cm-1) são calculados a partir de espectros de absorção UV-Vis registrados de variantes EGFP apropriadas usando concentrações proteicas conhecidas. O comprimento de onda selecionado de 280 nm corresponde à absorção máxima de resíduos aromáticos, tyrosina e triptofano, enquanto 488 nm representa o comprimento máximo de onda de absorção do cromoósimo. Material Suplementar: Preparação de soluções de estoque e buffers Clique aqui para baixar este Arquivo.

Discussion

Na natureza, manipulações com estruturas e funções proteicas ocorrem tipicamente devido a mutações, o fenômeno que leva à troca de uma identidade aminoácido em determinadas posições na sequência proteica. Este mecanismo natural é amplamente aplicado como método biotecnológico para engenharia proteica sob a forma de mutagênese, e conta com o repertório dos 20 aminoácidos canônicos envolvidos no processo. A troca de resíduos de prolina é problemática, no entanto. Devido à sua arquitetura especial de grupo backbone, dificilmente é intercambiável com os 19 resíduos restantes para substituição72. Por exemplo, proline é tipicamente conhecido como um disjuntor de estrutura secundária em sequências de polipeptídeos devido à sua baixa compatibilidade com as estruturas secundárias mais comuns, ou seja, α-hélice e β-strand. Esta característica proline é facilmente perdida quando o resíduo é mutado para outro aminoácido do repertório comum. A substituição da prolina por seus análogos químicos oferece uma abordagem alternativa, que permite manter as características básicas da espinha dorsal do resíduo prolina pai, ao mesmo tempo em que impõe viés em suas transições conformais específicas ou produz modulações do volume molecular e polaridade. Por exemplo, é possível fornecer culturas bacterianas com estruturas analógicas como hidroxy-, fluoro-, alquilo-, dehidroprolinas, estruturas com tamanhos variáveis de anel e muito mais, facilitando assim a produção de uma proteína contendo alterações específicas de resíduos proline.

O método de incorporação de pressão seletiva (SPI) descrito neste estudo permite uma substituição global, ou seja, específica de resíduos de todas as prolines na proteína alvo com análogos químicos relacionados. A importância do método é refletida pelo fato de que a SPI permite criar mudanças de sequência inacessíveis às técnicas comuns de mutagênese. Por exemplo, permite a produção de uma proteína-alvo contendo pequenas alterações estruturais que normalmente não excedem uma ou duas substituições/exclusões/adições de átomos, como demonstrado neste estudo. Tais modificações proteicas são apelidadas de “mutações atômicas”73,74. Em uma proteína fluorescente como a GFP, o resultado dessa intrusão molecular pode ser visto na velocidade da dobra, polaridades locais, embalagem de proteínas, estabilidade das características estruturais envolvidas. As mudanças nas propriedades de absorção e fluorescência são produzidas indiretamente devido ao impacto na dobra de proteínas e microambientes de resíduos. A precisão das alterações moleculares realizadas pelo SPI é tipicamente muito maior, em comparação com mutações de prolines a outros resíduos canônicos, sendo esta última tipicamente prejudicial para a dobra, produção e isolamento de proteínas.

Como método de produção, a abordagem SPI utiliza a tolerância do substrato do bolso de sintetizador aminoacila-tRNA para análogos químicos do aminoácido nativo. A sintetose é responsável pela identificação correta da estrutura do aminoácido, enquanto a incorporação em proteínas ocorre a jusante no processo de tradução. Instrumentalmente, a produção, isolamento e purificação de proteínas em SPI são realizadas de forma típica para quaisquer outras técnicas de expressão de proteína recombinante; no entanto, com algumas adições ao protocolo da seguinte forma: Proline, que está destinada à substituição, é fornecida no início do processo de fermentação, de tal forma que as células possam crescer e desenvolver suas máquinas celulares intactas. No entanto, a cultura celular não é permitida a atingir a densidade óptica máxima, para manter as células na fase logarítmica ideal para a expressão proteica. Existem duas grandes variações do método SPI neste momento. No primeiro, a concentração de prolina é ajustada no meio de crescimento inicial (um meio quimicamente definido) de tal forma que o esgotamento da prolina acontece sem qualquer intrusão externa. As células esgotam proline no meio antes de poderem sair da fase de crescimento logarítmico, e então, posteriormente, o analógico é adicionado, e a proteína da produção de juros é induzida. Na segunda versão do método, as células são cultivadas no meio contendo proline até o meio de sua fase logarítmica. Neste ponto, as células devem ser retiradas e fisicamente transferidas para outro meio, que não contém mais proline, apenas o analógico, com posterior indução da proteína de interesse. Em ambas as versões, o reagente analógico e de indução de proteína são fornecidos às células pré-cultivadas. O isolamento e purificação da proteína do tipo selvagem são realizados da mesma forma que para as variantes. Em princípio, todas as cepas pró-auxotróficas disponíveis podem ser usadas como um hospedeiro de expressão. No entanto, testes de expressão para identificar o hospedeiro mais adequado são aconselháveis. Além disso, testes de diferentes mídias quimicamente definidas podem ser usados para otimizar o rendimento da proteína.

Existem certos requisitos relativos aos análogos químicos que precisam ser considerados para sPI, como solubilidade e concentração. A disponibilidade metabólica e a absorção de aminoácidos dependem do número de moléculas dissolvidas no meio. Para aumentar a solubilidade de um determinado composto, podem ser escolhidas condições ligeiramente ácidas ou alcalinas. Uma vez que as moléculas artificiais podem causar efeitos inibitórios de crescimento devido à sua toxicidade celular, a concentração deve ser reduzida ao mínimo, a fim de evitar o estresse celular75.

Uma pequena fraqueza do SPI é a diminuição da eficiência de incorporação com maior número de posições que precisam ser trocadas. Em princípio, uma redução da frequência de aminoácidos dentro da biomolécula alvo por mutagênese dirigida ao local pode resolver esse problema. No entanto, as propriedades estruturais e funcionais de uma proteína desejada podem ser afetadas pela mudança da estrutura primária.

Como mencionado anteriormente, o SPI permite a substituição específica do resíduo do aminoácido canônico. Isso implica que aminoácidos não canônicos são inseridos em todas as posições do aminoácido canônico dentro da proteína alvo, incluindo resíduos conservados que são indispensáveis para a função proteica ou dobra. Métodos alternativos para incorporação específica do local são a única possibilidade de superar esse problema3. Nas últimas décadas, foi desenvolvido o método de par ortogonal que pode produzir proteínas contendo resíduos modificados em locais predefinidos. A modificação mais comum deste método é conhecida como supressão de códon stop. Este método é baseado em um sistema de tradução ortogonal projetado dedicado à incorporação específica do local de aminoácidos sintéticos76. Mais de 200 aminoácidos com diferentes modificações da cadeia lateral foram incorporados em proteínas até o momento usando esta abordagem77. No entanto, esses sistemas de tradução ainda não são adequados para inserções de análogos proline em proteínas-alvo. Além disso, o desempenho do método é considerado baixo no caso de pequenas modificações de aminoácidos porque alguma promiscuidade de fundo da síntese aminoacílico-tRNA normalmente permanece nos sistemas de tradução projetados.

Usando SPI, produzimos uma série de variantes de proteína fluorescente de β canos e estudamos os resultados da troca de proline com seus análogos não naturais. No caso da substituição proline por R-Flp e Dfp, uma proteína disfuncional foi produzida pelo hospedeiro de expressão. O efeito é provavelmente produzido por dobras proteicas. Este último pode se originar da conformação C 4-exo promovida pela R-Flp, que é desfavorecido pelas estruturas proteicas dos pais27. Com o Dfp, é provável que o descomposto seja produzido pela velocidade reduzida da isomerização da ligação de peptídeo trans-para-citídeo no resíduo proline27. Sabe-se que este último está entre os passos limitantes no perfil cinético da dobra de proteína que afeta a formação β-barril e a subsequente maturação do cromoforeiro. De fato, para ambos os aminoácidos, R-Flp e Dfp, a produção de proteína resultou em uma proteína agregada e insolúvel. Consequentemente, a formação do cromoforo não pôde ocorrer, e a fluorescência foi perdida completamente. Com S-Flp e Dhp, no entanto, observou-se a maturação adequada da proteína, resultando em amostras de proteína fluorescente para cada combinação analógica/proteica. Apesar de algumas modulações nas características de absorção e fluorescência da proteína, estas permaneceram em grande parte semelhantes às das proteínas do tipo selvagem. O efeito da substituição do aminoácido foi revelado nos estudos cinéticos redobrados. Este último mostrou uma redobramento mais rápida no caso de substituição por S-Flp. Estudos de modelo mostraram que esse resíduo pode gerar alguma melhora na velocidade de rotação de amide trans-para-cis e levar à formação da conformação C 4-endo. Ambos os fatores provavelmente contribuirão para os efeitos cinéticos benéficos desse resíduo no EGFP. Em contraste, a Dhp produziu perfis de dobramento cinéticos extremamente semelhantes à proteína dos pais. A diversidade dos desfechos produzidos por meras mutações atômicas nas proteínas fluorescentes examinadas ilustra o potencial do método de produção de SPI na alteração das propriedades proteicas-alvo. As alterações proteicas induzidas pela substituição proline pelos análogos têm implicações adicionais na engenharia das enzimas 78,79,80 e nos canais ion 81,82, bem como na engenharia geral da estabilidade proteica.

A limitação básica do método SPI é o seu modo “tudo ou nenhum” na troca de proline reside com análogos relacionados. Seria de grande vantagem poder selecionar com precisão, quais resíduos de prolina devem ser substituídos pelos análogos, e quais devem permanecer não modificados. No entanto, no momento, não há nenhuma técnica que possa realizar uma produção tão sofisticada usando um hospedeiro de produção microbiana. A síntese química das proteínas83,84, bem como a produção livre de células85,86, são os dois métodos alternativos que podem produzir modificações proline específicas de posição. No entanto, sua complexidade operacional e baixo rendimento de produção os tornam inferiores em relação à produção em células vivas. A partir de agora, o SPI continua sendo a abordagem mais operacionalmente simples e robusta para a produção de proteínas complexas portadoras de mutações atômicas. Ao introduzir substitutos de aminoácidos não naturais, o método permite modificar características proteicas de forma direcionada, conforme exemplificado aqui por alterações na dobradura e absorção/emissão de proteínas fluorescentes geradas por substituições de prolina.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi apoiado pela Fundação Alemã de Pesquisa (Cluster of Excellence “Unifying Systems in Catalysis) à T.F. e N.B. e pelo Ministério da Educação e Ciência (Programa BMBF “HSP 2020”, TU-WIMIplus Project SynTUBio) ao F.-J.S. e T.M.T.T.

Materials

Acetonitrile VWR HiPerSolv CHROMANORM ULTRA for LC-MS, 83642 LC-MS grade required
Acrylamide and bisacrylamide aqueous stock solution at a ratio of 37.5:1 (ROTIPHORESE Gel 30) Carl Roth 3029.1
Agar-agar Carl Roth 5210
Ammonium molybdate ((NH4)2MoO4) Sigma-Aldrich 277908
Ammonium peroxydisulphate (APS) Carl Roth 9592.2 ≥98 %, p.a., ACS grade required
Ammonium sulfate ((NH4)2SO4) Sigma-Aldrich A4418
Ampicillin sodium salt Carl Roth K029
Biotin Sigma-Aldrich B4501
Bromophenol blue Sigma-Aldrich B0126
Calcium chloride (CaCl2) Sigma-Aldrich C5670
Coomassie Brillant Blue R 250 Carl Roth 3862
Copper sulfate (CuSO4) Carl Roth CP86.1
D-glucose Carl Roth 6780
1,2-Bis-(dimethylamino)-ethane, N,N,N',N'-Tetramethylethylenediamine (TEMED) Carl Roth 2367.3 ≥99 %, p.a., for electrophoresis
1,4-dithiothreitol (DTT) Carl Roth 6908
Dichloromethane (DCM) Sigma-Aldrich 270997
di-potassium hydrogen phosphate (K2HPO4) Carl Roth P749.1
di-sodium hydrogen phosphate (Na2HPO4) Carl Roth X987
DNase I Sigma-Aldrich D5025
Dowex 50WX8-100 (hydrogen form) Acros Organics / Thermo Fisher Scientific (Waltham, U.S.A.) 10731181 cation exchange resin
Ethanol Carl Roth 9065.1
Formic acid VWR HiPerSolv CHROMANORM for LC-MS, 84865 LC-MS grade required
Glacial acetic acid Carl Roth 3738.5 100 %, p. a.
Glycerol Carl Roth 3783
Imidazole Carl Roth X998
Hydrogen chlroide (HCl) Merck 295426
Iron(II) chloride (FeCl2) Sigma-Aldrich 380024
Isopropanol Carl Roth AE73.1
Isopropyl β-D-1-thiogalactopyranoside (IPTG) Sigma-Aldrich I6758
Lysozyme Sigma-Aldrich L6876
Magnesium chloride (MgCl2) Carl Roth KK36.1
Magnesium sulfate (MgSO4) Carl Roth 8283.2
Manganese chloride (MnCl2) Sigma-Aldrich 63535
β-mercaptoethanol Carl Roth 4227.3
PageRuler Unstained Protein Ladder Thermo Fisher Scientific 26614
Potassium chloride (KCl) Carl Roth 6781.3
Potassium dihydrogen phosphate (KH2PO4) Sigma-Aldrich P5655
RNase A Carl Roth 7156
Sodium chloride (NaCl) Carl Roth P029
Sodium dihydrogen phosphate (NaH2PO4) Carl Roth T879
Sodium dodecyl sulphate (NaC12H25SO4) Carl Roth 0183
Thiamine Sigma-Aldrich T4625
Trifluoroacetic acid (TFA) Sigma-Aldrich T6508
Tris hydrochloride (Tris-HCl) Sigma-Aldrich 857645
Tris(hydroxymethyl)-aminomethane (Tris) Carl Roth 5429
Tryptone Carl Roth 8952
Yeast extract Carl Roth 2363
Zinc chloride (ZnCl2) Sigma-Aldrich 229997
L-alanine Sigma-Aldrich A7627
L-arginine Sigma-Aldrich A5006
L-asparagine Sigma-Aldrich A8381
L-aspartic acid Sigma-Aldrich A0884
L-cysteine Sigma-Aldrich C7352
L-glutamic acid Sigma-Aldrich G2128
L-glutamine Sigma-Aldrich G3126
L-glycine Sigma-Aldrich G7126
L-histidine Sigma-Aldrich H8000
L-isoleucine Sigma-Aldrich I2752
L-leucine Sigma-Aldrich L8000
L-lysine Sigma-Aldrich L5501
L-methionine Sigma-Aldrich M9625
L-phenylalanine Sigma-Aldrich P2126
L-proline Sigma-Aldrich P0380
L-serine Sigma-Aldrich S4500
L-threonine Sigma-Aldrich T8625
L-tryptophan Sigma-Aldrich T0254
L-tyrosine Sigma-Aldrich T3754
L-valine Sigma-Aldrich V0500
(4S)-fluoroproline Bachem 4033274 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression.
(4R)-fluoroproline Bachem 4033275 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression
3,4-dehydroproline Bachem 4003545 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression
4,4-difluoroproline Enamine EN400-17448 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression
Conical polystyrene (Falcon) tubes, 15 mL Fisher Scientific 14-959-49B
Conical polystyrene (Falcon) tubes, 50 mL Fisher Scientific 14-432-22
Dialysis membrane, Molecular Weight Cut-Off (MWCO) 5,000 Spectrum Medical Industries Spectra/Por MWCO 5000 dialysis membrane, 133198
Immobilized Metal ion Affinity Chromatography (IMAC) column 1 mL, Ni-NTA GE Healthcare HisTrap HP, 1 mL, 17-5247-01
Luer-Lock syringe, 5 mL Carl Roth EP96.1
Luer-Lock syringe, 20 mL Carl Roth T550.1
Luer-Lock syringe, 50 mL Carl Roth T552.1
Microcentrifuge tubes, 1.5 mL Eppendorf 30120086
Petri dishes (polystyrene, sterile) Carl Roth TA19
pQE-80L plasmid vector Qiagen no longer available replaced by N-terminus pQE Vector set Cat No./ID: 32915
Pro-auxotrophic E. coli strain JM83 Addgene 50348 https://www.addgene.org/50348/
Pro-auxotrophic E. coli strain JM83 ATCC 35607
Round-bottom polystyrene tubes, 14 mL Fisher Scientific Corning Falcon, 14-959-1B
Syringe filter 0.45 µm with polyvinylidene difluoride (PVDF) membrane Carl Roth CCY1.1
High-Performance Liquid Chromatography (HPLC) column for LC-ESI-TOF-MS Sigma-Aldrich Supelco Discovery BIO Wide Pore C5 HPLC column, 3 µm particle size, 10 cm x 2.1 mm with conical 0.1 mL glass inserts, screw caps and septa
HPLC autosampler vials 1.5 mL Sigma-Aldrich Supelco 854165
Mass spectrometer for LC-ESI-TOF-MS Agilent Agilent 6530 Accurate-Mass QTOF
Mass spectrometry data analysis software Agilent MassHunter Qualitative Analysis software v. B.06.00
Benchtop centrifuge for 1.5 mL Eppendorf tubes Eppendorf 5427 R
Cooling centrifuge for 50 mL Falcon tubes Eppendorf 5810 R
Fast Protein Liquid Chromatography (FPLC) system GE Healthcare ÄKTA pure 25 L
Fluorescence spectrometer Perkin Elmer LS 55
High pressure microfluidizer for bacterial cell disruption Microfluidics LM series with “Z” type chamber
Orbital shaker for bacterial cultivation Infors HT Minitron
Peristaltic pump for liquid chromatography (LC) GE Healthcare P-1
Ultrasonic homogenizer for bacterial cell disruption Omnilab Bandelin SONOPULS HD 3200, 5650182 with MS72 sonifier tip
UV-Vis spectrophotometer Biochrom ULTROSPEC 2100
UV-Vis/NIR spectrophotometer Perkin Elmer LAMBDA 950 UV/Vis/NIR

References

  1. Agostini, F., Völler, J. -. S., Koksch, B., Acevedo-Rocha, C. G., Kubyshkin, V., Budisa, N. Biocatalysis with unnatural amino acids: Enzymology meets xenobiology. Angewandte Chemie (International ed. In English). 56 (33), 9680-9703 (2017).
  2. Minks, C., Alefelder, S., Moroder, L., Huber, R., Budisa, N. Towards new protein engineering: In vivo building and folding of protein shuttles for drug delivery and targeting by the selective pressure incorporation (SPI) method. Tetrahedron. 56 (48), 9431-9442 (2000).
  3. Hoesl, M. G., Budisa, N. Expanding and engineering the genetic code in a single expression experiment. Chembiochem: A, European Journal of Chemical Biology. 12 (4), 552-555 (2011).
  4. Wiltschi, B., Budisa, N. Natural history and experimental evolution of the genetic code. Applied Microbiology and Biotechnology. 74 (4), 739-753 (2007).
  5. Hoesl, M. G., et al. Lipase congeners designed by genetic code engineering. ChemCatChem. 3 (1), 213-221 (2011).
  6. . FPbase avGFP Available from: https://www.fpbase.org/protein/avgfp/ (2011)
  7. Tsien, R. Y. The green fluorescent protein. Annual Review of Biochemistry. 67, 509-544 (1998).
  8. Zhang, Y., et al. Identification of genes expressed in C. elegans touch receptor neurons. Nature. 418 (6895), 331-335 (2002).
  9. Misteli, T., Spector, D. L. Applications of the green fluorescent protein in cell biology and biotechnology. Nature Biotechnology. 15 (10), 961-964 (1997).
  10. Hanson, M. R., Köhler, R. H. GFP imaging: methodology and application to investigate cellular compartmentation in plants. Journal of Experimental Botany. 52 (356), 529-539 (2001).
  11. Sakamoto, S., Shoyama, Y., Tanaka, H., Morimoto, S. Application of green fluorescent protein in immunoassays. Advances in Bioscience and Biotechnology. 05 (6), 557-563 (2014).
  12. Akbar, M., Kim, H. Y. Green fluorescent protein tagging: A novel tool in biomedical research. Indian Journal of Biotechnology. 4, 466-470 (2005).
  13. Kobayashi, T., Morone, N., Kashiyama, T., Oyamada, H., Kurebayashi, N., Murayama, T. Engineering a novel multifunctional green fluorescent protein tag for a wide variety of protein research. PloS One. 3 (12), 3822 (2008).
  14. Kent, K. P., Oltrogge, L. M., Boxer, S. G. Synthetic control of green fluorescent protein. Journal of the American Chemical Society. 131 (44), 15988-15989 (2009).
  15. Born, J., Pfeifer, F. Improved GFP variants to study gene expression in Haloarchaea. Frontiers in Microbiology. 10, 1200 (2019).
  16. Pakhomov, A. A., Martynov, V. I. GFP family: structural insights into spectral tuning. Chemistry & Biology. 15 (8), 755-764 (2008).
  17. Zimmer, M. Green fluorescent protein (GFP): applications, structure, and related photophysical behavior. Chemical Reviews. 102 (3), 759-781 (2002).
  18. Valbuena, F. M., Fitzgerald, I., Strack, R. L., Andruska, N., Smith, L., Glick, B. S. A photostable monomeric superfolder green fluorescent protein. Traffic. 21 (8), 534-544 (2020).
  19. Craggs, T. D. Green fluorescent protein: structure, folding and chromophore maturation. Chemical Society Reviews. 38 (10), 2865-2875 (2009).
  20. Maddalo, S. L., Zimmer, M. The role of the protein matrix in green fluorescent protein fluorescence. Photochemistry and Photobiology. 82 (2), 367-372 (2006).
  21. Cui, G., Lan, Z., Thiel, W. Intramolecular hydrogen bonding plays a crucial role in the photophysics and photochemistry of the GFP chromophore. Journal of the American Chemical Society. 134 (3), 1662-1672 (2012).
  22. Yang, F., Moss, L. G., Phillips, G. N. The molecular structure of green fluorescent protein. Nature Biotechnology. 14 (10), 1246-1251 (1996).
  23. Andrews, B. T., Roy, M., Jennings, P. A. Chromophore packing leads to hysteresis in GFP. Journal of Molecular Biology. 392 (1), 218-227 (2009).
  24. Xie, J. -. B., Zhou, J. -. M. Trigger factor assisted folding of green fluorescent protein. Biochemistry. 47 (1), 348-357 (2008).
  25. Steiner, T., Hess, P., Bae, J. H., Wiltschi, B., Moroder, L., Budisa, N. Synthetic biology of proteins: tuning GFPs folding and stability with fluoroproline. PloS One. 3 (3), 1680 (2008).
  26. Andrews, B. T., Schoenfish, A. R., Roy, M., Waldo, G., Jennings, P. A. The rough energy landscape of superfolder GFP is linked to the chromophore. Journal of Molecular Biology. 373 (2), 476-490 (2007).
  27. Kubyshkin, V., Davis, R., Budisa, N. Biochemistry of fluoroprolines: the prospect of making fluorine a bioelement. Beilstein Journal of Organic Chemistry. 17, 439-460 (2021).
  28. Renner, C., Alefelder, S., Bae, J. H., Budisa, N., Huber, R., Moroder, L. Fluoroprolines as tools for protein design and engineering. Angewandte Chemie (International ed. In English). 40 (5), 923-925 (2001).
  29. Fukuda, H., Arai, M., Kuwajima, K. Folding of green fluorescent protein and the cycle3 mutant. Biochemistry. 39 (39), 12025-12032 (2000).
  30. Rosenman, D. J., et al. Green-lighting green fluorescent protein: faster and more efficient folding by eliminating a cis-trans peptide isomerization event. Protein Science: A Publication of the Protein Society. 23 (4), 400-410 (2014).
  31. Vitagliano, L., Berisio, R., Mastrangelo, A., Mazzarella, L., Zagari, A. Preferred proline puckerings in cis and trans peptide groups: implications for collagen stability. Protein Science: A Publication of the Protein Society. 10 (12), 2627-2632 (2001).
  32. Kubyshkin, V. Experimental lipophilicity scale for coded and noncoded amino acid residues. Organic and Biomolecular Chemistry. 19 (32), 7031-7040 (2021).
  33. Kubyshkin, V., Budisa, N. cis-trans-Amide isomerism of the 3,4-dehydroproline residue, the ‘unpuckered’ proline. Beilstein Journal of Organic Chemistry. 12, 589-593 (2016).
  34. Budisa, N. Prolegomena to future experimental efforts on genetic code engineering by expanding its amino acid repertoire. Angewandte Chemie (International ed. In English). 43 (47), 6426-6463 (2004).
  35. Beatty, K. E., Tirrel, D. A. Noncanonical amino acids in protein science and engineering. Protein Engineering. Nucleic Acids and Molecular Biology. 22, (2009).
  36. Budisa, N. . Engineering the Genetic Code: Expanding the Amino Acid Repertoire for the Design of Novel Proteins. , (2006).
  37. Merkel, L., Budisa, N. Organic fluorine as a polypeptide building element: in vivo expression of fluorinated peptides, proteins and proteomes. Organic & Biomolecular Chemistry. 10 (36), 7241-7261 (2012).
  38. van Eldijk, M. B., van Hest, J. C. M. Residue-specific incorporation of non-canonical amino acids for protein engineering. Methods in Molecular Biology. 1728, 137-145 (2018).
  39. Hartman, M. C. T. Non-canonical amino acid substrates of E. coli aminoacyl-tRNA synthetases. Chembiochem: A European Journal of Chemical Biology. , (2021).
  40. Gomez, M. A. R., Ibba, M. Aminoacyl-tRNA synthetases. RNA. 26 (8), 910-936 (2020).
  41. Grant, M. M., Brown, A. S., Corwin, L. M., Troxler, R. F., Franzblau, C. Effect of l-azetidine 2-carboxylic acid on growth and proline metabolism in Escherichia coli. Biochimica et Biophysica Acta. 404 (2), 180-187 (1975).
  42. Budisa, N., Steipe, B., Demange, P., Eckerskorn, C., Kellermann, J., Huber, R. High-level biosynthetic substitution of methionine in proteins by its analogs 2-aminohexanoic acid, selenomethionine, telluromethionine and ethionine in Escherichia coli. European Journal of Biochemistry. 230 (2), 788-796 (1995).
  43. Budisa, N., Pal, P. P. Designing novel spectral classes of proteins with a tryptophan-expanded genetic code. Biological Chemistry. 385 (10), 893-904 (2004).
  44. Hoesl, M. G., Budisa, N. Recent advances in genetic code engineering in Escherichia coli. Current Opinion in Biotechnology. 23 (5), 751-757 (2012).
  45. Nickling, J. H., et al. Antimicrobial peptides produced by selective pressure incorporation of non-canonical amino acids. Journal of Visualized Experiments: JoVE. (135), e57551 (2018).
  46. JoVE. Basic Methods in Cellular and Molecular Biology. Bacterial Transformation: Electroporation. JoVE Science Education Database. , (2021).
  47. JoVE. Basic Methods in Cellular and Molecular Biology. Bacterial Transformation: The Heat Shock Method. JoVE Science Education Database. , (2021).
  48. Sarkisyan, K. S., et al. fluorescent protein with anionic tryptophan-based chromophore and long fluorescence lifetime. Biophysical Journal. 109 (2), 380-389 (2015).
  49. Sarkisyan, K. S., et al. KillerOrange, a genetically encoded photosensitizer activated by blue and green light. PloS One. 10 (12), 0145287 (2015).
  50. Grigorenko, B. L., Krylov, A. I., Nemukhin, A. V. Molecular modeling clarifies the mechanism of chromophore maturation in the green fluorescent protein. Journal of the American Chemical Society. 139 (30), 10239-10249 (2017).
  51. Pletnev, V. Z., et al. Structure of the green fluorescent protein NowGFP with an anionic tryptophan-based chromophore. Acta Crystallographica. Section D, Biological Crystallography. 71, 1699-1707 (2015).
  52. Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture medium for enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
  53. Hörnsten, E. G. On culturing Escherichia coli on a mineral salts medium during anaerobic conditions. Bioprocess Engineering. 12 (3), 157-162 (1995).
  54. Davis, B. D. The Isolation of biochemically deficient mutants of bacteria by means of penicillin. Proceedings of the National Academy of Sciences of the United States of America. 35 (1), 1-10 (1949).
  55. Sambrook, J., Russell, D. W. . Molecular Cloning: A Laboratory Manual. , (2001).
  56. Wang, Y. -. S., et al. The de novo engineering of pyrrolysyl-tRNA synthetase for genetic incorporation of L-phenylalanine and its derivatives. Molecular bioSystems. 7 (3), 714-717 (2011).
  57. JoVE. Basic Methods in Cellular and Molecular Biology. Separating Protein with SDS-PAGE. JoVE Science Education Database. , (2021).
  58. . ImageJ Available from: https://imagej.nih.gov/ij/ (2021)
  59. Baumann, T., et al. Engineering ‘Golden’ fluorescence by selective pressure incorporation of non-canonical amino acids and protein analysis by mass spectrometry and fluorescence. Journal of Visualized Experiments: JoVE. (134), e57017 (2018).
  60. . FPbase NowFFP Available from: https://www.fpbase.org/protein/nowgfp/ (2021)
  61. Markwardt, M. L., et al. An improved cerulean fluorescent protein with enhanced brightness and reduced reversible photoswitching. PloS One. 6 (3), 17896 (2011).
  62. Gotthard, G., von Stetten, D., Clavel, D., Noirclerc-Savoye, M., Royant, A. Chromophore isomer stabilization is critical to the efficient fluorescence of cyan fluorescent proteins. Biochemistry. 56 (49), 6418-6422 (2017).
  63. Lelimousin, M., et al. Intrinsic dynamics in ECFP and Cerulean control fluorescence quantum yield. Biochemistry. 48 (42), 10038-10046 (2009).
  64. . FPbase mKillerOrange Available from: https://www.fpbase.org/protein/mkillerorange/ (2021)
  65. Pletneva, N. V., et al. Crystal structure of phototoxic orange fluorescent proteins with a tryptophan-based chromophore. PloS One. 10 (12), 0145740 (2015).
  66. Royant, A., Noirclerc-Savoye, M. Stabilizing role of glutamic acid 222 in the structure of Enhanced Green Fluorescent Protein. Journal of Structural Biology. 174 (2), 385-390 (2011).
  67. Larregola, M., Moore, S., Budisa, N. Congeneric bio-adhesive mussel foot proteins designed by modified prolines revealed a chiral bias in unnatural translation. Biochemical and Biophysical Research Communications. 421 (4), 646-650 (2012).
  68. Yamaguchi, H., Miyazaki, M. Refolding techniques for recovering biologically active recombinant proteins from inclusion bodies. Biomolecules. 4 (1), 235-251 (2014).
  69. Ghisaidoobe, A. B. T., Chung, S. J. Intrinsic tryptophan fluorescence in the detection and analysis of proteins: A focus on Förster resonance energy transfer techniques. International Journal of Molecular Sciences. 15 (12), 22518-22538 (2014).
  70. Pal, P. P., et al. Structural and spectral response of Aequorea victoria green fluorescent proteins to chromophore fluorination. Biochemistry. 44 (10), 3663-3672 (2005).
  71. Pletnev, S., et al. Structural basis for phototoxicity of the genetically encoded photosensitizer KillerRed. The Journal of Biological Chemistry. 284 (46), 32028-32039 (2009).
  72. Kubyshkin, V., Budisa, N. Anticipating alien cells with alternative genetic codes: away from the alanine world. Current Opinion in Biotechnology. 60, 242-249 (2019).
  73. Minks, C., Huber, R., Moroder, L., Budisa, N. Atomic mutations at the single tryptophan residue of human recombinant annexin V: effects on structure, stability, and activity. Biochemistry. 38 (33), 10649-10659 (1999).
  74. Budisa, N., Huber, R., Golbik, R., Minks, C., Weyher, E., Moroder, L. Atomic mutations in annexin V thermodynamic studies of isomorphous protein variants. European Journal of Biochemistry. 253, 1-9 (1998).
  75. Lin, X., Yu, A. C. S., Chan, T. F. Efforts and challenges in engineering the genetic code. Life. 7, (2017).
  76. Völler, J. -. S., Budisa, N. Coupling genetic code expansion and metabolic engineering for synthetic cells. Current Opinion in Biotechnology. 48, 1-7 (2017).
  77. Liu, C. C., Schultz, P. G. Adding new chemistries to the genetic code. Annual Review of Biochemistry. 79, 413-444 (2010).
  78. Lukesch, M. S., Pavkov-Keller, T., Gruber, K., Zangger, K., Wiltschi, B. Substituting the catalytic proline of 4-oxalocrotonate tautomerase with non-canonical analogues reveals a finely tuned catalytic system. Scientific Reports. 9 (1), 2697 (2019).
  79. Acevedo-Rocha, C. G., et al. Non-canonical amino acids as a useful synthetic biological tool for lipase-catalysed reactions in hostile environments. Catalysis Science & Technology. 3 (5), 1198 (2013).
  80. Holzberger, B., Marx, A. Replacing 32 proline residues by a non-canonical amino acid results in a highly active DNA polymerase. Journal of the American Chemical Society. 132 (44), 15708-15713 (2010).
  81. Mosesso, R., Dougherty, D. A., Lummis, S. C. R. Proline residues in the transmembrane/extracellular domain interface loops have different behaviors in 5-HT3 and nACh receptors. ACS Chemical Neuroscience. 10 (7), 3327-3333 (2019).
  82. Mosesso, R., Dougherty, D. A., Lummis, S. C. R. Probing proline residues in the prokaryotic ligand-gated ion channel, ELIC. Biochemistry. 57 (27), 4036-4043 (2018).
  83. Torbeev, V. Deciphering protein folding using chemical protein synthesis. Total Chemical Synthesis of Proteins. 1st ed. , (2021).
  84. Torbeev, V. Y., Hilvert, D. Both the cis-trans equilibrium and isomerization dynamics of a single proline amide modulate β2-microglobulin amyloid assembly. Proceedings of the National Academy of Sciences of the United States of America. 110 (50), 20051-20056 (2013).
  85. Kawakami, T., Ishizawa, T., Murakami, H. Extensive reprogramming of the genetic code for genetically encoded synthesis of highly N-alkylated polycyclic peptidomimetics. Journal of the American Chemical Society. 135 (33), 12297-12304 (2013).
  86. Cui, Z., Johnston, W. A., Alexandrov, K. Cell-free approach for non-canonical amino acids incorporation into polypeptides. Frontiers in Bioengineering and Biotechnology. 8, 1031 (2020).

Play Video

Cite This Article
Thi To, T. M., Kubyshkin, V., Schmitt, F., Budisa, N., Friedrich, T. Residue-Specific Exchange of Proline by Proline Analogs in Fluorescent Proteins: How “Molecular Surgery” of the Backbone Affects Folding and Stability. J. Vis. Exp. (180), e63320, doi:10.3791/63320 (2022).

View Video