Summary

Échange spécifique de résidus de proline par des analogues de proline dans des protéines fluorescentes: comment la « chirurgie moléculaire » de l’épine dorsale affecte le repliement et la stabilité

Published: February 03, 2022
doi:

Summary

Pour surmonter les limites de la mutagénèse classique dirigée par site, des analogues de la proline avec des modifications spécifiques ont été incorporés dans plusieurs protéines fluorescentes. Nous montrons comment le remplacement de l’hydrogène par le fluor ou du simple par des liaisons doubles dans les résidus de proline (« chirurgie moléculaire ») affecte les propriétés fondamentales des protéines, y compris leur repliement et leur interaction avec la lumière.

Abstract

Le remplacement des résidus de proline (Pro) dans les protéines par la mutagénèse traditionnelle dirigée par le site par l’un des 19 acides aminés canoniques restants est souvent préjudiciable au repliement des protéines et, en particulier, à la maturation des chromophores dans les protéines fluorescentes vertes et les variantes connexes. Une alternative raisonnable consiste à manipuler la traduction de la protéine afin que tous les résidus Pro soient remplacés spécifiquement par des analogues, une méthode connue sous le nom d’incorporation sélective sous pression (SPI). Les modifications chimiques intégrées peuvent être utilisées comme une sorte de « chirurgie moléculaire » pour disséquer finement les changements mesurables ou même manipuler rationnellement différentes propriétés des protéines. Ici, l’étude démontre l’utilité de la méthode SPI pour étudier le rôle des prolines dans l’organisation de la structure typique β baril des variantes spectrales de la protéine fluorescente verte (GFP) avec 10-15 prolines dans leur séquence: protéine fluorescente verte améliorée (EGFP), NowGFP et KillerOrange. Les résidus Pro sont présents dans les sections de connexion entre les différents brins de β et constituent les couvercles de fermeture de l’échafaudage du baril, étant ainsi responsables de l’isolation du chromophore de l’eau, c’est-à-dire des propriétés de fluorescence. Des expériences d’incorporation sélective sous pression avec (4R)-fluoroproline (R-Flp), (4S)-fluoroproline (S-Flp), 4,4-difluoroproline (Dfp) et 3,4-déshydroproline (Dhp) ont été réalisées en utilisant une souche d’E. coli proline-auxotrophe comme hôte d’expression. Nous avons constaté que les protéines fluorescentes avec S-Flp et Dhp sont actives (c’est-à-dire fluorescentes), tandis que les deux autres analogues (Dfp et R-Flp) produisent des protéines dysfonctionnelles et mal repliées. L’inspection des profils d’absorption ET d’émission de fluorescence UV-Vis a montré peu d’altérations caractéristiques dans les protéines contenant des analogues Pro. L’examen des profils cinétiques de repliement dans les variantes EGFP a montré un processus de repliement accéléré en présence de S-Flp, alors que le processus était similaire au type sauvage dans la protéine contenant du Dhp. Cette étude met en valeur la capacité de la méthode SPI à produire des modifications subtiles des résidus de protéines au niveau atomique (« chirurgie moléculaire »), qui peuvent être adoptées pour l’étude d’autres protéines d’intérêt. Il illustre les résultats des remplacements de proline avec des analogues chimiques proches sur les propriétés de repliement et spectroscopiques dans la classe des protéines fluorescentes à baril β.

Introduction

La mutagénèse classique dirigée par site permet la permutation de toute séquence protéique codée par un gène existante par manipulation du codon au niveau de l’ADN. Pour étudier le repliement et la stabilité des protéines, il est souvent souhaitable de remplacer des acides aminés similaires par des homologues similaires. Cependant, la mutagenèse protéique traditionnelle est définitivement limitée à des remplacements structurellement similaires parmi les acides aminés canoniques tels que Ser / Ala / Cys, Thr / Val, Glu / Gln, Asp / Asn, Tyr / Phe, qui sont présents dans le répertoire de code génétique standard. D’autre part, il n’existe pas de telles possibilités pour d’autres acides aminés canoniques tels que Trp, Met, His ou Pro, qui jouent souvent des rôles structurels et fonctionnels essentiels dans les protéines1. Une approche idéale pour étudier ces interactions dans le contexte de l’architecture interne très spécifique des protéines et de leur processus de repliement consiste à générer des modifications isostériques non perturbatrices. En effet, lorsque des analogues d’acides aminés isostériques de ces acides aminés canoniques, également connus sous le nom d’acides aminés non canoniques (ncAA), sont insérés dans les protéines, ils permettent des changements subtils même au niveau d’atomes simples ou de groupes d’atomes tels que H/F, CH2/S/Se/Te connus sous le nom de « mutations atomiques »2. Une telle « chirurgie moléculaire » produit des protéines altérées dont les propriétés résultent uniquement de l’échange d’atomes uniques ou de groupes d’atomes, qui dans des cas favorables peuvent être analysés et les changements détectés peuvent être rationalisés. De cette façon, la portée de la synthèse des protéines pour étudier le repliement et la structure des protéines est étendue bien au-delà de la mutagénèse classique de l’ADN. Notez que les protéines générées par la mutagénèse dirigée par le site sont généralement appelées « mutants », tandis que les protéines avec des acides aminés canoniques substitués sont appelées « variantes » 3, « alloprotéines»4 ou « congénères protéiques»5.

La protéine fluorescente verte (GFP), identifiée pour la première fois dans l’organisme marin Aequorea victoria, présente une fluorescence vert vif lorsqu’elle est exposée à une lumière ultraviolette à bleue 6,7. Aujourd’hui, la GFP est couramment utilisée comme outil de marquage très sensible pour la visualisation de routine de l’expression des gènes et de la localisation des protéines dans les cellules par microscopie fluorescente. Le GFP s’est également avéré utile dans diverses études biophysiques 8,9,10 et biomédicales 11,12, ainsi que dans l’ingénierie des protéines 13,14,15. Une analyse rigoureuse de la structure GFP a permis la création de nombreuses variantes caractérisées par une stabilité variée et des maximade fluorescence 16,17. La plupart des variantes de GFP utilisées en biologie cellulaire et moléculaire sont des protéines monomères à la fois en solution et dans le cristal18. Leur organisation structurelle principale est typique de tous les membres de la famille GFP, indépendamment de leur origine phylogénétique, et se compose de 11 brins β formant un baril β, tandis qu’une hélice α plissée traverse le centre du canon et porte le chromophore (Figure 1A). La maturation autocatalytique du chromophore (Figure 1B) nécessite le positionnement précis des chaînes latérales qui l’entourent à la place centrale de la protéine ; beaucoup de ces chaînes latérales sont hautement conservées dans d’autres variantes GFP19. Dans la plupart des protéines fluorescentes de méduses telles que Aequorea victoria, le chromophore émetteur de vert se compose de deux cycles aromatiques, dont un cycle phénolique de Tyr66 et la structure hétérocyclique à cinq membres de l’imidazolinone (Figure 1B). Le chromophore, lorsqu’il est correctement intégré dans la matrice protéique, est responsable de la fluorescence caractéristique de la protéine entière. Il est situé au centre de la structure, tandis que la structure du tonneau l’isole du milieu aqueux20. L’exposition du chromophore à l’eau en vrac entraînerait une trempe par fluorescence, c’est-à-dire une perte de fluorescence21.

Le pliage approprié de la structure en forme de tonneau est essentiel pour protéger le chromophore contre la trempe par fluorescence22. Les résidus de proline (Pro) jouent un rôle particulier dans l’organisation structurelle du GFP23. Étant incapables de supporter un β brins, ils constituent des boucles de connexion responsables du maintien de la structure protéique dans son ensemble. Sans surprise, 10 à 15 résidus de proline se trouvent dans les GFP dérivés d’Aequorea et d’Anthoathecata; certains d’entre eux sont hautement conservés dans d’autres types de protéines fluorescentes β barils. On s’attend à ce que les prolines influencent de manière critique les propriétés de pliage en raison de leurs caractéristiques géométriques particulières. Par exemple, dans les GFPs dérivés d’Aequorea, sur les dix résidus de proline (Figure 2A), neuf forment des trans– et un seul forme une liaison cis-peptide (Pro89). Pro58 est essentiel, c’est-à-dire non interchangeable avec le reste des 19 acides aminés canoniques. Ce résidu peut être responsable du positionnement correct du résidu Trp57, qui a été signalé comme étant crucial pour la maturation du chromophore et le repliement global du GFP24. Le fragment PVPWP avec trois résidus de proline (Pro54, Pro56, Pro58) et Trp57 est la partie essentielle de la « paupière inférieure » dans la structure GFP de la figure 1A. Le motif structurel du PVPWP se trouve dans plusieurs protéines telles que les cytochromes et les canaux potassiques eucaryotes activés par la tension25. Les substitutions de proline à alanine aux positions 75 et 89 sont également préjudiciables à l’expression et au repliement des protéines et abolissent la maturation des chromophores. Pro75 et Pro89 font partie de la « paupière supérieure » enfouissant le chromophore (Figure 1A) et sont conservés dans les protéines fluorescentes à 11 brins β baril23. Ces deux « couvercles » maintiennent le chromophore exclu du solvant aqueux, même lorsque la structure tertiaire stable a été partiellement brisée26. Une telle architecture moléculaire spécifique protège le fluorophore de la trempe par fluorescence collisionnelle (dynamique), par exemple par l’eau, l’oxygène ou d’autres ligands diffusibles.

Afin d’effectuer l’ingénierie moléculaire de la structure GFP, il faut introduire des substitutions d’acides aminés dans la structure primaire de la protéine. De nombreuses mutations ont été réalisées sur GFP, fournissant des variantes avec une stabilité élevée, un repliement rapide et fiable et des propriétés de fluorescence variables17. Néanmoins, dans la plupart des cas, la mutation des résidus de proline est considérée comme une approche risquée en raison du fait qu’aucun des 19 acides aminés canoniques restants ne peut restaurer correctement le profil conformationnel du résidu de proline27. Ainsi, une approche alternative a été développée, dans laquelle les résidus de proline sont remplacés par d’autres structures à base de proline, surnommées analogues de la proline28. En raison de sa structure chimique cyclique unique, la proline présente deux transitions conformationnelles caractéristiques (Figure 1C) : 1) le pliage de l’anneau de proline, un processus rapide impliquant l’organisation de l’épine dorsale, qui affecte principalement l’angle de torsion φ, et 2) l’isomérisation de la liaison peptidique cis/trans, un processus lent impactant le repliement de l’épine dorsale via les angles de torsion ω. En raison de sa nature lente, cette dernière transition est généralement responsable des étapes limitant le taux dans le processus de repliement de la protéine entière. Il a été démontré précédemment que l’isomérisation cis/trans de la liaison peptidique autour de certains résidus de proline comporte des étapes lentes dans le repliement des variantes GFP. Par exemple, la formation de la liaison cis-peptide à Pro89 présente l’étape lente du processus de repliement car elle repose sur la transition de la liaison de trans à cis29. Un repliement plus rapide peut être obtenu après avoir remplacé Pro89 par une boucle peptidique entièrement trans, c’est-à-dire en abolissant un événement d’isomérisation cis-à-trans 30. En plus de l’isomérisation cis/trans, les transitions de pucker peuvent également générer de profonds changements dans le repliement des protéines en raison de l’organisation de l’épine dorsale et de l’emballage dans l’intérieur de la protéine27,31.

Les modifications chimiques entraînent une altération des transitions conformationnelles intrinsèques des résidus de proline, affectant ainsi la capacité de la protéine à se replier. Certains analogues de la proline sont des candidats particulièrement attrayants pour la substitution de la proline dans les protéines car ils permettent la manipulation et l’étude des propriétés de repliement. Par exemple, (4R)-fluoroproline (R-Flp), (4S)-fluoroproline (S-Flp), 4,4-difluoroproline (Dfp) et 3,4-déshydroproline (Dhp) sont quatre analogues (Figure 1D) qui diffèrent peu de la proline en termes de volume moléculaire et de polarité32. Dans le même temps, chaque analogue présente une rondelle annulaire distincte : S-Flp stabilise la rondelle C4-endo, R-Flp stabilise la rondelle C4-exo, Dfp ne présente aucune préférence apparente pour la rondelle, tandis que Dhp abolit la rondelle (Figure 1D)33. En utilisant ces analogues dans la structure protéique, on peut manipuler avec la transition conformationnelle des résidus de proline, et avec cela, affecter les propriétés des variantes GFP résultantes.

Dans ce travail, nous avons entrepris d’incorporer l’ensemble désigné d’analogues de la proline (figure 1D) dans la structure des variantes GFP en utilisant la méthode d’incorporation sélective de la pression (SPI, Figure 3)34. Le remplacement des résidus d’acides aminés par leurs analogues isostructuraux les plus proches est un concept biotechnologique appliqué dans la conception des protéines35,36. Ainsi, les effets des analogues de la proline dans une protéine modèle illustrent leur potentiel à servir d’outils dans l’ingénierie des protéines37. La production de protéines contenant les analogues souhaités a été réalisée dans des souches modifiées d’E. coli qui ne sont pas capables de produire de la proline (auxotrophie de la proline). Ainsi, ils pourraient être contraints d’accepter le remplacement des substrats dans le processus de biosynthèse des protéines38. Cette substitution globale de la proline est rendue possible par la flexibilité naturelle du substrat des aminoacyl-ARNt endogènes synthétases39, les enzymes clés catalysant l’estérification des ARNt avec les acides aminés appropriés40. En général, comme le montre la figure 3, la croissance cellulaire est effectuée dans un milieu défini jusqu’à ce que la phase de croissance mi-logarithmique soit atteinte. Dans l’étape suivante, l’acide aminé à remplacer est appauvri intracellulairement du système d’expression pendant la fermentation et ensuite échangé par l’analogue souhaité ou ncAA. L’expression de la protéine cible est ensuite induite pour l’incorporation d’acides aminés non canoniques spécifiques aux résidus. La substitution de l’acide aminé apparenté par son analogue se produit à l’échelle du protéome. Bien que cet effet secondaire puisse avoir un impact négatif sur la croissance de la souche hôte, la qualité de la production de protéines cibles n’est généralement pas affectée, car, dans l’expression recombinante, les ressources cellulaires sont principalement dirigées vers la production de la protéine cible41,42. Par conséquent, un système d’expression inductible étroitement réglementé et de puissants promoteurs sont essentiels pour une efficacité d’incorporation élevée43. Notre approche est basée sur l’incorporation multiple de ncAA spécifiques aux résidus en réponse à des codons de sens (réaffectation de codon de sens), par laquelle dans le gène cible, le nombre de positions pour l’insertion analogique Pro peut être manipulé via la mutagénèse dirigée par le site44. Une approche similaire a été appliquée dans notre rapport précédent sur la préparation de peptides recombinants ayant des propriétés antimicrobiennes45. Dans ce travail, nous avons appliqué la méthode SPI, qui permet de remplacer tous les résidus de proline par des analogues apparentés, pour générer des protéines censées posséder des propriétés physicochimiques distinctes non présentes dans les protéines synthétisées avec le répertoire canonique d’acides aminés. En caractérisant le profil de pliage et de fluorescence des variantes résultantes, nous visons à mettre en évidence les effets des substitutions atomiques dans les variantes de GFP.

Protocol

1. Introduction de plasmides d’expression dans les cellules pro-auxotrophes compétentes d’E. coli Mélanger 1 ng de chaque plasmide d’échantillon, pQE-80L H6-EGFP, pQE-80L H6-NowGFP et pQE-80L H6-KillerOrange, avec 50 μL de cellules chimiquement compétentes ou électrocompétentes de la souche dérivée pro-auxotrophe E. coli K12 JM83 (Addgene #50348, ou ATCC #35607) pour transformation par la méthode du choc thermique ou l’électroporation selon les protocoles disponibles46, 47.REMARQUE: Le vecteur d’expression pQE-80L EGFP-H6 code une protéine fluorescente verte améliorée (EGFP) marquée C-terminalement 6xHis, les vecteurs d’expression pQE-80L H 6-NowGFP et pQE-80L H6-KillerOrange codent un NowGFP 48 marqué N-terminal 6xHis ou un KillerOrange 49 marqué N-terminal 6xHis, respectivement, chacun dans un backbone plasmidique pQE-80L. Tous les gènes cibles sont sous le contrôle d’un promoteur bactérien T5 régulé par l’opérateur lac. La résistance à l’ampicilline a été utilisée comme marqueur de sélection et le colE1 comme origine de la réplication. Voir le Tableau des matériaux pour plus d’informations sur le plasmide pQE-80L. Une alternative Pro-auxotrophic E. coli provenant des souches K-12 et B peut également être utilisée pour l’expression et devrait donner des résultats similaires. La masse moléculaire calculée des protéines de type sauvage protonées individuellement ([M+H]+) marquéesH6 (après maturation du chromophore) est de 27 745,33 Da (EGFP-H6), 27 931,50 Da (H 6-NowGFP) et 27 606,09 Da (H6-KillerOrange). Les structures primaires des protéines cibles sont données dans le tableau 1 (His-tag souligné). La glutamine (Q) dans la séquence His-tag de NowGFP a été identifiée par séquençage de l’ADN après sous-clonage de l’ADNc NowGFP reçu de Pletnev et al.51 dans le plasmide pQE-80L. Il n’entrave pas la purification des protéines ou les propriétés de la protéine fluorescente. Récupérer les cellules dans 950 μL de milieu SOC à 37 °C pendant 1 h. Étaler 50 μL des cellules récupérées sur des plaques moyennes de Luria Agar (LA) (voir Matériel supplémentaire) contenant du glucose (10 g/L) et de l’ampicilline (100 μg/mL). Incuber les plaques moyennes LA à 37 °C pendant la nuit ou à 30 °C pendant 24 h. 2. Production de protéines fluorescentes recombinantes de type sauvage (hébergeant de la proline canonique) et procédure d’incorporation sélective sous pression (SPI) pour produire des protéines fluorescentes avec des analogues de la proline (S-Flp, R-Flp, Dfp, Dhp) Culture nocturne de la souche pro-auxotrophe E. coli K12 dérivée JM83 hébergeant pQE-80L EGFP-H6, pQE-80L H 6-NowGFP et pQE-80L H 6-KillerOrange Utilisez une pointe de pipette stérile ou une boucle d’inoculation pour sélectionner une seule colonie dans une plaque de milieu LA et remettre les cellules en suspension dans 5 mL de bouillon de lysogénie (LB) (voir Matériel supplémentaire; contenant 10 g/L de glucose, 100 μg/mL d’ampicilline) dans un tube de culture stérile de polystyrène de 14 mL.REMARQUE: Les colonies fraîchement transformées sont recommandées pour l’inoculation. Les cellules sur des plaques de milieu LA (à partir de l’étape 2.2.) stockées à 4 °C doivent être utilisées en quelques jours. Cultivez la culture cellulaire pendant la nuit à 37 °C dans un agitateur orbital à 200-250 tr/min. Production d’EGFP-H recombinant6, H6-NowGFP et H6-KillerOrange avec proline native et les variantes protéiques correspondantes avec des analogues de prolineInoculer 200 mL de milieu NMM frais (7,5 mM (NH4)2SO4, 50 mM K2HPO4 et 22 mM KH2PO4, 8,5 mM NaCl, 1 mM MgSO4, 20 mM D-glucose, 1 μg/mL FeCl2, 1 μg/mL CaCl2, 10 μg/mL de thiamine, 10 μg/mL de biotine, 0,01 μg/mL d’oligo-éléments (CuSO4, ZnCl2, MnCl2, (NH4)2MoO4), pH ~7,2) avec tous les acides l-aminés canoniques (50 mg/L); voir Matériel supplémentaire) complété par 100 μg/mL d’ampicilline avec 2 mL de culture pendant la nuit dans une fiole d’Erlenmeyer de 2 L.REMARQUE: Selon le type de protéine, des milieux de culture alternatifs tels que le milieu MOPS52, le milieu glucose-sels minéraux53, le milieu minimal Davis54, le milieu minimal M955 ou GMML56 peuvent être testés pour optimiser le rendement en protéines. Incuber les cellules à 37 °C dans un agitateur orbital à 220 tr/min pendant ~3 h 30 min. Mesurez la densité optique à 600 nm (OD600) dans un spectrophotomètre toutes les 30 minutes jusqu’à ce qu’une valeur OD600 de ~ 0,7 soit atteinte.REMARQUE: Pour la détermination del’OD 600 dans un spectrophotomètre, la cuvette doit avoir une longueur de trajet de 1 cm. Le milieu de culture correspondant est utilisé pour la mesure de référence (« zéro »). Le temps d’incubation jusqu’à ce qu’une valeur OD600 de ~ 0,7 soit atteinte peut dépendre du volume de culture. 3 h 30 min est une valeur approximative. Dans une variante des sous-étapes du protocole 2.2.1-2.2.3., la culture de la sous-étape 2.1.2. est utilisé pour inoculer un milieu frais NMMΔPro (voir Matériel supplémentaire) complété par une concentration limitée de proline (par exemple, 5 mg/L au lieu de 50 mg/L), et les cellules sont cultivées pendant la nuit à 37 °C dans un agitateur orbital à 220 tr/min. Le lendemain, la détermination de l’OD600 est effectuée toutes les 30 minutes jusqu’à ce que les différences entre les mesures soient inférieures à 0,05. La valeur maximale de OD600 doit être d’environ 1 (± 0,3). La concentration initiale limitée de proline peut être ajustée en fonction de la souche d’expression et du milieu de culture (voir Discussion). Faire tourner la suspension de la cellule pendant 10 min à 3 000 x g et 4 °C. Décantez doucement le surnageant dans les déchets. Étape de lavage : Remettre les cellules en suspension dans 50 mL de milieu NMMΔAA glacé (sans aucun acide aminé, voir Matériel supplémentaire) ou NMMΔPro (sans proline, voir Matériau supplémentaire) par pipetage soigneux.REMARQUE: Pour cette étape de lavage, l’un des deux tampons indiqués peut être utilisé, car il est seulement important de se débarrasser de la proline résiduelle dans le milieu d’incubation. Séparer les cellules du milieu par sédimentation à 4 °C dans une centrifugeuse à 3 000 x g pendant 10 min. Décantez doucement le surnageant dans les déchets. Pipeter doucement de haut en bas pour remettre en suspension la pastille de cellule dans 200 mL de milieu NMMΔPro complété par 100 μg/mL d’ampicilline dans une fiole d’Erlenmeyer de 2 L.REMARQUE: La suspension cellulaire résultante peut être séparée en plusieurs échantillons de volume égal pour obtenir des cultures de départ identiques pour comparer l’expression des protéines en présence d’analogues Pro ou proline (par exemple, séparation en 4 x 50 mL dans des flacons d’Erlenmeyer de 100 mL). Incuber pendant 30 min à 37 °C dans un agitateur orbital à 220 tr/min pour l’épuisement complet de Pro.REMARQUE: Cette étape est essentielle pour épuiser complètement Pro des cellules. Ajouter un volume approprié de L-proline ou R-Flp, S-Flp, Dfp et Dhp à partir de la solution mère de 50 mM pour ajuster la concentration finale de 1 mM dans la suspension cellulaire.REMARQUE: En règle générale, les solutions mères fraîches de 50 mM de dérivés Pro ou proline doivent toujours être préparées avant utilisation. Ce n’est que si l’hydrolyse de l’acide aminé canonique ou non canonique particulier dans une solution aqueuse n’est pas préoccupante que des stocks congelés peuvent également être utilisés. Ajouter 0,5 mM d’IPTG à partir d’une solution mère de 1 M pour induire l’expression de la protéine cible. Exprimer la protéine cible pendant la nuit (12 h) à 37 °C dans un agitateur orbital à 220 tr/min. MesurezOD 600 le lendemain.REMARQUE: La détermination de l’OD600 est effectuée pour quantifier la quantité de cellules après l’expression des protéines. Une valeur OD600 inférieure à la valeur mesurée avant l’étape de lavage 2.2.3 indique une cytotoxicité de l’acide aminé fourni. Dans ce cas, la procédure doit être répétée avec la concentration de l’acide aminé fourni minimisée (jusqu’à 0,1 mM). Centrifuger et prélever les cellules bactériennes à 5 000 x g et 4 °C pendant 10 min et décanter le surnageant dans les déchets. Étape de lavage : Remettre les cellules en ressuscitant soigneusement dans 50 mL de tampon de liaison (50 mM Tris-HCl, pH 8,0, 150 mM NaCl, 1 mM DTT) contenant 10 % de glycérol et transférer la suspension cellulaire dans un tube conique en polystyrène de 50 mL. Centrifuger et prélever les cellules bactériennes à 5 000 x g et 4 °C pendant 10 min et décanter le surnageant dans les déchets. Conserver la pastille cellulaire dans un tube conique en polystyrène de 50 mL à -20 °C ou -80 °C jusqu’à une utilisation ultérieure (purification des protéines, voir ci-dessous). 3. Procédé de purification d’échantillons de protéines par chromatographie d’affinité ionique métallique immobilisée (IMAC) Lyse des cellules bactériennesREMARQUE: Effectuer toutes les étapes de la lyse cellulaire sur glace ou à 4 ° C pour empêcher la dégradation de la protéine cible. Décongeler la pastille de cellule bactérienne sur de la glace ou à 4 °C dans un tube de polystyrène conique de 50 mL pendant 10 à 20 min. Ajouter 10 mL de tampon de liaison glacé (voir Matériel supplémentaire) et pipeter doucement de haut en bas pour remettre en suspension la pastille de la cellule. Ajouter 100 μL de 50 mg/mL de lysozyme, 100 μL de 1 mg/mL de DNase I, 100 μL de 1 mg/mL de RNase A, 30 μL de 1 M MgCl2. Inverser soigneusement la suspension cellulaire cinq fois et maintenir le tube fermé sur de la glace ou à 4 °C pendant 60 min.REMARQUE: Le lysozyme induit une lyse cellulaire chimique en perturbant la paroi cellulaire bactérienne. Soniquer l’échantillon pour la perturbation cellulaire à l’aide d’un homogénéisateur à ultrasons (p. ex., 3 fois pendant 3 min dans un tube de polystyrène de 50 mL sur un mélange glace-eau, impulsion 2 s/pause 4 s, amplitude de 45 %).REMARQUE: Alternativement, d’autres méthodes de perturbation cellulaire peuvent être utilisées, par exemple, l’homogénéisation à haute pression en 20 cycles à 14 000 psi. Si nécessaire, diluer à l’aide d’un tampon de liaison (voir Matériel supplémentaire) pour atteindre le volume minimal de l’instrument. De plus, les réactifs d’extraction des protéines peuvent être utilisés pour la perturbation cellulaire. Voir le Tableau des matériaux pour des exemples. Centrifugeuse pendant 60 min à 18 000 x g, 4 °C. Notez le volume de liquide pour la sous-étape 3.1.9. et verser le surnageant dans un tube de polystyrène frais de 50 mL. Dégagez le surnageant à l’aide d’un filtre à membrane de 0,45 μm de diamètre de pore. Prélever un échantillon de « lysat » pour SDS-PAGE (voir rubrique 4. ci-dessous) ; cela correspond à la « fraction protéique soluble », le surnageant du sous-pas 3.1.6. Ajouter un volume égal de ddH2O tel que déterminé à la sous-étape 3.1.6. de remettre en suspension les débris cellulaires afin de maintenir la même dilution des échantillons pour une analyse ultérieure de la FDS-PAGE. Prélever un échantillon de « granulés » pour SDS-PAGE (voir rubrique 4. ci-dessous); cela correspond à la « fraction protéique insoluble », la suspension de débris cellulaires de la sous-étape 3.1.9. Purification par chromatographie d’affinité des métaux immobilisés (IMAC)REMARQUE: La purification de la protéine fluorescente cible peut être effectuée à 4 ° C ou à température ambiante (RT). Pour cette dernière option, attendez que le lysat, la colonne et tous les tampons s’équilibrent à RT pour éviter la formation de bulles d’air due à la vaporisation de l’air emprisonné dans la solution froide lors du placement dans une colonne chaude. Purifier l’échantillon à l’aide d’une colonne IMAC FPLC (chromatographie liquide rapide[ ou performance] préemballée ou auto-emballée de 1 mL conformément aux instructions du fabricant; régler la pression maximale de la colonne à 0,3 MPa et le débit à 1 mL/min; utiliser un tampon de liaison (voir Matériau supplémentaire) pour l’équilibrage des colonnes, un tampon de lavage (voir Matériau supplémentaire) pour l’étape de lavage et un tampon d’élution (voir Matériau supplémentaire) pour l’élution des protéines cibles.REMARQUE: Alternativement, un système FPLC automatisé peut être appliqué pour éluer la protéine cible avec un tampon d’élution exécutant un gradient de concentration linéaire d’imidazole (20-200 mM). Collectez et regroupez les fractions éluées avec des protéines fluorescentes (choisissez par couleur verte ou orange visible). Transférer les fractions regroupées dans une membrane de dialyse (coupure de poids moléculaire (MWCO) de 5 000 à 10 000) selon les instructions du fabricant et dialyser au moins trois fois contre un tampon de dialyse ou un tampon MS (voir Matériel supplémentaire). Par exemple, effectuer la dialyse d’un échantillon de 1 mL trois fois contre 100 mL de tampon pendant au moins 2 h chaque tour. Pour un protocole détaillé, reportez-vous à Budisa et al.34. Préparer une dilution de 1:100 fois de la fraction d’élution dialysée dans un tampon PBS (voir Matériel supplémentaire). Enregistrez le spectre d’absorbance des échantillons dilués dans un spectrophotomètre UV-Vis. Calculer la concentration en protéines sur la base de la loi de Lambert-Beer comme suit, en utilisant les valeurs de la littérature des coefficients d’extinction molaires ε à longueur d’onde spécifique (pour EGFP à 488 nm ε488 = 55 000 cm-1· M-1, NowGFP à 493 nm ε493 = 53 600 cm-1· M-1, KillerOrange à 514 nm ε514 = 22 600 cm-1· M-1) : (Loi Lambert-Beer)protéine c = concentration en protéines [mg/mL]A = absorbance à longueur d’onde spécifiqueε = coefficient d’extinction molaire à longueur d’onde spécifique [M-1·cm-1]d = longueur du chemin de la cuvette, ici 1 cmMW = poids moléculaire de la protéine [g/mol]Utilisez un tampon de dialyse (voir Matériel supplémentaire) pour la mesure de référence (« zéro »). Prélever un échantillon d’éluat pour SDS-PAGE (voir rubrique 4 ci-dessous), charge de 1 à 10 μg de protéines (calculée selon l’étape précédente) par échantillon de bien pour les gels coomassie Brilliant Blue.REMARQUE: Ajuster les quantités d’échantillonS SDS en fonction de la méthode de coloration appliquée et de la sensibilité du colorant si des composés différents de Coomassie Brilliant Blue sont utilisés pour la coloration de la bande protéique. Congeler et conserver l’échantillon de protéines dans un tampon de dialyse (voir Matériel supplémentaire) à -80 °C.REMARQUE: Dans ces conditions de stockage, les échantillons de protéines doivent être stables pendant au moins 6 mois. D’autres spectrophotomètres UV-Vis et de fluorescence de laboratoire peuvent être utilisés pour l’enregistrement des spectres d’absorption et d’émission de fluorescence des protéines cibles. Les longueurs d’onde d’excitation suivantes peuvent être appliquées pour les mesures d’émission de fluorescence : 488 nm (EGFP), 493 nm (NowGFP) et 510 nm (KillerOrange). 4. Préparation de l’échantillon SDS-PAGE Déterminer l’absorbance A à 280 nm (A280 nm) pour les échantillons « élucident », « lysat » et « pastille » de la section 3. Réglez le volume de la sonde pour obtenir A280nm = 2 en ajoutant une quantité appropriée de tampon d’élution (le volume final de la sonde doit être d’au moins 80 μL). Mélanger l’échantillon à un rapport de 4:1 (v/v) avec 5x tampon de colorant de chargement SDS (voir Matériau supplémentaire) par pipetage, par exemple, 80 μL de l’échantillon avec 20 μL de 5x tampon de chargement SDS. Faire bouillir les échantillons de FDS à 95 °C pendant 5 min au bain-marie ou en bloc chauffant pour dénaturer les protéines. Laissez les échantillons refroidir à RT et faites tourner les sondes à 13 000 x g pendant 1 min dans une microcentrifugeuse avant de les charger sur le gel. Utilisez 5-10 μL pour Coomassie Brilliant Blue-stained SDS-PAGE. Pour plus de détails sur la procédure SDS-PAGE, consultezle 57.REMARQUE: Ajustez les quantités d’échantillon de FDS en fonction de la méthode de coloration appliquée et de la sensibilité du colorant. Le résultat de la SDS-PAGE doit être soigneusement vérifié pour s’assurer que les échantillons contiennent plus de 95% de la protéine totale dans une bande correspondant au poids moléculaire attendu de la protéine souhaitée. Pour cela, prenez une photo du gel coloré de Coomassie et comparez l’intensité de la bande protéique de poids moléculaire souhaité avec l’intensité de toutes les autres bandes de la voie (le cas échéant) par densitométrie. Pour l’évaluation densitométrique des intensités de bande, le logiciel ImageJ peut être utilisé58. Pour prouver expérimentalement l’incorporation des ncAA souhaités dans la protéine d’intérêt, une analyse de masse protéique intacte par chromatographie liquide à haute performance (CLHP) couplée à la spectrométrie de masse à temps de vol par ionisation par électropulvérisation (LC-ESI-TOF-MS) doit être effectuée comme décrit59 (voir la section 5 du protocole et le tableau des matériaux pour l’équipement exemplaire). 5. Émission de fluorescence de variantes protéiques Avant la procédure, vérifiez le résultat de l’expérience SDS-PAGE pour vous assurer que la pureté de l’échantillon est >95 % (voir la NOTE après l’étape 4.5). Ajuster les échantillons de chaque variante de protéine purifiée à une concentration de 0,3 μM, en prenant la valeur d’absorbance calculée à la longueur d’onde appropriée comme référence (sous-étape 3.2.5.). Assurez-vous que le volume final approximatif de l’échantillon est de 200 μL. Laisser les échantillons dilués s’équilibrer pendant 1 h à TA. Transférer les échantillons dans une cuvette de quartz de 1 cm et mesurer un spectre d’émission de fluorescence des échantillons à l’aide d’un spectromètre de fluorescence (voir Tableau des matériaux) en appliquant les longueurs d’onde d’excitation suivantes : 488 nm (pour EGFP), 493 nm (pour NowGFP), 510 nm (pour KillerOrange). 6. Dénaturation et repliage des variantes egFP Avant la procédure, vérifiez le résultat de l’expérience SDS-PAGE pour vous assurer que la pureté de l’échantillon est >95 % (voir la NOTE après l’étape 4.5). Préparer pour chaque variante de protéine purifiée deux échantillons de 2 μL de volume final à une concentration de 300 μM (voir détermination de la concentration en protéines aux sous-étapes 3.2.4-3.2.6). Ajouter 18 μL de tampon PBS de 1,11x (voir Matériel supplémentaire) contenant 8,89 M d’urée et 5,56 mM de TNT à 2 μL de chaque variante de protéine purifiée (pour obtenir 1x PBS contenant 8 M d’urée et 5 mM de TNT) pour induire la dénaturation.REMARQUE : Pour les étapes 6.4 à 6.6, traitez chaque échantillon séparément. Incuber les échantillons pendant 5 min à 95 °C. Diluer les échantillons de 20 μL 100 fois en ajoutant 1980 μL de 1x PBS (voir Matériel supplémentaire) contenant 5 mM de TNT pour induire la renaturation, ce qui donne une concentration finale en protéines de 0,3 μM et transférer immédiatement 200 μL des échantillons dans une cuvette de quartz de 1 cm.REMARQUE: Il est très important de travailler rapidement ici car la renaturation commence immédiatement. Insérez la cuvette de quartz dans un spectromètre de fluorescence approprié (voir Tableau des matériaux) et surveillez le repliement des protéines dans les échantillons en acquérant un spectre de fluorescence toutes les 3 s pendant 30 minutes. Pour chaque variante de protéine, utilisez une excitation de fluorescence de 295 nm pour le premier échantillon et une excitation de fluorescence de 488 nm pour le second. Transférer les échantillons de repli dans des tubes de microcentrifugation de 1,5 mL, fermer le couvercle et stocker les échantillons à RT dans l’obscurité pendant 24 heures pour permettre le repliement complet des variantes EGFP. Mesurer l’émission de fluorescence d’échantillons de protéines repliés conformément à l’étape 6.6 en utilisant la même longueur d’onde d’excitation qu’auparavant pour capturer le point final temporel de la récupération de fluorescence.

Representative Results

Au début de l’étude, nous avons sélectionné trois variantes de protéines fluorescentes différentes partageant l’architecture GFP parente. La première protéine sélectionnée était l’EGFP, qui est une variante modifiée dérivée de la GFP originale de la méduse Aequorea victoria contenant des mutations Phe64Leu/Ser65Thr. La deuxième protéine sélectionnée était NowGFP 51,60. C’est aussi une variante de A. victoria GFP dérivée par mutagénèse en plusieurs étapes via les protéines fluorescentes précédentes. NowGFP contient 18 mutations par rapport à son prédécesseur immédiat, la protéine fluorescente « Cerulean”61. À son tour, la protéine « céruléenne » est un dérivé de la protéine fluorescente cyan améliorée (ECFP)62,63, une protéine précédemment sélectionnée par évolution dirigée en laboratoire et contenant un chromophore à base de tryptophane. EGFP et NowGFP sont largement utilisés dans la biologie cellulaire et les études biophysiques, et ils contiennent dix résidus de proline conservés dans leurs structures. En outre, NowGFP a un onzième résidu de proline à la position 230, qui est apparu en raison de l’histoire étendue de la mutation de cette variante de protéine. La troisième protéine sélectionnée était la protéine fluorescente KillerOrange64,65. C’est un dérivé de la chromoprotéine anm2CP du genre hydrozoaire Anthoathecata. La séquence protéique contient 15 résidus de proline, et le chromophore est basé sur un tryptophane plutôt que sur un résidu de tyrosine. Des structures de rayons X à haute résolution ont été rapportées pour les trois protéines sélectionnées (Figure 2)51,65,66. Dans la première étape, des analogues de la proline (figure 1D) ont été incorporés dans toutes les positions de la proline de trois protéines modèles (EGFP, NowGFP et KillerOrange) par incorporation sélective de pression (SPI, un schéma de la procédure est donné à la figure 3). Instrumentalement, la souche proline-auxotrophe E. coli K12 JM8367 a été utilisée pour l’expression des protéines en présence de proline et d’analogues (Figure 1D), produisant respectivement des protéines de type sauvage et modifiées. Les granulés de cellules exprimant la protéine native et les variantes portant S-Flp et Dhp avaient la couleur vive typique en raison du chromophore intact, tandis que les variantes contenant R-Flp et Dfp restaient incolores, indiquant un mauvais repliement et un dépôt de protéines dépliées dans les corps d’inclusion (Figure 4A). L’analyse SDS-PAGE des échantillons exprimés a permis de vérifier la présence de protéines insolubles contenant du R-Flp (figure 4B-D), ce qui a empêché d’autres investigations. Bien que cela dépasse le cadre de la présente étude, il convient de noter que les problèmes de solubilité des protéines et de mauvais repliement peuvent être atténués dans une certaine mesure par des procédures de repliement in vitro 68. En revanche, des protéines natives ainsi que des variantes porteuses de S-Flp et de Dhp ont été trouvées principalement dans les fractions solubles (figure 4B-D). Le type sauvage, ainsi que les variantes contenant du S-Flp et du Dhp, pourraient être isolés et caractérisés dans des études de fluorescence. Les protéines solubles ont été purifiées par chromatographie d’affinité ionique métallique immobilisée (IMAC), produisant 20 à 30 mg/L de volume de culture pour l’EGFP, 60 à 80 mg pour NowGFP et KillerOrange, dont les rendements pour les protéines de type sauvage et modifiées étaient très similaires. L’analyse couplée à la chromatographie liquide et à la spectrométrie de masse (LC-MS) a confirmé l’identité et la pureté attendues des isolats obtenus de cette manière (Figure 5). Dans les spectres de masse, chaque remplacement de proline par S-Flp produisait un décalage de +18 Da pour chaque résidu de proline de la séquence, tandis que pour le remplacement de la proline à Dhp, le décalage était de -2 Da par résidu. Dans l’étape suivante, des spectres d’absorption et d’émission de lumière ont été enregistrés pour analyser les effets potentiels de l’incorporation d’analogues de proline non canoniques sur les propriétés spectroscopiques des protéines fluorescentes parentes (Figure 6). Les spectres d’absorption UV-Vis ont montré une bande typique d’environ 280 nm caractéristique des résidus aromatiques, de la tyrosine et du tryptophane, tandis que l’absorbance du chromophore a été trouvée à 488 nm pour l’EGFP et à 493 nm pour nowGFP (Figure 6A, B). Dans KillerOrange, la région d’absorbance du chromophore comprenait deux bandes (Figure 6C), qui correspondent à deux états de configuration et de charge possibles du chromophore complexe. La bande autour de 510 nm est connue comme l’état à partir duquel la fluorescence se produit avec un rendement quantique élevéde 49,65. Dans les variantes de remplacement de la proline, les éléments suivants ont été observés: l’incorporation de Dhp n’a pas modifié les spectres d’absorbance de l’EGFP et du NowGFP, tandis que le S-Flp a produit une absorption UV améliorée. Ce dernier peut s’expliquer par des différences induites dans les microenvironnements de résidus de tryptophane, en particulier Trp57 pris en sandwich entre trois S-Flp dans le motif PVPWP (Figure 6A,B)69. Une explication plus triviale d’une absorption UV plus élevée, cependant, peut provenir d’une fraction accrue de protéines mal repliées. Étant donné que la concentration de la protéine a été évaluée par quantification des caractéristiques d’absorbance, la présence d’une protéine avec un chromophore mal mature peut augmenter l’absorbance, alors que cette fraction n’est pas comptée dans la concentration globale (Figure 6A,B). À l’appui de cette hypothèse, nous avons observé que l’EGFP contenant du S-Flp présentait un rapport nettement réduit de chromophore par rapport à l’absorbance combinée de tryptophane et de tyrosine (ε(CRO)/ε(Tyr+Trp) = 0,96) par rapport à une valeur plus élevée (1,57) dans la protéine mère (tableau 2)70. La présence d’une fraction non fluorescente dans l’EGFP contenant du S-Flp sera un facteur important contribuant à une analyse plus approfondie des propriétés de la protéine. Dans la variante KillerOrange contenant S-Flp, une absorbance améliorée parallèlement à un décalage vers le rouge dans la bande chromophore a été observée. Ce fait indiquait que la formation de chromophores favorisait une configuration avec un rendement quantique de fluorescence important (Figure 6C). Par la suite, nous avons analysé les spectres de fluorescence des protéines enregistrées lors de l’excitation aux longueurs d’onde d’absorbance maximales correspondantes. Les résultats montrent que les spectres sont restés essentiellement identiques pour les variantes de protéines fluorescentes examinées portant de la proline et des substituts, S-Flp et Dhp. Ce résultat implique que les analogues n’ont en aucun cas modifié l’environnement chimique du chromophore (Figure 6G-I). Malgré ce fait, des différences marquées ont été observées dans les spectres de fluorescence de KillerOrange enregistrés lors de l’excitation à 295 nm, donc lors de l’excitation du tryptophane. Cette expérience suit le transfert d’énergie par résonance de fluorescence (FRET) ou le couplage excitonique direct qui se produit entre les chaînes latérales du tryptophane et le chromophore mature, car les deux sont situés à une courte distance ne dépassant pas 25 Å. Pour les variantes EGFP et NowGFP, lorsque les spectres d’émission ont été mesurés à l’aide d’une excitation de 295 nm, une forte émission de chromophore a été observée parallèlement à pratiquement aucune émission de tryptophane (Figure 6D, E). Cependant, les variantes contenant du S-Flp présentaient une émission spécifique de tryptophane légèrement plus importante. Cette observation peut être liée à une contribution incalculable de l’apoprotéine dépliée qui contient des tryptophanes mais pas du chromophore mature. Une augmentation substantielle de l’émission spécifique de tryptophane a été observée dans KillerOrange, indiquant un manque de trempe par fluorescence via le mécanisme attendu de transfert d’énergie d’excitation ou de couplage excitonique. Les variantes protéiques contenant de la proline et du S-Flp présentaient une émission de tryptophane comparable ainsi que la caractéristique de fluorescence préférée décalée vers le rouge d’un rendement quantique élevé. En revanche, la variante qui contenait du Dhp a montré une diminution drastique de l’intensité de fluorescence des chromophores, probablement en raison d’effets structurels mineurs (Figure 6F). Ensuite, nous avons comparé les propriétés de repliement des protéines en effectuant une expérience de dépliage / renaturation. Les spectres d’émission de fluorescence ont été enregistrés à l’état plié (section 5 du protocole), après dénaturation chimique et, par la suite, en cours de repliement surveillés sur une période de 24 h (section 6 du protocole). Les spectres ont été enregistrés lors de l’excitation aux deux longueurs d’onde pertinentes, 295 nm, et aux maxima des spectres d’absorbance des chromophores, tandis que la fluorescence résultante est présentée comme normalisée à la valeur maximale pour chaque protéine (Figure 7). À la fin du protocole, nous avons observé que les variantes EGFP pouvaient se replier, tandis que les variantes NowGFP et KillerOrange – une fois dénaturées – restaient dépliées (données non montrées). Ainsi, les capacités de repliement des protéines de fluorescence d’origine variaient considérablement. Il convient de noter que KillerOrange a été développé en tant que photosensibilisant à partir de la variante de chromoprotéine hydrozoaire KillerRed65,71, et son repliement est généralement à la traîne malgré la structure robuste du canon β. Dans nos expériences, nous avons constaté que la fluorescence du chromophore EGFP de type sauvage ne s’est rétablie que partiellement, bien que la fluorescence spécifique au tryptophane soit plus grande après renaturation (Figure 7A, D). Un comportement essentiellement similaire a été observé dans la variante contenant Dhp (Figure 7C,F). Dans l’EGFP contenant du S-Flp, un résultat similaire a été observé lorsque l’excitation a été effectuée à la longueur d’onde spécifique du tryptophane de 295 nm (figure 7B). Fait frappant, la fluorescence s’est rétablie à une étendue beaucoup plus élevée lorsque le chromophore a été excité à 488 nm (Figure 7E). Il semble que S-Flp induise un bien meilleur rendement de repliement par rapport aux deux autres variantes. Cependant, cet effet bénéfique n’a pas été observé lors de l’utilisation d’une excitation de 295 nm en raison d’interactions moléculaires inconnues. Par la suite, la vitesse de repliement a été surveillée en enregistrant séparément la fluorescence du tryptophane et du chromophore, tandis que l’extrémité du processus a été déterminée 24 heures après le début de la renaturation. Seules les variantes EGFP ont montré une cinétique de repliement relativement rapide qui pouvait être évaluée de manière fiable, tandis qu’aucune des variantes dénaturées nowGFP et KillerOrange n’a pu retrouver une valeur permettant d’autres mesures quantitatives. Dans l’EGFP, la récupération des émissions de tryptophane a été deux fois plus rapide (achevée en 750 s) que la récupération de l’émission de chromophores (achevée en 1 500 s), ce qui indique la complexité des processus sous-jacents (Figure 8). Aux deux longueurs d’onde d’excitation, le taux de repliement a été élevé par la présence de S-Flp, en accord avec les données de la littérature25. Dans le même temps, la variante contenant du Dhp présentait un profil de repliement similaire au type sauvage. Figure 1 : Échafaudage structurel de la protéine fluorescente verte (GFP), construction de chromophores, transitions conformationnelles de la proline et analogues synthétiques utilisés dans cette étude. (A) La structure du GFP consiste en des brins β formant un canon presque parfait (c’est-à-dire une « canette » de dimensions 4,2 nm x 2,4 nm) qui est coiffé aux deux extrémités par des couvercles α hélicoïdaux. La protéine GFP de 27 kDa montre une structure tertiaire composée de onze brins β, de deux hélices courtes α et du chromophore au milieu. Les états conformationnels des prolines adjacentes sont liés à la formation de chromophores. (B) La maturation autocatalytique (condensation) du chromophore se produit au niveau des résidus Ser65, Tyr66 et Gly67, et se déroule en plusieurs étapes: Premièrement, des ajustements de torsion dans l’épine dorsale polypeptidique pour amener le carbone carboxyle de Thr65 à proximité de l’azote amide de Gly67. Ensuite, la formation d’un système hétérocyclique imidazoline-5-one se produit lors de l’attaque nucléophile de cet atome de carbone par l’azote amide de la glycine et de la déshydratation ultérieure. Enfin, le système gagne en fluorescence visible lorsque l’oxydation de la liaison carbone tyrosine alpha-bêta par l’oxygène moléculaire conduit à l’extension du système conjugué du système de cycle imidazoline, à la fin comprenant le cycle tyrosine phényle et son substituant para-oxygène. Le chromophore para-hydroxybenzylidène imidazolinone qui en résulte au centre du baril β est complètement séparé du solvant en vrac. (C) Les formules et géométries de la structure squelettique de 1) l’anneau proline (rondelles) et 2) la liaison amide précédente représentent les principales transitions conformationnelles du résidu de proline. (D) Les analogues de la proline utilisés dans ce travail avec les rondelles d’anneau de proline désignées. La figure a été générée à l’aide de ChemDraw et de Discovery Studio Visualizer. La structure GFP provient de l’entrée de structure PDB 2Q6P. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 2 : Protéines fluorescentes utilisées dans cette étude. Les panneaux montrent la représentation en ruban des structures typiques β baril de trois variantes différentes de protéines fluorescentes: EGFP, NowGFP et KillerOrange, avec la couleur du ruban représentant la couleur d’émission de fluorescence de chaque variante. Les résidus de proline (code d’une lettre) sont mis en évidence sous forme de bâtons et les positions appropriées sont annotées. Les chromophores sont représentés avec la composition initiale en acides aminés en gras. Toutes les représentations de structure ont été produites avec PyMol sur la base des entrées de structure PDB suivantes : 2Q6P pour EGFP, 4RYS pour NowGFP, 4ZFS pour KillerOrange. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 3 : Présentation de l’organigramme de la méthode SPI pour l’incorporation spécifique aux résidus d’analogues de proline non canoniques. Une souche hôte proline-auxotrophe Escherichia coli (E. coli) portant le gène d’intérêt sur un plasmide d’expression est cultivée dans un milieu minimal défini avec les 20 acides aminés canoniques jusqu’à ce qu’un OD600 d’environ 0,7 soit atteint auquel la culture cellulaire est dans la phase de croissance mi-logarithmique. Les cellules sont récoltées et transférées dans un milieu frais minimal contenant 19 acides aminés canoniques et un analogue de la proline. Après l’ajout d’un inducteur, l’expression des protéines est effectuée pendant la nuit. Enfin, la protéine cible est isolée par lyse cellulaire et purifiée avant une analyse plus approfondie. Dans une variante du protocole, les cellules sont cultivées dans un milieu minimal défini avec 19 acides aminés canoniques, et la proline est ajoutée en quantité limitée (par exemple, un cinquième de la concentration des autres acides aminés). Par cette mesure, les cellules épuisent la proline dans le milieu avant de pouvoir sortir de la phase de croissance logarithmique, puis, par la suite, l’analogue est ajouté et la production de protéines d’intérêt est induite. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 4 : Analyse d’expression des variantes EGFP, NowGFP et KillerOrange. (A) Pastilles cellulaires de 1 mL de culture d’expression, normalisées à OD600 = 2. Analyse SDS-PAGE des variantes (B) EGFP, (C) NowGFP et (D) KillerOrange. Les fractions solubles (S) et insolubles (I) de chaque dérivé de protéine fluorescente ont été chargées sur du gel d’acrylamide à 15 %, ainsi que sur des fractions éluées (E) de protéines solubles de l’IMAC. PageRuler Unstained Protein Ladder a été utilisé comme marqueur (M) dans les voies désignées par (M). Les régions attendues de la protéine particulière sont encadrées. Les acides aminés incorporés aux positions de la proline sont Pro, R-Flp, S-Flp et Dhp (dans les pastilles de cellules (A) à partir de variantes de protéines fluorescentes incorporant Dfp au lieu de Dhp sont montrés). Les gels ont été colorés de 1% (p / v) Coomassie Brillant Blue. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 5 : Analyse spectrométrique de masse des variantes de protéines fluorescentes. (A) Spectres ESI-MS déconvolus représentatifs de l’EGFP marqué H6 (noir), du S-Flp-EGFP (orange) et du Dhp-EGFP (cyan), l’emplacement des principaux pics massiques étant fourni sous forme de nombres (en Da). Les masses moléculaires calculées [M+H]+ des protéines marquées H6 sont les suivantes : pour l’EGFP 27 745,33 Da (observé 27 746,15 Da) ; pour S-Flp-EGFP 27 925,33 Da (observé 27 925,73 Da); pour Dhp-EGFP 27 725,33 Da (observé 27 726,01 Da). (B) Spectres ESI-MS déconvolu représentatifs de NowGFP marqués H6 (noir), S-Flp-NowGFP (orange) et Dhp-NowGFP (cyan) avec l’emplacement des principaux pics de masse fournis sous forme de nombres (en Da). Les masses calculées des protéines marquées H6 sont les suivantes: Pour l’instantGFP 27 931,50 Da (observé 27 946,46 Da; la différence de ~ 16 Da est probablement due à l’oxydation d’une méthionine dans la protéine); pour S-Flp-NowGFP 28 129,50 Da (observé 28 130,08 Da); pour Dhp-NowGFP 27 909,50 Da (observé 27 910,22 Da). (C) Spectres ESI-MS déconvolu représentatifs de KillerOrange marqués H6 (noir), S-Flp-KillerOrange (orange) et Dhp-KillerOrange (cyan) avec l’emplacement des principaux pics de masse fournis sous forme de nombres (en Da). Les masses calculées des protéines marquées H6 sont les suivantes : pour KillerOrange 27 606,09 Da (observées 27 605,91 Da) ; pour S-Flp-KillerOrange 27 876,09 Da (observé 27 876,08 Da); pour Dhp-KillerOrange 27 576,09 Da (observé 27 575,93 Da). Les écarts entre les masses moléculaires observées et calculées d’environ 1 Da se situent dans la plage d’erreur de l’équipement ESI-MS. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 6 : Spectres d’absorption de la lumière et d’émission de fluorescence des variantes de protéines fluorescentes. Les spectres d’absorption UV-Vis normalisés sont montrés pour les variantes (A) de l’EGFP, (B) de NowGFP et (C) de KillerOrange. Les spectres ont été normalisés au maximum de l’absorbance des chromophores (environ 500 nm). Des spectres d’émission de fluorescence normalisés sont montrés des variantes (D,G) de l’EGFP, (E,H) de NowGFP et (F,I) de KillerOrange. Les spectres dans (D,E,F) ont été mesurés lors de l’excitation avec la lumière ultraviolette (295 nm), pour les spectres en (G,H,I) 488 nm, 493 nm et 510 nm de lumière ont été utilisés pour l’excitation, respectivement, et les spectres ont été normalisés aux maxima respectifs de l’émission de chromophores (environ 500 nm). Dans chaque panneau, les courbes noires correspondent aux spectres de la variante de protéine fluorescente avec la proline native, les courbes orange indiquent les spectres des protéines substituées par S-Flp et les courbes bleues correspondent aux protéines substituées par Dhp. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 7 : Spectres d’émission de fluorescence des variantes de l’EGFP dans les expériences de repliement. Spectres d’émission de fluorescence normalisés de solutions de 0,3 μM de variantes de protéines fluorescentes à l’état natif et après dénaturation et repliement: Les spectres en (A, B, C) ont été mesurés lors de l’excitation avec la lumière ultraviolette (295 nm) (A) pour EGFP, (B) pour S-Flp-EGFP et (C) pour Dhp-EGFP. Les spectres en (D,E,F) ont été mesurés lors de l’excitation avec une lumière verte (488 nm) (D) pour EFGP, (E) pour S-Flp-EGFP et (F) pour Dhp-EGFP. Les spectres d’émission des échantillons natifs (courbes noires) et repliés (vert correspond à EGFP, orange à S-Flp-EGFP et bleu à Dhp-EGFP, respectivement) de chaque variante de protéine sont normalisés à la fluorescence maximale de l’état natif approprié. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 8 : Surveillance du repliement des protéines et de la maturation des chromophores des variantes de l’EGFP avec fluorescence. (A) Émission de fluorescence dans la région de fluorescence Trp (l’émission a été réglée à 330 nm) enregistrée lors de l’excitation avec la lumière ultraviolette (295 nm). (B) Développement de l’amplitude de fluorescence dans la région de l’émission de chromophores lors de l’excitation à la lumière verte (488 nm). Les traces de fluorescence dépendantes du temps ont été normalisées à l’unité (100%) en fonction de l’amplitude de fluorescence atteinte à la fin de l’intervalle de surveillance. Dans chaque panneau, les courbes noires correspondent aux spectres de la variante de protéine fluorescente avec la proline native, les courbes orange indiquent les spectres des protéines substituées par S-Flp et les courbes bleues correspondent aux protéines substituées par Dhp. Veuillez cliquer ici pour voir une version agrandie de cette figure. Construire Séquences d’acides aminés (balise 6xHis soulignée) : EGFP-H6 MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKHHHHHH H6-NowGFP MRGSHHQHHHGSVSKGEKLFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKMSLKFICTTGKLPVPWPTLKTTLTWGMQCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGVDFKEDGNILGHKLEYNAISGNANITADKQKNGIKAYFTIRHDVEDGSVLLADHYQQNTPIGDGPVLLPDNHYLSTQSKQSKDPNEKRDHMVLLEFVTAAGIPLGADELYK H6-KillerOrange MRGSHHHHHHGSECGPALFQSDMTFKIFIDGEVNGQKFTIVADGSSKFPHGDFNVHAVCETGKLPMSWKPICHLIQWGEPFFARYPDGISHFAQECFPEGLSIDRTVRFENDGTMTSHHTYELSDTCVVSRITVNCDGFQPDGPIMRDQLVDILPSETHMFPHGPNAVRQLAFIGFTTADGGLMMGHLDSKMTFNGSRAIEIPGPHFVTIITKQMRDTSDKRDHVCQREVAHAHSVPRITSAIGSDQD Tableau 1 : Structures primaires des protéines cibles. Ses balises sont soulignées dans chaque séquence. λ [nm] ε [M-1·cm-1] (EGFP) ε [M-1·cm-1] (S-Flp-EGFP) ε [M-1·cm-1] (Dhp-EGFP) 488 (≡ CRO) 31 657 (± 1 341) 22 950 (± 290) 27 800 (± 542) 280 (≡ Tyr+Trp) 20 116 (± 172) 23 800 (± 715) 17 300 (± 554) Les valeurs du coefficient d’extinction ε (en M-1·cm-1) sont calculées à partir des spectres d’absorption UV-Vis enregistrés des variantes appropriées de l’EGFP en utilisant des concentrations de protéines connues. La longueur d’onde sélectionnée à 280 nm correspond à l’absorbance maximale des résidus aromatiques, de la tyrosine et du tryptophane, et 488 nm représente la longueur d’onde d’absorbance du chromophore. Tableau 2 : Coefficients d’extinction (ε) des variantes de l’EGFP à des longueurs d’onde sélectionnées. Les valeurs du coefficient d’extinction ε (en M-1·cm-1) sont calculées à partir des spectres d’absorption UV-Vis enregistrés des variantes APPROPRIÉES de l’EGFP en utilisant les concentrations de protéines connues. La longueur d’onde sélectionnée de 280 nm correspond à l’absorbance maximale des résidus aromatiques, de la tyrosine et du tryptophane, tandis que 488 nm représente la longueur d’onde maximale d’absorbance du chromophore. Matériel supplémentaire: Préparation des solutions de stock et des tampons Veuillez cliquer ici pour télécharger ce fichier.

Discussion

Dans la nature, les manipulations avec les structures et les fonctions des protéines se produisent généralement en raison de mutations, le phénomène qui conduit à un échange d’une identité d’acide aminé à certaines positions de la séquence protéique. Ce mécanisme naturel est largement appliqué en tant que méthode biotechnologique pour l’ingénierie des protéines sous forme de mutagénèse, et il repose sur le répertoire des 20 acides aminés canoniques impliqués dans le processus. L’échange de résidus de proline est cependant problématique. En raison de son architecture de groupe dorsal spéciale, il est difficilement interchangeable avec les 19 résidus restants pour le remplacementde 72. Par exemple, la proline est généralement connue comme un briseur de structure secondaire dans les séquences polypeptidiques en raison de sa faible compatibilité avec les structures secondaires les plus courantes, c’est-à-dire α hélice et β brin. Cette caractéristique de la proline est facilement perdue lorsque le résidu est muté en un autre acide aminé du répertoire commun. Le remplacement de la proline par ses analogues chimiques offre une approche alternative, qui permet de conserver les caractéristiques de base du résidu de proline parent tout en imposant un biais sur ses transitions conformationnelles spécifiques ou en produisant des modulations du volume moléculaire et de la polarité. Par exemple, il est possible de fournir des cultures bactériennes avec des structures analogiques telles que l’hydroxy-, fluoro-, alkyl-, les déshydroprolines, des structures ayant des tailles d’anneaux variables et plus encore, facilitant ainsi la production d’une protéine contenant des altérations spécifiques des résidus de proline.

La méthode d’incorporation sélective sous pression (SPI) décrite dans cette étude permet un remplacement global, c’est-à-dire spécifique aux résidus, de toutes les prolines de la protéine cible par des analogues chimiques apparentés. L’importance de la méthode se reflète dans le fait que SPI permet de créer des changements de séquence inaccessibles aux techniques de mutagénèse courantes. Par exemple, il permet la production d’une protéine cible contenant des changements structurels plutôt faibles qui ne peuvent généralement pas dépasser un ou deux remplacements/délétions/ajouts d’atomes, comme l’a démontré cette étude. De telles modifications protéiques sont appelées « mutations atomiques »73,74. Dans une protéine fluorescente telle que la GFP, le résultat de cette intrusion moléculaire peut être vu dans la vitesse de repliement, les polarités locales, l’emballage des protéines, la stabilité des caractéristiques structurelles impliquées. Les changements dans les propriétés d’absorbance et de fluorescence sont produits indirectement en raison de l’impact sur le repliement des protéines et les microenvironnements résiduels. La précision des changements moléculaires effectués par SPI est généralement beaucoup plus élevée, par rapport aux mutations des prolines à d’autres résidus canoniques, ces derniers étant généralement préjudiciables au repliement, à la production et à l’isolement des protéines.

En tant que méthode de production, l’approche SPI utilise la tolérance du substrat de la poche aminoacyl-ARNt synthétase vis-à-vis des analogues chimiques de l’acide aminé natif. La synthétase est responsable de l’identification correcte de la structure des acides aminés, tandis que l’incorporation dans les protéines se produit en aval dans le processus de traduction. Instrumentalement, la production, l’isolement et la purification des protéines dans SPI sont effectués d’une manière typique de toute autre technique d’expression des protéines recombinantes; cependant, avec quelques ajouts au protocole comme suit: Proline, qui est destiné au remplacement, est fourni au début du processus de fermentation, de sorte que les cellules peuvent croître et développer leur machinerie cellulaire intacte. Cependant, la culture cellulaire n’est pas autorisée à atteindre la densité optique maximale, pour maintenir les cellules dans la phase logarithmique optimale pour l’expression des protéines. Il existe deux variantes majeures de la méthode SPI à ce stade. Dans le premier, la concentration de proline est ajustée dans le milieu de croissance initial (un milieu chimiquement défini) de sorte que l’épuisement de la proline se produit sans aucune intrusion externe. Les cellules épuisent la proline dans le milieu avant de pouvoir sortir de la phase de croissance logarithmique, puis, par la suite, l’analogue est ajouté et la protéine d’intérêt est induite. Dans la deuxième version de la méthode, les cellules sont cultivées dans le milieu contenant de la proline jusqu’au milieu de leur phase logarithmique. À ce stade, les cellules doivent être retirées et physiquement transférées dans un autre milieu, qui ne contient plus de proline, seulement l’analogue, avec induction ultérieure de la protéine d’intérêt. Dans les deux versions, l’analogue et le réactif d’induction des protéines sont fournis aux cellules pré-cultivées. L’isolement et la purification de la protéine de type sauvage sont effectués de la même manière que pour les variantes. En principe, chaque souche pro-auxotrophique disponible peut être utilisée comme hôte d’expression. Néanmoins, des tests d’expression pour identifier l’hôte le plus approprié sont conseillés. En outre, des tests de différents milieux chimiquement définis peuvent être utilisés pour optimiser le rendement en protéines.

Certaines exigences concernant les analogues chimiques doivent être prises en compte pour l’IPS, telles que la solubilité et la concentration. La disponibilité métabolique et l’absorption des acides aminés dépendent du nombre de molécules dissoutes dans le milieu. Pour augmenter la solubilité d’un composé particulier, des conditions légèrement acides ou alcalines peuvent être choisies. Étant donné que les molécules artificielles peuvent provoquer des effets inhibiteurs de croissance en raison de leur toxicité cellulaire, la concentration doit être réduite au minimum afin d’éviter le stress cellulaire75.

Une faiblesse mineure de SPI est la diminution de l’efficacité de l’incorporation avec un plus grand nombre de positions qui doivent être échangées. En principe, une réduction de la fréquence des acides aminés dans la biomolécule cible par mutagénèse dirigée par le site peut résoudre ce problème. Cependant, les propriétés structurelles et fonctionnelles d’une protéine désirée peuvent être affectées par la modification de la structure primaire.

Comme mentionné précédemment, SPI permet le remplacement spécifique des résidus de l’acide aminé canonique. Cela implique que les acides aminés non canoniques sont insérés dans toutes les positions de l’acide aminé canonique dans la protéine cible, y compris les résidus conservés qui sont indispensables au fonctionnement ou au repliement des protéines. D’autres méthodes d’incorporation spécifique au site sont la seule possibilité de surmonter ce problème3. Au cours des dernières décennies, la méthode des paires orthogonales a été développée pour produire des protéines contenant des résidus modifiés sur des sites prédéfinis. La modification la plus courante de cette méthode est connue sous le nom de suppression du codon stop. Cette méthode est basée sur un système de traduction orthogonale conçu dédié à l’incorporation spécifique au site d’acides aminés synthétiques76. Plus de 200 acides aminés avec différentes modifications de la chaîne latérale ont été incorporés dans les protéines à ce jour en utilisant cette approche77. Cependant, ces systèmes de traduction ne conviennent toujours pas aux insertions d’analogues de la proline dans les protéines cibles. En outre, les performances de la méthode sont considérées comme faibles dans le cas de modifications mineures des acides aminés, car une certaine promiscuité de fond de l’aminoacyl-ARNt synthétase reste généralement dans les systèmes de traduction modifiés.

En utilisant SPI, nous avons produit un certain nombre de variantes de protéines fluorescentes à baril β et étudié les résultats de l’échange de proline avec ses analogues non naturels. Dans le cas du remplacement de la proline par R-Flp et Dfp, une protéine dysfonctionnelle a été produite par l’hôte d’expression. L’effet est probablement produit par un mauvais repliement des protéines. Ce dernier peut provenir de la conformationC4-exo favorisée par R-Flp, qui est défavorable aux structures protéiquesmères 27. Avec Dfp, le mauvais repliement est susceptible d’être produit par la diminution de la vitesse de l’isomérisation de la liaison peptidique trans-cis au niveau du résidu de proline27. Ce dernier est connu pour être parmi les étapes limitantes dans le profil cinétique du repliement des protéines qui affecte la formation de β-baril et la maturation ultérieure du chromophore. En effet, pour les deux acides aminés, R-Flp et Dfp, la production de protéines a abouti à une protéine agrégée et insoluble. Par conséquent, la formation de chromophores n’a pas pu se produire et la fluorescence a été entièrement perdue. Avec S-Flp et Dhp, cependant, une maturation appropriée des protéines a été observée, ce qui a donné des échantillons de protéines fluorescentes pour chaque combinaison analogique/ protéine. Malgré certaines modulations dans les caractéristiques d’absorbance et de fluorescence de la protéine, celles-ci sont restées en grande partie similaires à celles des protéines de type sauvage. L’effet de la substitution des acides aminés a été révélé dans les études cinétiques de repliement. Ce dernier a montré un repliement plus rapide en cas de remplacement par S-Flp. Des études sur des modèles ont montré que ce résidu peut générer une certaine amélioration de la vitesse de rotation de l’amide trans-à-cis et conduire à la formation de la conformationC4-endo. Ces deux facteurs sont susceptibles de contribuer aux effets cinétiques bénéfiques de ce résidu dans l’EGFP. En revanche, Dhp a produit des profils de repliement cinétiques au maximum similaires à la protéine mère. La diversité des résultats produits par de simples mutations atomiques dans les protéines fluorescentes examinées illustre le potentiel de la méthode de production SPI dans la modification des propriétés des protéines cibles. Les altérations protéiques induites par le remplacement de la proline par les analogues ont d’autres implications dans l’ingénierie des enzymes 78,79,80 et des canaux ioniques 81,82, ainsi que dans l’ingénierie générale de la stabilité des protéines.

La limitation de base de la méthode SPI est son mode « tout ou rien » dans l’échange de proline réside avec des analogues connexes. Il serait très avantageux de pouvoir sélectionner avec précision quels résidus de proline devraient être remplacés par les analogues et lesquels devraient rester inchangés. Cependant, à l’heure actuelle, il n’existe aucune technique qui pourrait effectuer une production aussi sophistiquée en utilisant un hôte de production microbien. La synthèse chimique des protéines83,84, ainsi que la production sans cellules85,86, sont les deux méthodes alternatives qui peuvent produire des modifications de proline spécifiques à la position. Néanmoins, leur complexité opérationnelle et leurs faibles rendements de production les rendent inférieurs à la production dans les cellules vivantes. À l’heure actuelle, SPI reste l’approche la plus simple et la plus robuste sur le plan opérationnel pour la production de protéines complexes porteuses de mutations atomiques. En introduisant des substituts d’acides aminés non naturels, la méthode permet de modifier les caractéristiques des protéines de manière ciblée, comme en témoignent les altérations du repliement et de l’absorption / émission de lumière des protéines fluorescentes générées par les substituts de la proline.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été soutenu par la Fondation allemande pour la recherche (Cluster of Excellence « Unifying Systems in Catalysis ») à T.F. et N.B. et par le ministère fédéral de l’Éducation et des Sciences (BMBF Program « HSP 2020 », TU-WIMIplus Project SynTUBio) à F.-J.S. et T.M.T.T.

Materials

Acetonitrile VWR HiPerSolv CHROMANORM ULTRA for LC-MS, 83642 LC-MS grade required
Acrylamide and bisacrylamide aqueous stock solution at a ratio of 37.5:1 (ROTIPHORESE Gel 30) Carl Roth 3029.1
Agar-agar Carl Roth 5210
Ammonium molybdate ((NH4)2MoO4) Sigma-Aldrich 277908
Ammonium peroxydisulphate (APS) Carl Roth 9592.2 ≥98 %, p.a., ACS grade required
Ammonium sulfate ((NH4)2SO4) Sigma-Aldrich A4418
Ampicillin sodium salt Carl Roth K029
Biotin Sigma-Aldrich B4501
Bromophenol blue Sigma-Aldrich B0126
Calcium chloride (CaCl2) Sigma-Aldrich C5670
Coomassie Brillant Blue R 250 Carl Roth 3862
Copper sulfate (CuSO4) Carl Roth CP86.1
D-glucose Carl Roth 6780
1,2-Bis-(dimethylamino)-ethane, N,N,N',N'-Tetramethylethylenediamine (TEMED) Carl Roth 2367.3 ≥99 %, p.a., for electrophoresis
1,4-dithiothreitol (DTT) Carl Roth 6908
Dichloromethane (DCM) Sigma-Aldrich 270997
di-potassium hydrogen phosphate (K2HPO4) Carl Roth P749.1
di-sodium hydrogen phosphate (Na2HPO4) Carl Roth X987
DNase I Sigma-Aldrich D5025
Dowex 50WX8-100 (hydrogen form) Acros Organics / Thermo Fisher Scientific (Waltham, U.S.A.) 10731181 cation exchange resin
Ethanol Carl Roth 9065.1
Formic acid VWR HiPerSolv CHROMANORM for LC-MS, 84865 LC-MS grade required
Glacial acetic acid Carl Roth 3738.5 100 %, p. a.
Glycerol Carl Roth 3783
Imidazole Carl Roth X998
Hydrogen chlroide (HCl) Merck 295426
Iron(II) chloride (FeCl2) Sigma-Aldrich 380024
Isopropanol Carl Roth AE73.1
Isopropyl β-D-1-thiogalactopyranoside (IPTG) Sigma-Aldrich I6758
Lysozyme Sigma-Aldrich L6876
Magnesium chloride (MgCl2) Carl Roth KK36.1
Magnesium sulfate (MgSO4) Carl Roth 8283.2
Manganese chloride (MnCl2) Sigma-Aldrich 63535
β-mercaptoethanol Carl Roth 4227.3
PageRuler Unstained Protein Ladder Thermo Fisher Scientific 26614
Potassium chloride (KCl) Carl Roth 6781.3
Potassium dihydrogen phosphate (KH2PO4) Sigma-Aldrich P5655
RNase A Carl Roth 7156
Sodium chloride (NaCl) Carl Roth P029
Sodium dihydrogen phosphate (NaH2PO4) Carl Roth T879
Sodium dodecyl sulphate (NaC12H25SO4) Carl Roth 0183
Thiamine Sigma-Aldrich T4625
Trifluoroacetic acid (TFA) Sigma-Aldrich T6508
Tris hydrochloride (Tris-HCl) Sigma-Aldrich 857645
Tris(hydroxymethyl)-aminomethane (Tris) Carl Roth 5429
Tryptone Carl Roth 8952
Yeast extract Carl Roth 2363
Zinc chloride (ZnCl2) Sigma-Aldrich 229997
L-alanine Sigma-Aldrich A7627
L-arginine Sigma-Aldrich A5006
L-asparagine Sigma-Aldrich A8381
L-aspartic acid Sigma-Aldrich A0884
L-cysteine Sigma-Aldrich C7352
L-glutamic acid Sigma-Aldrich G2128
L-glutamine Sigma-Aldrich G3126
L-glycine Sigma-Aldrich G7126
L-histidine Sigma-Aldrich H8000
L-isoleucine Sigma-Aldrich I2752
L-leucine Sigma-Aldrich L8000
L-lysine Sigma-Aldrich L5501
L-methionine Sigma-Aldrich M9625
L-phenylalanine Sigma-Aldrich P2126
L-proline Sigma-Aldrich P0380
L-serine Sigma-Aldrich S4500
L-threonine Sigma-Aldrich T8625
L-tryptophan Sigma-Aldrich T0254
L-tyrosine Sigma-Aldrich T3754
L-valine Sigma-Aldrich V0500
(4S)-fluoroproline Bachem 4033274 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression.
(4R)-fluoroproline Bachem 4033275 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression
3,4-dehydroproline Bachem 4003545 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression
4,4-difluoroproline Enamine EN400-17448 Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression
Conical polystyrene (Falcon) tubes, 15 mL Fisher Scientific 14-959-49B
Conical polystyrene (Falcon) tubes, 50 mL Fisher Scientific 14-432-22
Dialysis membrane, Molecular Weight Cut-Off (MWCO) 5,000 Spectrum Medical Industries Spectra/Por MWCO 5000 dialysis membrane, 133198
Immobilized Metal ion Affinity Chromatography (IMAC) column 1 mL, Ni-NTA GE Healthcare HisTrap HP, 1 mL, 17-5247-01
Luer-Lock syringe, 5 mL Carl Roth EP96.1
Luer-Lock syringe, 20 mL Carl Roth T550.1
Luer-Lock syringe, 50 mL Carl Roth T552.1
Microcentrifuge tubes, 1.5 mL Eppendorf 30120086
Petri dishes (polystyrene, sterile) Carl Roth TA19
pQE-80L plasmid vector Qiagen no longer available replaced by N-terminus pQE Vector set Cat No./ID: 32915
Pro-auxotrophic E. coli strain JM83 Addgene 50348 https://www.addgene.org/50348/
Pro-auxotrophic E. coli strain JM83 ATCC 35607
Round-bottom polystyrene tubes, 14 mL Fisher Scientific Corning Falcon, 14-959-1B
Syringe filter 0.45 µm with polyvinylidene difluoride (PVDF) membrane Carl Roth CCY1.1
High-Performance Liquid Chromatography (HPLC) column for LC-ESI-TOF-MS Sigma-Aldrich Supelco Discovery BIO Wide Pore C5 HPLC column, 3 µm particle size, 10 cm x 2.1 mm with conical 0.1 mL glass inserts, screw caps and septa
HPLC autosampler vials 1.5 mL Sigma-Aldrich Supelco 854165
Mass spectrometer for LC-ESI-TOF-MS Agilent Agilent 6530 Accurate-Mass QTOF
Mass spectrometry data analysis software Agilent MassHunter Qualitative Analysis software v. B.06.00
Benchtop centrifuge for 1.5 mL Eppendorf tubes Eppendorf 5427 R
Cooling centrifuge for 50 mL Falcon tubes Eppendorf 5810 R
Fast Protein Liquid Chromatography (FPLC) system GE Healthcare ÄKTA pure 25 L
Fluorescence spectrometer Perkin Elmer LS 55
High pressure microfluidizer for bacterial cell disruption Microfluidics LM series with “Z” type chamber
Orbital shaker for bacterial cultivation Infors HT Minitron
Peristaltic pump for liquid chromatography (LC) GE Healthcare P-1
Ultrasonic homogenizer for bacterial cell disruption Omnilab Bandelin SONOPULS HD 3200, 5650182 with MS72 sonifier tip
UV-Vis spectrophotometer Biochrom ULTROSPEC 2100
UV-Vis/NIR spectrophotometer Perkin Elmer LAMBDA 950 UV/Vis/NIR

References

  1. Agostini, F., Völler, J. -. S., Koksch, B., Acevedo-Rocha, C. G., Kubyshkin, V., Budisa, N. Biocatalysis with unnatural amino acids: Enzymology meets xenobiology. Angewandte Chemie (International ed. In English). 56 (33), 9680-9703 (2017).
  2. Minks, C., Alefelder, S., Moroder, L., Huber, R., Budisa, N. Towards new protein engineering: In vivo building and folding of protein shuttles for drug delivery and targeting by the selective pressure incorporation (SPI) method. Tetrahedron. 56 (48), 9431-9442 (2000).
  3. Hoesl, M. G., Budisa, N. Expanding and engineering the genetic code in a single expression experiment. Chembiochem: A, European Journal of Chemical Biology. 12 (4), 552-555 (2011).
  4. Wiltschi, B., Budisa, N. Natural history and experimental evolution of the genetic code. Applied Microbiology and Biotechnology. 74 (4), 739-753 (2007).
  5. Hoesl, M. G., et al. Lipase congeners designed by genetic code engineering. ChemCatChem. 3 (1), 213-221 (2011).
  6. . FPbase avGFP Available from: https://www.fpbase.org/protein/avgfp/ (2011)
  7. Tsien, R. Y. The green fluorescent protein. Annual Review of Biochemistry. 67, 509-544 (1998).
  8. Zhang, Y., et al. Identification of genes expressed in C. elegans touch receptor neurons. Nature. 418 (6895), 331-335 (2002).
  9. Misteli, T., Spector, D. L. Applications of the green fluorescent protein in cell biology and biotechnology. Nature Biotechnology. 15 (10), 961-964 (1997).
  10. Hanson, M. R., Köhler, R. H. GFP imaging: methodology and application to investigate cellular compartmentation in plants. Journal of Experimental Botany. 52 (356), 529-539 (2001).
  11. Sakamoto, S., Shoyama, Y., Tanaka, H., Morimoto, S. Application of green fluorescent protein in immunoassays. Advances in Bioscience and Biotechnology. 05 (6), 557-563 (2014).
  12. Akbar, M., Kim, H. Y. Green fluorescent protein tagging: A novel tool in biomedical research. Indian Journal of Biotechnology. 4, 466-470 (2005).
  13. Kobayashi, T., Morone, N., Kashiyama, T., Oyamada, H., Kurebayashi, N., Murayama, T. Engineering a novel multifunctional green fluorescent protein tag for a wide variety of protein research. PloS One. 3 (12), 3822 (2008).
  14. Kent, K. P., Oltrogge, L. M., Boxer, S. G. Synthetic control of green fluorescent protein. Journal of the American Chemical Society. 131 (44), 15988-15989 (2009).
  15. Born, J., Pfeifer, F. Improved GFP variants to study gene expression in Haloarchaea. Frontiers in Microbiology. 10, 1200 (2019).
  16. Pakhomov, A. A., Martynov, V. I. GFP family: structural insights into spectral tuning. Chemistry & Biology. 15 (8), 755-764 (2008).
  17. Zimmer, M. Green fluorescent protein (GFP): applications, structure, and related photophysical behavior. Chemical Reviews. 102 (3), 759-781 (2002).
  18. Valbuena, F. M., Fitzgerald, I., Strack, R. L., Andruska, N., Smith, L., Glick, B. S. A photostable monomeric superfolder green fluorescent protein. Traffic. 21 (8), 534-544 (2020).
  19. Craggs, T. D. Green fluorescent protein: structure, folding and chromophore maturation. Chemical Society Reviews. 38 (10), 2865-2875 (2009).
  20. Maddalo, S. L., Zimmer, M. The role of the protein matrix in green fluorescent protein fluorescence. Photochemistry and Photobiology. 82 (2), 367-372 (2006).
  21. Cui, G., Lan, Z., Thiel, W. Intramolecular hydrogen bonding plays a crucial role in the photophysics and photochemistry of the GFP chromophore. Journal of the American Chemical Society. 134 (3), 1662-1672 (2012).
  22. Yang, F., Moss, L. G., Phillips, G. N. The molecular structure of green fluorescent protein. Nature Biotechnology. 14 (10), 1246-1251 (1996).
  23. Andrews, B. T., Roy, M., Jennings, P. A. Chromophore packing leads to hysteresis in GFP. Journal of Molecular Biology. 392 (1), 218-227 (2009).
  24. Xie, J. -. B., Zhou, J. -. M. Trigger factor assisted folding of green fluorescent protein. Biochemistry. 47 (1), 348-357 (2008).
  25. Steiner, T., Hess, P., Bae, J. H., Wiltschi, B., Moroder, L., Budisa, N. Synthetic biology of proteins: tuning GFPs folding and stability with fluoroproline. PloS One. 3 (3), 1680 (2008).
  26. Andrews, B. T., Schoenfish, A. R., Roy, M., Waldo, G., Jennings, P. A. The rough energy landscape of superfolder GFP is linked to the chromophore. Journal of Molecular Biology. 373 (2), 476-490 (2007).
  27. Kubyshkin, V., Davis, R., Budisa, N. Biochemistry of fluoroprolines: the prospect of making fluorine a bioelement. Beilstein Journal of Organic Chemistry. 17, 439-460 (2021).
  28. Renner, C., Alefelder, S., Bae, J. H., Budisa, N., Huber, R., Moroder, L. Fluoroprolines as tools for protein design and engineering. Angewandte Chemie (International ed. In English). 40 (5), 923-925 (2001).
  29. Fukuda, H., Arai, M., Kuwajima, K. Folding of green fluorescent protein and the cycle3 mutant. Biochemistry. 39 (39), 12025-12032 (2000).
  30. Rosenman, D. J., et al. Green-lighting green fluorescent protein: faster and more efficient folding by eliminating a cis-trans peptide isomerization event. Protein Science: A Publication of the Protein Society. 23 (4), 400-410 (2014).
  31. Vitagliano, L., Berisio, R., Mastrangelo, A., Mazzarella, L., Zagari, A. Preferred proline puckerings in cis and trans peptide groups: implications for collagen stability. Protein Science: A Publication of the Protein Society. 10 (12), 2627-2632 (2001).
  32. Kubyshkin, V. Experimental lipophilicity scale for coded and noncoded amino acid residues. Organic and Biomolecular Chemistry. 19 (32), 7031-7040 (2021).
  33. Kubyshkin, V., Budisa, N. cis-trans-Amide isomerism of the 3,4-dehydroproline residue, the ‘unpuckered’ proline. Beilstein Journal of Organic Chemistry. 12, 589-593 (2016).
  34. Budisa, N. Prolegomena to future experimental efforts on genetic code engineering by expanding its amino acid repertoire. Angewandte Chemie (International ed. In English). 43 (47), 6426-6463 (2004).
  35. Beatty, K. E., Tirrel, D. A. Noncanonical amino acids in protein science and engineering. Protein Engineering. Nucleic Acids and Molecular Biology. 22, (2009).
  36. Budisa, N. . Engineering the Genetic Code: Expanding the Amino Acid Repertoire for the Design of Novel Proteins. , (2006).
  37. Merkel, L., Budisa, N. Organic fluorine as a polypeptide building element: in vivo expression of fluorinated peptides, proteins and proteomes. Organic & Biomolecular Chemistry. 10 (36), 7241-7261 (2012).
  38. van Eldijk, M. B., van Hest, J. C. M. Residue-specific incorporation of non-canonical amino acids for protein engineering. Methods in Molecular Biology. 1728, 137-145 (2018).
  39. Hartman, M. C. T. Non-canonical amino acid substrates of E. coli aminoacyl-tRNA synthetases. Chembiochem: A European Journal of Chemical Biology. , (2021).
  40. Gomez, M. A. R., Ibba, M. Aminoacyl-tRNA synthetases. RNA. 26 (8), 910-936 (2020).
  41. Grant, M. M., Brown, A. S., Corwin, L. M., Troxler, R. F., Franzblau, C. Effect of l-azetidine 2-carboxylic acid on growth and proline metabolism in Escherichia coli. Biochimica et Biophysica Acta. 404 (2), 180-187 (1975).
  42. Budisa, N., Steipe, B., Demange, P., Eckerskorn, C., Kellermann, J., Huber, R. High-level biosynthetic substitution of methionine in proteins by its analogs 2-aminohexanoic acid, selenomethionine, telluromethionine and ethionine in Escherichia coli. European Journal of Biochemistry. 230 (2), 788-796 (1995).
  43. Budisa, N., Pal, P. P. Designing novel spectral classes of proteins with a tryptophan-expanded genetic code. Biological Chemistry. 385 (10), 893-904 (2004).
  44. Hoesl, M. G., Budisa, N. Recent advances in genetic code engineering in Escherichia coli. Current Opinion in Biotechnology. 23 (5), 751-757 (2012).
  45. Nickling, J. H., et al. Antimicrobial peptides produced by selective pressure incorporation of non-canonical amino acids. Journal of Visualized Experiments: JoVE. (135), e57551 (2018).
  46. JoVE. Basic Methods in Cellular and Molecular Biology. Bacterial Transformation: Electroporation. JoVE Science Education Database. , (2021).
  47. JoVE. Basic Methods in Cellular and Molecular Biology. Bacterial Transformation: The Heat Shock Method. JoVE Science Education Database. , (2021).
  48. Sarkisyan, K. S., et al. fluorescent protein with anionic tryptophan-based chromophore and long fluorescence lifetime. Biophysical Journal. 109 (2), 380-389 (2015).
  49. Sarkisyan, K. S., et al. KillerOrange, a genetically encoded photosensitizer activated by blue and green light. PloS One. 10 (12), 0145287 (2015).
  50. Grigorenko, B. L., Krylov, A. I., Nemukhin, A. V. Molecular modeling clarifies the mechanism of chromophore maturation in the green fluorescent protein. Journal of the American Chemical Society. 139 (30), 10239-10249 (2017).
  51. Pletnev, V. Z., et al. Structure of the green fluorescent protein NowGFP with an anionic tryptophan-based chromophore. Acta Crystallographica. Section D, Biological Crystallography. 71, 1699-1707 (2015).
  52. Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture medium for enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
  53. Hörnsten, E. G. On culturing Escherichia coli on a mineral salts medium during anaerobic conditions. Bioprocess Engineering. 12 (3), 157-162 (1995).
  54. Davis, B. D. The Isolation of biochemically deficient mutants of bacteria by means of penicillin. Proceedings of the National Academy of Sciences of the United States of America. 35 (1), 1-10 (1949).
  55. Sambrook, J., Russell, D. W. . Molecular Cloning: A Laboratory Manual. , (2001).
  56. Wang, Y. -. S., et al. The de novo engineering of pyrrolysyl-tRNA synthetase for genetic incorporation of L-phenylalanine and its derivatives. Molecular bioSystems. 7 (3), 714-717 (2011).
  57. JoVE. Basic Methods in Cellular and Molecular Biology. Separating Protein with SDS-PAGE. JoVE Science Education Database. , (2021).
  58. . ImageJ Available from: https://imagej.nih.gov/ij/ (2021)
  59. Baumann, T., et al. Engineering ‘Golden’ fluorescence by selective pressure incorporation of non-canonical amino acids and protein analysis by mass spectrometry and fluorescence. Journal of Visualized Experiments: JoVE. (134), e57017 (2018).
  60. . FPbase NowFFP Available from: https://www.fpbase.org/protein/nowgfp/ (2021)
  61. Markwardt, M. L., et al. An improved cerulean fluorescent protein with enhanced brightness and reduced reversible photoswitching. PloS One. 6 (3), 17896 (2011).
  62. Gotthard, G., von Stetten, D., Clavel, D., Noirclerc-Savoye, M., Royant, A. Chromophore isomer stabilization is critical to the efficient fluorescence of cyan fluorescent proteins. Biochemistry. 56 (49), 6418-6422 (2017).
  63. Lelimousin, M., et al. Intrinsic dynamics in ECFP and Cerulean control fluorescence quantum yield. Biochemistry. 48 (42), 10038-10046 (2009).
  64. . FPbase mKillerOrange Available from: https://www.fpbase.org/protein/mkillerorange/ (2021)
  65. Pletneva, N. V., et al. Crystal structure of phototoxic orange fluorescent proteins with a tryptophan-based chromophore. PloS One. 10 (12), 0145740 (2015).
  66. Royant, A., Noirclerc-Savoye, M. Stabilizing role of glutamic acid 222 in the structure of Enhanced Green Fluorescent Protein. Journal of Structural Biology. 174 (2), 385-390 (2011).
  67. Larregola, M., Moore, S., Budisa, N. Congeneric bio-adhesive mussel foot proteins designed by modified prolines revealed a chiral bias in unnatural translation. Biochemical and Biophysical Research Communications. 421 (4), 646-650 (2012).
  68. Yamaguchi, H., Miyazaki, M. Refolding techniques for recovering biologically active recombinant proteins from inclusion bodies. Biomolecules. 4 (1), 235-251 (2014).
  69. Ghisaidoobe, A. B. T., Chung, S. J. Intrinsic tryptophan fluorescence in the detection and analysis of proteins: A focus on Förster resonance energy transfer techniques. International Journal of Molecular Sciences. 15 (12), 22518-22538 (2014).
  70. Pal, P. P., et al. Structural and spectral response of Aequorea victoria green fluorescent proteins to chromophore fluorination. Biochemistry. 44 (10), 3663-3672 (2005).
  71. Pletnev, S., et al. Structural basis for phototoxicity of the genetically encoded photosensitizer KillerRed. The Journal of Biological Chemistry. 284 (46), 32028-32039 (2009).
  72. Kubyshkin, V., Budisa, N. Anticipating alien cells with alternative genetic codes: away from the alanine world. Current Opinion in Biotechnology. 60, 242-249 (2019).
  73. Minks, C., Huber, R., Moroder, L., Budisa, N. Atomic mutations at the single tryptophan residue of human recombinant annexin V: effects on structure, stability, and activity. Biochemistry. 38 (33), 10649-10659 (1999).
  74. Budisa, N., Huber, R., Golbik, R., Minks, C., Weyher, E., Moroder, L. Atomic mutations in annexin V thermodynamic studies of isomorphous protein variants. European Journal of Biochemistry. 253, 1-9 (1998).
  75. Lin, X., Yu, A. C. S., Chan, T. F. Efforts and challenges in engineering the genetic code. Life. 7, (2017).
  76. Völler, J. -. S., Budisa, N. Coupling genetic code expansion and metabolic engineering for synthetic cells. Current Opinion in Biotechnology. 48, 1-7 (2017).
  77. Liu, C. C., Schultz, P. G. Adding new chemistries to the genetic code. Annual Review of Biochemistry. 79, 413-444 (2010).
  78. Lukesch, M. S., Pavkov-Keller, T., Gruber, K., Zangger, K., Wiltschi, B. Substituting the catalytic proline of 4-oxalocrotonate tautomerase with non-canonical analogues reveals a finely tuned catalytic system. Scientific Reports. 9 (1), 2697 (2019).
  79. Acevedo-Rocha, C. G., et al. Non-canonical amino acids as a useful synthetic biological tool for lipase-catalysed reactions in hostile environments. Catalysis Science & Technology. 3 (5), 1198 (2013).
  80. Holzberger, B., Marx, A. Replacing 32 proline residues by a non-canonical amino acid results in a highly active DNA polymerase. Journal of the American Chemical Society. 132 (44), 15708-15713 (2010).
  81. Mosesso, R., Dougherty, D. A., Lummis, S. C. R. Proline residues in the transmembrane/extracellular domain interface loops have different behaviors in 5-HT3 and nACh receptors. ACS Chemical Neuroscience. 10 (7), 3327-3333 (2019).
  82. Mosesso, R., Dougherty, D. A., Lummis, S. C. R. Probing proline residues in the prokaryotic ligand-gated ion channel, ELIC. Biochemistry. 57 (27), 4036-4043 (2018).
  83. Torbeev, V. Deciphering protein folding using chemical protein synthesis. Total Chemical Synthesis of Proteins. 1st ed. , (2021).
  84. Torbeev, V. Y., Hilvert, D. Both the cis-trans equilibrium and isomerization dynamics of a single proline amide modulate β2-microglobulin amyloid assembly. Proceedings of the National Academy of Sciences of the United States of America. 110 (50), 20051-20056 (2013).
  85. Kawakami, T., Ishizawa, T., Murakami, H. Extensive reprogramming of the genetic code for genetically encoded synthesis of highly N-alkylated polycyclic peptidomimetics. Journal of the American Chemical Society. 135 (33), 12297-12304 (2013).
  86. Cui, Z., Johnston, W. A., Alexandrov, K. Cell-free approach for non-canonical amino acids incorporation into polypeptides. Frontiers in Bioengineering and Biotechnology. 8, 1031 (2020).

Play Video

Cite This Article
Thi To, T. M., Kubyshkin, V., Schmitt, F., Budisa, N., Friedrich, T. Residue-Specific Exchange of Proline by Proline Analogs in Fluorescent Proteins: How “Molecular Surgery” of the Backbone Affects Folding and Stability. J. Vis. Exp. (180), e63320, doi:10.3791/63320 (2022).

View Video