介绍了使用Bio3D-web在线调查蛋白质序列结构 – 动力学关系的协议。
我们展示了Bio3D-Web在生物分子结构数据交互式分析中的应用。 Bio3D-Web应用程序提供在线功能:(1)将相关蛋白质结构集合识别为用户指定的相似阈值; (2)它们的多重对齐和结构叠加; (3)序列和结构守恒分析; (4)主成分分析的构象间关系映射,(5)通过整体正态分析比较预测的内部动力学。该集成功能提供了一个完整的在线工作流程,用于调查蛋白质家族和超家族中的序列结构 – 动态关系。
蛋白质数据库(PDB)现在包含超过120,000个蛋白质结构 – 其中许多蛋白质家族具有相同的蛋白质家族,但在不同的实验条件下被解析。这些多重结构代表了理解蛋白质形式和功能复杂性的宝贵资源。例如,这些结构合奏的严格的比较可以揭示重要的分子机制1,2,3,并通知上涉及过程,包括配体结合,酶催化和双分子识别4,5,6,7构象动力学。通常可以从蛋白质家族的序列,结构和动力学的详细的大规模分析中获得新的见解。然而,这通常需要相当大的生物ormatics和计算机程序设计专业知识,以及对正在研究的蛋白质系统的熟悉程度。例如,软件包如Bio3D,PRODY和Maven需要在R,蟒和Matlab,分别为8,9,10编程。相反,对于结构灵活性分析的在线工具一般仅限于个别结构11的调查,12。这方面的一个例外是最近开发的WebNM @服务器,其允许比较从几个预对齐用户指定结构13的正常模式分析(NMA)获得的灵活性模式。然而,该服务器缺少自动化程序来识别用于比较的结构,它们的对准或超出NMA的进一步分析。另一个最近的贡献是在线PDBFlex数据库,其中提供了c共享95%或更高序列同一性的PDB结构的有限分析14 。然而,目前尚不能分析更多样化的结构集。
我们以前介绍过Bio3D-web – 一个易于使用的Web应用程序,用于分析蛋白质序列结构 – 动态关系15 。 Bio3D-web是提供易于使用的集成功能,用于在线大型同源结构集的识别,比较和详细分析。在这里,我们提出了使用Bio3D-web在线调查蛋白质序列结构 – 动力学关系的详细协议。 Bio3D-web提供了多种功能,支持图1所示的五个主要步骤的数据分析,并在下面详细讨论。这些步骤构成了从查询序列或结构输入,跨序列结构动态分析的多个级别到总结的工作流程y报告生成。通过广泛的浏览器可视化和绘图设备,以及通过以常用格式下载结果文件,可以立即获得结果。除了方便易用的动态界面,用于探索参数和方法选择的影响,Bio3D-web还将用户会话的完整用户输入和后续图形结果记录为PDF,DOC和HTML格式的可共享的可重复报告。用户会话可以在以后的时间保存和重新加载,并在用户的本地计算机上通过Bio3D R软件包下载并进一步解释完整的结果。
Bio3D幅材由Bio3Dř包生物分子的结构,序列和分子模拟数据8,16的分析供电。特别是用于刚性核识别的Bio3D算法 8 ,叠加,主成分分析(PCA) 8 ,集合正常模式分析(eNMA) 16构成了应用的基础。我们还使用依赖于pHMMER 17的 Bio3D方案来鉴定相关的蛋白质结构,并且使用MUSCLE 18进行多重序列比对。结构和序列注释通过来自RCSB PDB 19和PFAM数据库20的 Bio3D实用程序得到。 Bio3D-web可以从我们的在线服务器运行,也可以在任何运行R的计算机上安装。Bio3D-web对所有用户都是开放的,根据GPL-3开源许可证免费提供:http:// thegrantlab。组织/ bio3d / webapps中
Bio3D-web可用于交互式探索并绘制来自可用晶体结构的蛋白质的结构,动态和功能状态。此外,基于NMA和PCA的聚类结果以及注释和基于序列的分析可以特别适用于选择代表性结构以进行更耗时的分析,例如整体小分子对接或分子动力学模拟。因此,Bio3D-web通过减少所需的技术专长水平,为更广泛的研究人员提供先进的结构生物信息学分析。 Bio3D-web的当前设计强调简单易懂,包含完整的独立Bio3D包中可用的许多分析方法。在许多情况下,设想研究人员将使用Bio3D-web来了解其蛋白质家族或感兴趣的超家族的总体趋势,然后可以提供更专业的分析。 Bio3D-web是重新设计用于快速探索生物分子结构数据集并充当假设生成工具。我们鼓励用户通过在可重复报告中提供示例Bio3D代码来进一步探索其数据,该代码也存储所有查询详细信息和分析结果。
在上述代表性的示例协议中,我们展示了Bio3D-web揭示Adk功能构象转换的结构特征的能力。 Bio3D-web的其他应用包括用户上传的PDB结构的结构和动力学分析。例如,用户可以上传新的结构或确实的蛋白质序列进行分析。前面提到的分析步骤,特别是eNMA步骤,可以揭示蛋白质运动的局部和全球趋势,集体运动具有功能意义。与apo结构的比较也可以揭示未绑定到构象转换的特征。应用的其他示例在线提供了一系列不同的蛋白质家族。
尽管所有蛋白质都是灵活和动态的实体,但并非所有蛋白质都具有在不同状态( 例如活性和非活性状态)范围内可用的原子分辨率结构。因此,我们对蛋白质结构空间的观点是有限的,因此从诸如Bio3D-web的工具获得的洞察力对于某些蛋白质也是有限的。然而,随着目前的技术进步和结构基因组学的新举措,这里提出的协议将越来越成为了解重要的结构 – 功能关系的重要途径。在分析更远的相关蛋白质时特别重要的关键步骤是ALIGN标签中对齐错误的潜在出现。当序列相似性下降到30%以下时,不可避免地发生对准误差,并且在这种情况下用户必须双重检查并校正序列比对在ALIGN标签中。对齐错误可能导致FIT选项卡中不正确的叠加结构,并掩盖后续PCA的最相关的构象变体。此外,用户应该知道所选PDB结构中缺少的残留物,如在当前实施方案中,PCA只能对其中所有结构具有相应碳原子被解离的蛋白质残基进行。因此,如果选择的PDB对于蛋白质的特定区域具有未解决的残基,则该区域将从PCA中省略。
Bio3D-web目前仅限于单链PDB结构的分析。因此,使用当前的方案不能探索在四级水平发生的功能运动。尽管我们正在开发新的算法来将这种分析纳入Bio3D-web,但目前唯一的选择是通过传统的Bio3D使用。
Bio3D-web是唯一的在线应用程序离子,可以查询和识别结构集,解释其序列模式和结构变异性,并从其结构可塑性的分析和预测中提取机械信息。各种分子可视化工具和在线服务器使研究人员能够探索和分析各种生物分子结构。然而,用于分析大型异质蛋白家族的序列,结构和动力学的现有工具通常需要大量的计算专业知识,并且通常只有具有相关编程技能的用户才能访问。例如,Bio3D包需要R 8,PRODY需要Python和Maven需要Matlab的知识9,10。相反,Bio3D-web不需要编程知识,从而增加了可访问性,并减少了执行高级比较序列,结构和染色的进入障碍动态分析。此外,Bio3D-Web服务还包含了有效分析所需的分子结构的准备,策划,注释和清理。另外,通过我们的服务器实例,可以减轻对能力计算资源进行分析的限制,可以对任何现代Web浏览器启动和控制的许多结构进行大规模分析。
Bio3D-Web的开放性开发正在进行中(请参阅https://bitbucket.org/Grantlab/bio3d)。我们继续添加新的分析功能并改进现有的方法。未来的发展将侧重于增加基于距离矩阵的PCA和扭转PCA,更广泛的序列保守方法,包括系统发育成分,整体结合位点识别以及蛋白质家族动态网络分析的新方法。在这方面,当前的Web应用程序代表了起始点通过在用户定义的实验结构集上实现可重复和可共享的步骤,可以为许多其他协作结构生物信息学分析工作流程。我们还计划从PDB结构的不对称单位除个体和多个链之外重建生物单位坐标集的未来支持。其他功能将包括增强协同工作空间的保存和加载以及撤消可能性。
Bio3D-Web是生物分子结构数据交互式分析的在线应用。 Bio3D-web可在任何现代Web浏览器上运行,并提供以下功能:(1)将相关蛋白质结构集合识别为用户指定的相似阈值; (2)它们的多重对齐和结构叠加; (3)序列和结构守恒分析; (4)构象间关系映射与主成分分析,(5)通过集合比较预测的内部动力学mal模式分析。该综合功能为蛋白质家族和超家族中序列结构 – 动态关系的调查提供了完整的工作流程。除了方便易用的动态界面,用于探索参数和方法选择的影响,Bio3D-web还记录了用户会话的完整用户输入和后续图形结果。这允许用户轻松共享和重现创建其结果的分析步骤序列.Bio3D-Web完全以R语言实现,并基于Bio3D和Shiny R软件包。它可以从我们的在线服务器运行,也可以在任何运行R的计算机上本地运行。这包括本地服务器安装,以提供定制的多用户实例,可访问优先结构数据集,如制药行业常见的数据集。完整的源代码和广泛的文档是根据GPL-3开源许可证提供的:http://thegrantlab.org/ bio3d / webapps中
The authors have nothing to disclose.
感谢Guido Scarabelli和Hongyang Li博士在开发过程中进行广泛的测试,以及Bio3D用户社区和卑尔根大学结构生物信息学研讨会参与者的反馈和意见,从而改进了这一应用。
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |