本文介绍了使用软件套件SPHIRE处理低温EM图像的协议。目前的协议可以应用于几乎所有瞄准近原子分辨率的单粒子EM项目。
SPHIRE(用于高分辨率电子显微镜的SPARX)是用于半自动处理单粒子电子冷冻显微镜(cryo-EM)数据的新型开源,用户友好的软件套件。这里介绍的协议详细介绍了如何通过引导用户通过单个粒子结构确定管道的所有步骤从cryo-EM显微照片电影开始获得近原子分辨率结构。这些步骤由新的SPHIRE图形用户界面进行控制,并需要最少的用户干预。使用该方案,来自Photorhabdus luminescens的TcdA1( Tc毒素复合物)的结构来自仅9500个单一颗粒。这种简化的方法将帮助没有广泛的处理经验和先验结构信息的新手用户获得其纯天然状态的纯化大分子复合物的无噪声和无偏倚的原子模型。
直接电子探测器技术的发展,单粒子低温电动机的显着进步正在重塑结构生物学1 。与X射线晶体学相比,该技术只需要少量的蛋白质材料,而不需要结晶,同时对样品的纯度提出更少的限制,并且仍允许测定近原子分辨率下的结构。重要的是,不同的组成或状态现在可以在计算上分离,不同构象的结构确定可以以前所未有的细节进行。最近,挑战性分子的密度图可以通过允许从头模型建立的决议产生,从而深入了解其作用模式2,3,4,5。
3DEM(3D电子显微镜)社区(https://en.wikibooks.org/wiki/Software_Tools_For_Molecular_Microscopy)中提供了各种各样的图像处理软件包,大多数都在不断的开发中。已经通过几种不同的软件包,包括EMAN2 6 ,IMAGIC 7 ,FREALIGN 8 ,RELION 9 ,SPIDER 10和SPARX 11 ,显示各种分子量和对称性的蛋白质已经实现了近原子分辨率。每个包需要不同级别的用户专业知识,并提供不同级别的用户指导,自动化和可扩展性。此外,虽然一些程序提供了完整的环境来促进图像分析的所有步骤,但是其他程序被设计为优化特定任务,例如从已知的r开始的对准参数的改进参考结构。最近,已经开发了几个平台,包括APPION 12和SCIPION 13 ,它提供了一个整合来自上面列出的不同软件包的方法和协议的单一处理流程。
为了有助于目前低温EM的发展,SPARX被重新开发成为一个新的独立和完整的单粒子分析平台,称为SPHIRE(用于高分辨率电子显微镜的SPARX)。为了增加该领域新研究者的技术的可及性,并且为了应对现代全自动高端电子显微镜产生的大量数据,通过引入易于使用的方法重新设计和简化了处理管道图形用户界面(GUI),并自动执行工作流程的主要步骤。此外,添加了新的算法以允许从cr获得快速,可重现和自动化的结构确定yo-EM图像。此外,引入了通过重现性的验证,以避免在细化和异质性分析期间产生的常见伪像。
虽然该程序被广泛修改,但它的核心功能得到了维护:简单的开源代码,现代面向对象的设计和所有基本功能的Python接口。因此,它没有改变为黑盒子程序,使用户能够学习和轻松地修改Python代码,创建其他应用程序或修改整个工作流程。这对于非标准的低温电力项目尤其有用。
这里我们提出一种使用SPHIRE的GUI从cryo-EM图像获得近原子分辨率密度图的协议。它详细描述了从原始的cryo-EM直接检测器电影生成密度图所需的所有步骤,并不限于任何特定的大分子类型。这个协议主要是指引newc通过工作流程在实地工作,并提供关于处理的关键步骤以及一些可能的陷阱和障碍的重要信息。更高级的功能和SPHIRE背后的理论背景将在其他地方描述。
单粒子低温电动机近年来呈现出快速发展的趋势,并提供了许多具有重要生物学意义的大分子复合物的原子分辨率结构25 。为了支持当前正在进入该领域的大量新手用户,我们开发了单粒子图像分析平台SPHIRE ,并为此展示了包括电影对齐,粒子采集,CTF估计,初始模型在内的整个工作流程的漫游协议计算,2D和3D异质性分析,高分辨率3D细化和局部分辨率估计和滤波。
这里描述的协议旨在作为使用感兴趣的蛋白质的cryo-EM显微照片以及由SPHIRE的独立GUI提供的计算工具的帮助的3D结构确定的简短指南。
工作流的主要特点是大部分的程序只需要运行一次,因为它们依赖于通过重复性19进行验证的概念,并且不需要参数调整。这种自动验证机制是SPHIRE与其他软件包的主要优点,因为结果往往是客观的和可重复的,最重要的是可以以可接受的计算成本获得。该管道还为经验丰富的用户提供了丰富的诊断信息,以自己的方法进行进一步的独立验证和评估。然而,在结构生物学和电子显微镜中至少具有元素理论背景的新手用户应该能够使用自己的数据和自动验证程序获得近原子分辨率结构。
然而,获得近原子分辨率结构并不总是直接的,结果将高度取决于样本的质量和输入数据一个。对于这里给出的程序,假设有足够数量的高质量未对齐的原始EM电影可用,其平均值显示清晰可辨的均匀和随机取向的单个颗粒。通常,对于分子的对称性,大小或整体形状没有限制,但是低分子量可能是限制因素,特别是当蛋白质具有无特征的球形形状时。通常,具有高点组对称性的较大,有序粒子的分析要求较低。因此,强烈建议新手用户首先使用精确表征的cryo-EM数据集来运行本协议。 SPHIRE教程数据(http:/sphire.mpg.de)或EMPIAR提交的数据集之一(https://www.ebi.ac.uk/pdbe/emdb/empiar/)与原始电影是一个很好的起点。
在处理自己的数据时,很可能某些数据集或某些图像不能满足某些要求标准。在这方面,除了由程序对工作流程的主要步骤执行的自动化稳定性和再现性检查之外,仍然建议用户在协议的某些“检查点”处目视检查结果,特别是如果最终重建不满意
在电影对准( 协议步骤2 )和CTF估计( 协议步骤3 )之后,可以在显微照片级别进行第一次视觉检查。所得到的运动校正平均值应显示清晰可辨和分离好的单个颗粒,其功率谱应显示清晰可辨的各向同性Thon环。它们可见的空间频率在大多数情况下定义了最终决定结构原则上最高的分辨率。具有足够质量的运动校正平均值及其功率谱的示例显示在"代表性的结果“。可以借助SPHIRE的Drift和CTF评估GUI工具(http://sphire.mpg.de/wiki/doku.php),去除可能对最终结果产生负面影响的异常图像。
关于粒子筛选,SPHIRE流程中的关键步骤是使用ISAC的2D分类( 协议步骤5.2) 。这里,用户应该控制由程序自动识别的可再现的2D类平均采用足够准确地均匀地覆盖角度空间的取向范围。如果课程平均质量不令人满意(嘈杂和/或模糊的图像)和/或可再现的班级数量非常低,考虑提高自动采摘质量,优化数据集成像或样品制备。在大多数情况下,不可能从不产生良好2D类别平均值的数据集中计算可靠的重构。高品质2D课程的例子“代表性结果”一节中显示了愤怒。
需要至少100级平均值以自动方式获得可靠的初始3D模型( Protocol步骤6.1 )。对于此步骤,用户应选择具有最高质量的平均值,并包括尽可能多的不同粒子取向。初始模型的质量对于随后的高分辨率3D细化的成功至关重要。
在其他软件包中,有时执行3D分类以去除“坏”粒子8,9 。然而,在SPHIRE中,大多数这些粒子已经在使用ISAC的2D分类期间被自动消除。因此,如果重建和3D变异性分析指示数据集的异质性,则建议仅执行计算密集的3D排序步骤。
最重要的是,用户应该仔细仔细检查所得到的3D体积( 协议步骤9.3 ),并确认相应密度的特征与标称分辨率一致。分辨率<9Å,对应于α-螺旋的棒状密度变得可见。在分辨率<4.5Å时,对应于β-折叠中的链的密度通常很好地分离并且体积大的氨基酸变得可见。高分辨率图(<3Å)应显示清晰可辨的侧链,从而允许构建准确的原子模型。
迄今获得的结果表明,在SPHIRE的自动重现性测试和最小目视检查的帮助下,本协议通常适用于任何类型的单粒子低温 – EM项目。显示每个处理步骤的代表性结果,用于重建TcdA1毒素Photorhabdus luminescens 21 ,已被解决为近原子分辨率。类似质量的密度图可用于通过从头主干跟踪以及相互或实际空间细化构建可靠的原子模型,从而为理解复杂的分子机制提供坚实的结构框架。
访问代码:
EM结构和未处理电影的坐标已分别存放在电子显微镜数据库和电子显微镜导频图像存档中,登录号为EMD-3645和EMPIAR-10089。
The authors have nothing to disclose.
我们感谢D. Roderer为我们提供了TcdA1显微照片。我们感谢Steve Ludtke持续支持EMAN2基础设施。这项工作得到了马克斯·普朗克学会(SR)和欧洲理事会根据欧盟第七框架计划(FP7 / 2007-2013)(授权号615984)(授予SR)的资助,并获得了美国国家研究机构健康R01 GM60635至PAP)。
SPHIRE | Max Planck Institute of Molecular Physiology- Dortmund and Houston Medical School, Houston, Texas | http://sphire.mpg.de | |
UCSF Chimera | University of California, San Francisco | http://www.cgl.ucsf.edu/chimera/ | |
Unblur | Janelia Farm Research Campus, Ashburn | http://grigoriefflab.janelia.org/unblur | |
Coot | MRC Laboratory of Molecular Biology, Cambridge | http://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | |
EMAN2 | Baylor College of Medicine, Houston | http://blake.bcm.edu/emanwiki/EMAN2 | |
Computing Cluster with 1824 cores | Max Planck Institute of Molecular Physiology | Linux Cluster with 76 nodes, each with 2 Processors Xeon E5-2670v3 12C 2.30 GHz and 128 Gb RAM | |
TITAN KRIOS electron microscope | FEI | 300 kV, Cs correction, XFEG | |
Falcon II direct electron detector | FEI | ||
EPU (automated data acquisition software) | FEI | https://www.fei.com/software/epu/ |