在这里, 我们介绍了如何利用小角度 x 射线散射 (saxs) 来获取代表大分子结构的低分辨率信封的信息。当与 x 射线晶体学和核磁共振等高分辨率结构技术结合使用时, saxs 可以提供对多域蛋白质和高分子复合物溶液的详细洞察。
涉及具有多个球状域的蛋白质-蛋白质相互作用, 为确定这些复合物的形成方式以及这些领域的定位提出了技术挑战。本文介绍了一种具有阐明特定域通过从一开始就通过建模来调节多组分系统中相互作用的协议。提供了一种计算大分子及其组件溶液结构的方法, 该方法包括以混合方法将小角度 x 射线散射 (saxs)、色谱和原子分辨率结构的数据集成在一起。一个具体的例子是全长 nidogen-1 的复合体, 它组装细胞外基质蛋白, 形成一个延伸的、弯曲的纳米结构。其球状域之一附着在层流γ-1 上, 层流蛋白γ-1 结构着基底膜。这为确定柔性多域蛋白质复合物的精确结构提供了基础, 并通过同步加速器源与自动化机器人和尺寸排除色谱系统相结合进行了支持。这种组合允许快速分析, 在 saxs 数据收集之前, 多个寡聚状态被分离。该分析得出了旋转半径、粒子尺寸、分子形状和跨域配对的信息。给出了通过拟合组分蛋白的高分辨率结构生成复合物三维模型的方案。
细胞包含复杂的蛋白质网络, 作为分子机器来执行细胞功能, 如信号级联和保持结构完整性。这些不同成分在三维空间中移动和相互作用的方式产生了大分子的特定功能。蛋白质结构、动力学和相互作用在确定功能方面的重要性提供了不断发展的复杂技术来衡量这些特性的必要性。其中, 核磁共振 (nmr)、x 射线晶体学 (xrc) 和最近, 冷冻电子显微镜 (cem) 提供了高分辨率的结构信息。然而, xrc 和 cem 的产量结构是许多生物分子状态之一, 缺乏有关蛋白质结构动力学的信息, 而核磁共振的三维结构测定通常仅限于较小的球状蛋白质。克服这些限制的一种方法是利用小角度 x 射线散射 (saxs) 生成大型、多域或复杂系统的分子包络, 并结合高分辨率刚性大分子结构来阐明全局结构和动态功能。
saxs 生产的大分子复合物低分辨率包络, 分辨率约为 10-20 1 , 不仅可以深入了解该复合物所显示的结构, 还可以了解该复合物所显示的动态特性。尽管 saxs 利用 x 射线来揭示分子结构, 但与 xrc 不同的是, 溶液中粒子的随机各向同性方向不会导致衍射, 而是导致散射, 从而不能产生原子分辨率。相反, 大分子的电子 “包络” 被产生, 代表大分子所显示的构象的平均值。这些信息可用于直接拟合先前求解的原子分辨率结构, 以推断单个蛋白质或亚单位组织中的柔性区域, 或在更大的多蛋白质复合体中的动力学。saxs 数据是在使用高能单色 x 射线的同步加速器或从内部来源收集的, 这些数据提供的 x 射线源较弱, 需要数小时而不是几秒钟的样品曝光时间 (图 1)。saxs 数据通常通过一个实验设置和缓冲区从多个样本中收集, 需要更长的时间来收集系统上的一轮有用数据。因此, 根据可验证的质量控制方法 (如动态光散射 (dls) 和/或分析超离心 (auc) 分析), 样品应至少稳定且连续几个小时不聚合, 以获得高质量的 saxs 数据2,3. 在这里, 我们提供了 saxs 的实用描述、其使用原理、优点、局限性和样品制备, 并重点关注数据收集和分析, 同时简要介绍了使用以细胞外基质蛋白 nidogen-1 和层压蛋白γ-1 为实验实例。
saxs 的原则、优点和限制:
saxs 背后的指导原则相对简单: 有关大分子单分散制备的溶液被放置在毛细管内, 并暴露在高能单色 x 射线束中。光子使原子壳的电子开始振荡, 导致球波发出相同的能量和波长。由于每个电子都会振荡, 因此将获得一个恒定的背景, 并将产生的大分子的电子密度与背景进行对比。由此产生的散射强度被收集为散射角的函数, 2 (图 1)。
虽然 xrc、nmr 和 cem 等其他技术提供了原子级别的结构信息, 但 saxs 有多种其他技术无法提供的好处。saxs 几乎可以在任何缓冲器中执行, 不需要任何特殊的样品制备。这对于研究大分子在不同条件下的行为和结构尤其重要, 例如存在或不存在单价或二价阳离子或 ph 值 4,5的变化。saxs 有能力提供有关大分子6的灵活区域的信息, 这是其他列出的技术可能难以理解的。因此, saxs 可以作为一种强大的辅助技术, 使用 xrc、nrm 或 cem 对高分子的稳定部分进行研究, 并使用 saxs 对整个高分子或复合物进行低分辨率分析, 并使用各种分析工具进行组合, 例如作为 foxsdock7或 crysol8。由于 saxs 是一种求解技术, 因此它经常被用来确认静态结构 (如从 xrc 获得的静态结构) 在解决方案6中是否一致。saxs 还具有这样一种优势, 即需要相对较少的样品投资 (通常为 50-100μl) 和相对较小的实验时间 (30分钟–小时) 的技术。
saxs 最大的限制是容易受到样本聚合和/或降解的影响, 这可能导致不正确的结构预测。聚合, 即使低至 5%, 也会非常大地散射光, 从而导致高估最大粒子尺寸 (d最大值) 和旋转半径 (rg)。另一方面, 样品降解会导致分子特性的低估。soxs 是一种平均技术, 这意味着样品均匀性对于实现可靠且可重现的结果至关重要, 因此会产生此漏洞。因此, saxs 要分析的任何样品都应经过多种纯化和均匀性检查方法, 如变性和原生凝胶电泳、尺寸排除色谱、动态光散射和分析超离心。通常情况下, saxs 波束线将通过高效液相色谱运行样品, 作为 saxs (s-saxs)3,9之前的最终质量控制步骤。saxs 数据应在多个浓度下收集, 并应比较每个数据集的rg, 以确保密切的相似性, 避免粒子间的相互作用和聚集, 从而导致粒子的高估尺寸, 导致不准确的数据分析和建模。由于散射取决于浓度和大小, 较小的大分子可能需要更具体的浓度范围优化。这是由于互惠定理, 大尺寸向小角度散射, 小尺寸向大角度散射。这体现在数据收集中, 其中 i o 与 r6成正比, 其中 r 是粒子半径。saxs 的最后一个限制是在照射过程中对样品造成辐射损害的可能性, 这可能导致数据失真。最好的做法是比较 sax 样品曝光前后的样品质量, 以确保不会发生这种情况。
本文协议部分概述的 saxs 数据分析的关键步骤包括缓冲减法、吉尼耶分析、克拉特基分析、数据合并和 p (r) 分布。从一开始的珠子建模太广泛了, 无法在这里详细介绍, 因此只简单介绍。
在同步加速器 (例如德国的 desy、英国的 diamond 和法国的 esrf), 可以收集每个样本的很小一部分 (~ 少量μl) 的 saxs 数据, 因为分数是从在线连接的 s 列中提取出来的 (参见图 1)。).弹性散射的 saxs 数据是径向平均使用仪器制造商提供的包或由同步加速器, 然后才可以进行缓冲减法。生成的一维数据表示 y 轴和散射角 (q = 4 sin , 其中是入射 x 射线的波长) 上的散射光量 (在 i(q) 中), 如图 1所示。该程序 PRIMUS/qt12用于直接减去任何背景由于缓冲区, 并在第1.1 节中描述。其他方案, 如;scotter43 (下载可在www.bioisis.net), 教程可在 https://www.youtube.com/channel/UCvFatdC5HcZOLv6OSjblfeA 和生物 xtas raw44 (可在http : ps:///bioxtas-raw.readthedocs.io/en/Latest/index.html) 可用作 atsas 软件包的替代方案。
guinier 分析提供了有关样品聚集和均匀性的信息, 并根据来自低区域14的 saxs 数据为感兴趣的大分子提供了陀螺半径 (rg)。利用 PRIMUS/qt 构造了从每个浓度获得的 saxs 数据的图形, 然后是最大范围为 q x r g的最大范围为1.30的曲线拟合。单分散样品制备应在该区域提供线性吉尼耶图 (图 2d), 而聚合则产生非线性吉尼耶图15,16。如果 guier 分析是线性的, 那么在决定是执行刚体建模还是构建低分辨率模型的合奏时, 克拉特基图可以观察到感兴趣的大分子的 “展开” 程度, 这很有用。球状蛋白质将出现在克拉特基地块上, 形成钟形曲线, 而扩展分子或展开的肽将出现在高原甚至在较大的q范围内增加, 并且缺乏钟形 (图 2c)。
从 guier 分析中获取r g 只考虑一维散点图的低q区域的数据点 (图 2d), 但是, 可以使用几乎整个数据集执行间接傅立叶变换将 ln (i (q) ) vs . (q) 的往空信息转换为提供 d max 和 r g 信息的真实空间距离分布函数 (p (r) ) (图 2 b)p(r) 图的形状代表了感兴趣的大分子的总溶液构象 18,19。将往空数据转换为真实空间数据是一个关键的步骤, 但详细的描述不在本文的范围之内。因此, 请参考 svergun20的文章来了解每个参数。
一旦通过具有一致 r g 值的 guier 分析处理单个浓度下的缓冲减去数据, 然后使用 kratky 分析调查其折叠模式, 这些数据就可以合并。如上文所述, 对 nidogen-1、层压蛋白γ-1 及其复合物的合并数据进行了处理, 得到的 p (r) 图如图 2b所示。理想情况下, 还应计算每个浓度的对距分布函数 p (r), 以确定为每个浓度收集的 saxs 数据是否提供了类似的rg 和 d最大值。如果rg 和d最大值在广泛的浓度范围内保持相似, 则用户应继续。需要注意的是, 根据信号的不同, 数据可能会在数据合并之前被截断。如果正在调查的大分子的浓度和分子量较低, 通常会出现这种情况。
使用 dammin 的低分辨率形状分析可以在各种模式下执行 (例如, 快速、慢、专家模式等)。快速模式是评估 p (r) 图是否提供了高质量模型的理想第一步。通常情况下, 每个 p (r) 图至少应获得10个模型, 以检查是否获得了低分辨率结构方面的可重现结果, 拟合参数的优度较低 (根据我们的大量工作, 0.5-1.0 的值被认为是好的), 该值描述实验收集的 saxs 数据和模型派生数据之间的协议。出于发布目的, 我们通常使用 “慢速” 或 “专家” 模式, 并计算至少15个模型。除了 dammin, 它的一个更快的版本, dammif37, 以及 gasbor 38 也是替代品.此外, 为了研究蛋白质蛋白或蛋白质核酸复合物, 可以使用 monsa 程序35, 这有助于同时拟合单个 soxs 数据的两个大分子以及它们的复合体。有关高分辨率模型计算以及 rna-蛋白质相互作用研究的更多细节, 请参阅 patel等人3的最新文章。
saxs 理论上很简单, 但无疑是对其他结构生物学工具高度互补的方法, 其结果是低分辨率的结构数据, 可以单独使用, 也可以与高分辨率技术结合使用, 以阐明信息关于大分子结构和动力学只要能得到大分子及其配合物的单分散制剂, 就可以利用 saxs 研究任何类型生物大分子的溶液内结构和相互作用。在这里讨论的复合体的情况下, 值得注意的是, 只有不到10% 的氮-1 和层压蛋白γ-1 的整体可访问表面积被埋在这个复合体中, 而这两种蛋白质的其余领域都可以自由地与其他蛋白质相互作用。细胞外基质处的蛋白质, 以保持其结构刚性 (图 3)。使用其他结构生物学技术, 如 x 射线晶体学、核磁共振和低温显微镜, 获得具有 ~ 240kDa 的复杂物的此类信息将是非常具有挑战性的。
通过 x 射线晶体学或核磁共振发现蛋白质结构是一个固有的耗时过程。结构确定中的这一瓶颈是 saxs 作为结构技术的强度所在的一个领域;单个 saxs 实验的数据采集可能需要不到一个小时的时间, 借助简化的分析软件, 可以快速高效地进行分析。saxs 作为一种独立技术, 有可能大大提高结构研究的吞吐量, 因为它在获得高分辨率数据之前提供了一个低分辨率的大分子结构模型。其他结构技术的一个障碍是需要一个高度纯净、集中的样本来获取数据, 这就需要在很长一段时间内获得高水平的蛋白质表达和稳定性。虽然 saxs 样品也需要是纯和浓缩的, 但样品量大约为 100μl, 使 saxs 与其他结构技术相比是一种相对便宜的分析方法。此外, saxs 与尺寸排除色谱相结合, 变得越来越普遍, 这提供了一个额外的质量控制步骤。最近, 使用集成优化方法 (eom)45、46来阐明柔性系统的核磁共振和 saxs 数据的组合有了很大的进展。在 mertens 和 svergun47最近的一篇论文中, 作者描述了最近 eom saxs 与核磁共振的多个例子, 以及与 nmr 结合使用的许多其他 saxs 数据的例子。在 saxs 领域不断取得进展, 并正在开发新的技术, 以便将 saxs 与其他结构技术结合使用, 而不仅仅是对其他结构技术的补充。因此, 我们认为, 随着时间的推移, 对 saxs 的需求只会增加, 特别是与 nmr 一起描述由灵活性定义的动态系统。
The authors have nothing to disclose.
该项目得到了 nserc rgpin-2018-04994、校园艾伯塔省创新计划 (rcp12-002c) 和艾伯塔省普隆研究所/艾伯塔省创新生物解决方案 (201618年) 赠款的支持, 该奖学金授予 m. o. trp 是加拿大 rna 和 rna 研究主席。蛋白质生物物理学 (201704), 并承认 nserc 发现赠款 (rgpin-2017-04003)。tm 由 nserc 发现计划赠款资助。
HEK 293 EBNA Cell Line | In-Lab availability | – | Cell line used to overexpress protein(s) |
Ni Sepharose High Performance histidine-tagged protein purification resin | GE Healthcare | 17524801 | Affinity protein purification resin |
Superdex 200 Increase 10/300 | GE Healthcare | 28990944 | SEC Column |
ÄKTA Pure FPLC | GE Healthcare | – | FPLC System |
Nanodrop | Nanodrop | – | Spectrophotometer |
Basic Reagents (NaCl, Tris-HCl etc.) | |||
S-MAX3000 | Rigaku | – | SAXS Pinhole Camera System |
Zetasizer Nano-S | Malvern Instruments Ltd | – | Dynamic Light Scattering instrument |
0.1µm Filter | Millipore | JVWP04700 | Used to Concentrate Sample Prior to DLS |
Thrombin cleavage kit | abcam | ab207000 | Thrombin cleavage to remove His tag |
Strep-Tactin Sepharose Column | IBA | 2-1201-010 | Strep-Tag Affinity Purification |
D-desthiobiotin | Sigma-Aldrich | 533-48-2 | Elution of Strep Tag Protein |
Software | |||
SAXGUI | Rigaku | – | Data Collection for SAXS and data reduction |
ATSAS Suit | Franke et al., 2017 | – | SAXS Data Analysis Software program suite |
PRIMUS | Konarev et al., 2003 | – | Buffer Subtraction |
GNOM | Svergun, 1992 | – | Rg, Dmax and p(r) Calculation |
DAMMIF | Franke and Svergun, 2009 | – | Ab initio model calculation |
DAMAVER | Volkov and Svergun, 2003 | – | Averaged Solution Conformation calculations |
MONSA | Svergun, 1999 | – | Simultaneous model fitting for the complex |
GASBOR | Svergun et al., 2001 | – | Alternative Ab initio model calculations |
DTS Software V6.20 | Malvern Instruments Ltd | – | DLS supplied instrument software |
PyMOL | Schrodinger, LLC. | – | The PyMOL Molecular Graphics System V2.0 |
The Protein Data Bank | Berman et al., 2000 | – | PDB ID: 1NPE |