这是一种使用一个断层图的一部分作为训练输入来训练多层 U-Net 以对冷冻电子断层图进行多类分割的方法。我们描述了如何将该网络推断为其他断层图,以及如何提取分割以进行进一步分析,例如断层图平均和细丝追踪。
冷冻电子断层扫描(cryo-ET)允许研究人员以目前可能的最高分辨率对天然水合状态的细胞进行成像。然而,该技术有几个局限性,使得分析它生成的数据既耗时又困难。手动分割单个断层扫描可能需要数小时到数天,但显微镜每天可以轻松生成 50 张或更多断层扫描。目前冷冻电子断层扫描的深度学习分割程序确实存在,但仅限于一次分割一个结构。在这里,多切片U-Net卷积神经网络被训练并应用于在冷冻断层图中同时自动分割多个结构。通过适当的预处理,这些网络可以可靠地推断出许多断层图,而无需为每个断层图训练单独的网络。在大多数情况下,该工作流程通过将分割时间缩短到30分钟以下,大大提高了冷冻电子断层扫描的分析速度。此外,分割可用于提高细胞环境中细丝追踪的准确性,并快速提取坐标以进行断层图平均。
过去十年的硬件和软件发展导致了冷冻电子显微镜(cryo-EM)的“分辨率革命”1,2。借助更好更快的探测器3、自动化数据收集的软件4、5 以及相位板6 等信号增强技术,收集大量高分辨率冷冻电镜数据相对简单。
冷冻电子断层扫描可对天然水合状态下的细胞超微结构提供前所未有的洞察力7,8,9,10。主要限制是样品厚度,但随着聚焦离子束 (FIB) 铣削等方法的采用,其中厚细胞和组织样品被减薄以进行断层扫描11,可以使用冷冻电子断层扫描成像的视野不断扩大。最新的显微镜每天能够产生超过50张断层扫描,由于快速数据收集方案的发展,这一速度预计只会增加12,13。分析冷冻电子断层扫描产生的大量数据仍然是这种成像模式的瓶颈。
断层扫描信息的定量分析要求首先对其进行注释。传统上,这需要专家进行手工分割,这很耗时;根据冷冻断层扫描中包含的分子复杂性,可能需要数小时到数天的专门关注。人工神经网络是解决这个问题的一个有吸引力的解决方案,因为它们可以被训练在很短的时间内完成大部分分割工作。卷积神经网络(CNN)特别适用于计算机视觉任务14,最近已被改编用于分析冷冻电子断层图15,16,17。
传统的CNN需要数千个带注释的训练样本,这对于生物图像分析任务来说通常是不可能的。因此,U-Net架构在这个领域表现出色18 ,因为它依赖于数据增强来成功训练网络,最大限度地减少了对大型训练集的依赖。例如,U-Net 架构可以只用单个断层图的几个切片(四个或五个切片)进行训练,并且无需重新训练即可可靠地推断到其他断层图。该协议为训练 U-Net 神经网络架构以在 Dragonfly 2022.119 中分割电子冷冻断层扫描提供了分步指南。
Dragonfly是商业开发的软件,用于深度学习模型的3D图像分割和分析,并且可以免费用于学术用途(适用某些地理限制)。它具有先进的图形界面,允许非专家充分利用深度学习的强大功能进行语义分割和图像去噪。该协议演示了如何在Dragonfly中预处理和注释冷冻电子断层图以训练人工神经网络,然后可以推断出快速分割大型数据集。它进一步讨论并简要演示了如何使用分段数据进行进一步分析,例如细丝追踪和坐标提取以进行子断层图平均。
该协议列出了使用 Dragonfly 2022.1 软件从单个断层图训练多类 U-Net 的程序,以及如何将该网络推断为不需要来自同一数据集的其他断层图。训练相对较快(每个纪元可以快到3-5分钟,也可以慢到几个小时,完全取决于正在训练的网络和使用的硬件),并且重新训练网络以改善其学习是直观的。只要对每个断层扫描执行预处理步骤,推理通常是可靠的。
一致的预处理是深度学习推理最关键的一步。软件中有许多成像过滤器,用户可以尝试确定哪些过滤器最适合特定数据集;请注意,在训练断层图上使用的任何过滤都必须以相同的方式应用于推理断层图。还必须注意向网络提供准确和充分的培训信息。至关重要的是,训练切片中分割的所有特征都尽可能仔细和精确地分割。
复杂的商业级用户界面有助于图像分割。它为手部分割提供了所有必要的工具,并允许在训练和再训练之前将体素从任何一个类简单地重新分配到另一个类。允许用户在断层图的整个上下文中手动分割体素,并为他们提供多个视图并能够自由旋转体积。此外,该软件还提供了使用多类网络的能力,这些网络往往性能更好16 ,并且比使用多个单类网络分段更快。
当然,神经网络的能力是有局限性的。冷冻电子断层扫描数据本质上非常嘈杂且角度采样有限,这会导致相同物体中特定于方向的失真21。训练依赖于专家来准确地分割结构,一个成功的网络只与它给出的训练数据一样好(或坏)。图像滤波以增强信号对训练器很有帮助,但在许多情况下,准确识别给定结构的所有像素仍然很困难。因此,在创建训练分段时必须格外小心,以便网络在训练期间获得最佳信息。
可以根据每个用户的偏好轻松修改此工作流程。虽然必须以完全相同的方式预处理所有断层扫描图,但没有必要使用协议中使用的确切过滤器。该软件具有许多图像过滤选项,建议在开始跨越许多断层图的大型分割项目之前,针对用户的特定数据优化这些选项。还有相当多的网络架构可供使用:已发现多层 U-Net 最适合本实验室的数据,但其他用户可能会发现另一种架构(如 3D U-Net 或传感器 3D)效果更好。分段向导提供了一个方便的界面,用于比较使用相同的训练数据的多个网络的性能。
像这里介绍的工具将使全断层扫描的手工分割成为过去。有了训练有素且可可靠推断的神经网络,创建一个工作流程是完全可行的,在该工作流程中,断层扫描数据被重建、处理和完全分割的速度与显微镜可以收集数据的速度一样快。
The authors have nothing to disclose.
这项研究得到了宾夕法尼亚州立大学医学院和生物化学与分子生物学系以及烟草结算基金(TSF)拨款4100079742-EXT的支持。该项目中使用的CryoEM和CryoET核心(RRID:SCR_021178)服务和仪器部分由宾夕法尼亚州立大学医学院通过研究和研究生副院长办公室以及宾夕法尼亚州卫生部 使用 烟草结算基金(CURE)资助。内容完全由作者负责,并不一定代表大学或医学院的官方观点。宾夕法尼亚州卫生部明确声明不对任何分析、解释或结论负责。
Dragonfly 2022.1 | Object Research Systems | https://www.theobjects.com/dragonfly/index.html | |
E18 Rat Dissociated Hippocampus | Transnetyx Tissue | KTSDEDHP | https://tissue.transnetyx.com/faqs |
IMOD | University of Colorado | https://bio3d.colorado.edu/imod/ | |
Intel® Xeon® Gold 6124 CPU 3.2GHz | Intel | https://www.intel.com/content/www/us/en/products/sku/120493/intel-xeon-gold-6134-processor-24-75m-cache-3-20-ghz/specifications.html | |
NVIDIA Quadro P4000 | NVIDIA | https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/productspage/quadro/quadro-desktop/quadro-pascal-p4000-data-sheet-a4-nvidia-704358-r2-web.pdf | |
Windows 10 Enterprise 2016 | Microsoft | https://www.microsoft.com/en-us/evalcenter/evaluate-windows-10-enterprise | |
Workstation Minimum Requirements | https://theobjects.com/dragonfly/system-requirements.html |