本文介绍了一种使用小型测试数据集估计当天 P300 拼写器脑机接口 (BCI) 准确性的方法。
性能评估是脑机接口(BCI)系统开发和验证的必要步骤。不幸的是,即使是现代的 BCI 系统也很慢,这使得收集足够的数据进行验证成为最终用户和实验者的一项耗时的任务。然而,如果没有足够的数据,性能的随机变化可能会导致对 BCI 对特定用户的工作情况的错误推断。例如,P300 拼写器通常每分钟操作大约 1-5 个字符。要以 5% 的分辨率估计准确性需要 20 个字符(4-20 分钟)。尽管投入了大量时间,但 20 个字符的准确度的置信度范围可能高达 ±23%,具体取决于观察到的准确度。先前发表的方法,基于分类器的延迟估计 (CBLE),被证明与 BCI 准确性高度相关。这项工作提出了一种协议,用于使用 CBLE 从相对较少的字符 (~3-8) 打字数据中预测用户的 P300 拼写器准确性。由此产生的置信度范围比传统方法产生的置信度范围更严格。因此,该方法可用于更快和/或更准确地估计 BCI 性能。
脑机接口(BCI)是一种非侵入性技术,允许个人直接通过机器进行通信,而不考虑身体施加的物理限制。脑机接口可以用作由大脑直接操作的辅助设备。BCI 使用用户的大脑活动来确定用户是否打算选择屏幕上显示的某个键(字母、数字或符号)1。在典型的计算机系统中,用户在键盘上物理按下预期的键。但是,在具有视觉显示的 BCI 系统中,用户需要专注于所需的密钥。然后,BCI 将通过分析测量的大脑信号1 来选择预期的密钥。可以使用各种技术来测量大脑的活动。尽管有相互竞争的脑机接口技术,但脑电图 (EEG) 因其无创性、高时间分辨率、可靠性和相对较低的成本而被认为是一种领先的技术2。
BCI 的应用包括通信、设备控制以及娱乐 3,4,5,6。最活跃的 BCI 应用领域之一是 P300 拼写器,它由 Farwell 和 Donchin7 推出。P300 是一种事件相关电位 (ERP),用于响应对罕见但相关的刺激8 的识别。当一个人识别出他们的目标刺激时,他们会自动产生 P300。P300 是 BCI 的有效信号,因为它传达了参与者对目标事件的识别,而无需向外响应9。
P300 BCI 吸引了来自计算机科学、电气工程、心理学、人为因素和其他各个学科的研究人员。在信号处理、分类算法、用户界面、激励方案和许多其他领域取得了进展 10,11,12,13,14,15。然而,无论研究领域如何,所有这些研究的共同点是测量 BCI 系统性能的必要性。此任务通常需要生成测试数据集。这种必要性不仅限于研究;作为辅助技术的最终临床应用可能需要为每个最终用户提供单独的验证集,以确保系统能够产生可靠的通信。
尽管对 P300 BCI 进行了大量研究,但这些系统仍然相当缓慢。虽然大多数人能够使用 P300 BCI16,但大多数 P300 拼写器每分钟生成 1-5 个字符的文本。不幸的是,这种缓慢的速度意味着生成测试数据集需要参与者、实验者和最终最终用户花费大量时间和精力。测量 BCI 系统精度是一个二项式参数估计问题,要进行良好的估计,需要许多数据字符。
为了估计 P300 ERP 的存在与否,大多数分类器使用二元分类模型,该模型涉及为每个试验或脑电图数据周期分配一个二元标签(例如,“存在”或“不存在”)。大多数分类器使用的一般方程可以表示为:
其中 称为分类器的分数,表示 P300 响应存在的概率,x 是从 EEG 信号中提取的特征向量,b 是偏差项17。函数f是一个决策函数,它将输入数据映射到输出标签,并使用监督学习算法17从一组标记的训练数据中学习。在训练过程中,分类器在标记的脑电信号数据集上进行训练,其中每个信号都被标记为具有或没有 P300 响应。对权重向量和偏置项进行了优化,以最大程度地减少分类器的预测输出与 EEG 信号的真实标签之间的误差。一旦分类器经过训练,它就可用于预测新脑电图信号中 P300 响应的存在。
不同的分类器可以使用不同的决策函数,例如线性判别分析 (LDA)、逐步线性判别分析 (SWLDA)、最小二乘法 (LS)、逻辑回归、支持向量机 (SVM) 或神经网络 (NN)。最小二乘分类器是一种线性分类器,用于最小化预测类标签和真实类标签之间的平方误差之和。此分类器使用以下公式预测新测试样本的类标签:
(1)
其中,如果乘积为正,符号函数返回 +1,如果乘积为负,则返回 -1,并且使用以下公式从训练数据、(x) 和类标签 (y) 的特征集中获得权重向量:
(2)
在早期的研究中,我们认为基于分类器的延迟估计 (CBLE) 可用于估计 BCI 准确性 17,18,19。CBLE 是一种通过利用分类器的时间敏感性来评估延迟变化的策略18。虽然传统的 P300 分类方法涉及使用与每个刺激呈现同步的单个时间窗口,但 CBLE 方法涉及创建刺激后时期的多个时移副本。然后,它检测导致最高分数的时移,以估计 P300 响应17,18 的延迟。在这里,这项工作提出了一种协议,该协议使用 CBLE 从小型数据集中估计 BCI 性能。作为代表性分析,字符数是变化的,以预测个人的整体表现。对于这两个示例数据集,计算了 vCBLE 的均方根误差 (RMSE) 和实际 BCI 精度。结果表明,使用其拟合数据的 vCBLE 预测的 RMSE 始终低于从 1 到 7 个测试字符得出的准确度。
我们开发了一个名为“CBLE性能评估”的图形用户界面(GUI),用于实施所提出的方法。还提供了在 MATLAB 平台上运行的示例代码(补充编码文件 1)。示例代码执行 GUI 中应用的所有步骤,但提供这些步骤是为了帮助读者适应新的数据集。该代码使用公开可用的数据集“Brain Invaders 校准无 P300 的基于 BCI 使用干 EEG 电极数据集 (bi2014a)”来评估所提出的方法20。参与者最多玩了三个 Brain Invaders 游戏环节,每个环节有 9 个游戏关卡。数据收集一直持续到所有级别完成或参与者失去对 BCI 系统的所有控制。Brain Invaders 界面包括 36 个符号,这些符号在 12 组中闪烁,每组 6 个外星人。根据 Brain Invaders P300 范式,重复是由 12 次闪光产生的,每组一次。在这 12 次闪光中,有两次闪光包含目标符号(称为目标闪光),而其余 10 次闪光不包含目标符号(称为非目标闪光)。有关此范式的更多信息,请参阅原始参考文献20。
CBLE方法也在密歇根州的一个数据集上实施,该数据集包含来自40名参与者的数据18,19。在这里,八名参与者的数据不得不被丢弃,因为他们的任务不完整。整个研究需要每位参与者进行三次访问。在第一天,每个参与者输入一个 19 个字符的训练句子,然后在第 1、2 和 3 天输入三个 23 个字符的测试句子。在此示例中,键盘包含 36 个字符,这些字符分为六行六列。每行或每列闪烁 31.25 毫秒,闪烁间隔为 125 毫秒。在字符之间,提供了 3.5 秒的停顿。
图1 显示了所提方法的框图。协议部分介绍了详细过程。
本文概述了一种使用小型 P300 数据集估计 BCI 准确性的方法。在这里,当前的协议是基于“bi2014a”数据集开发的,尽管该协议的有效性在两个不同的数据集上得到证实。为了成功实现这种技术,建立某些变量至关重要,例如原始数据的纪元窗口、时移窗口、下采样率以及训练和测试数据集的大小。这些变量由所使用的数据集的特征决定,包括目标或字符的数量、序列的数量和参与者的总数。
<p…The authors have nothing to disclose.
用于代表性结果的数据是从美国国家儿童健康与人类发展研究所 (NICHD)、美国国立卫生研究院 (NIH) 根据 Grant R21HD054697 和教育部国家残疾与康复研究所 (NIDRR) 根据 Grant H133G090005 和 H133P090008 号奖励支持的工作中收集的。其余的工作部分由美国国家科学基金会(NSF)资助,奖励#1910526。这项工作中的发现和意见并不一定反映 NICHD、NIH、NIDRR 或 NSF 的立场。