文章

从构建全新手势集开始打破肌电控制的“因人而异”困境

2025-08-14     来源:本站     点击次数:74

打破肌电控制的“因人而异”困境,从构建全新手势集开始
肌电模式识别存在用户依赖性,即相同动作的肌电信号因个体生理差异(如肌肉结构、激活模式)而不同,导致通用系统难以实现。比如,当脊髓损伤患者试图用肌电控制设备完成“开门”动作时,同样的“握拳”指令,在甲患者前臂产生的肌电信号(sEMG)与乙患者的信号特征差异显著,就像用不同的密码试图解锁同一扇门。这种“用户依赖性”如同无形的屏障,让肌电控制技术在从实验室走向临床的路上步履维艰:现有系统在单一用户场景下对10种手势的识别准确率能轻松突破90%,但切换到“一人训练、多人使用”的通用模式时,准确率常暴跌至50%以下,成为假肢控制、辅助机器人等领域规模化应用的最大拦路虎。
 
传统研究多聚焦于算法优化,试图通过更复杂的模型“适配”个体差异,却始终难以突破“换用户就失效”的瓶颈。来自中国科学技术大学的张旭研究团队报告了题为“A Novel Instruction Gesture Set Determination Scheme for Robust Myoelectric Control Applications”的研究,提出的思路独辟蹊径:如果某些手势的肌电特征天生就“千人一面”、易于区分,那何不直接筛选这类手势作为指令集?就像选择全球通用的摩尔斯电码而非方言,从信号源头降低交互难度——这正是该研究为破解用户依赖性难题提供的全新视角。
 
 
图 1. 论文信息

研究方法
为验证新型指令手势集确定方案的有效性,研究团队设计了系统的实验流程(图2),涵盖数据库构建、方案实施与多维度验证三个核心环节。

 
 
图 2. 本研究的研究路线
 
数据库与受试者
研究采用两个高密度表面肌电(HD-sEMG)数据库开展验证,涵盖自主构建数据集与公开数据集,以确保结果的普适性。:
DB_U 数据库:由原文作者团队自主构建,包含11 名健康受试者数据,和 17 种针对人机交互需求设计的手势(涵盖腕关节和手指运动,见图3)。研究使用了 4 个电极阵列,采样率 1000Hz,带宽 20-500Hz,电极间距 8mm,分别采集右前臂肌群和肱肌肌群的表面肌电信号(见图4)。
实验要求受试者每个手势重复 8 次,两次重复间隔约 5 秒。
11 名受试者中的 7 人额外完成了 4 次数据采集试验。对于这 7 名受试者,5 次数据采集试验在不同时间进行。由于再次放置电极阵列时不可避免地会出现偏移,这 7 名受试者的数据可被视为包含电极偏移信息的数据,命名为 DB_U_EO,包含 7(受试者)×17(手势)×8(重复次数)×5(试验)=4760 段肌电数据。

 
 
图3. DB_U 数据库手势
 
 
图4. DB_U数据库的电极阵列及其放置位置
 
DB_Hyser_PR 数据库:源自开放数据库 Hyser 的子库,包含 34 种常见腕部和手指运动手势(比如多指协同动作,精细抓握等,见图5),数据来自 20 名健康受试者,采用 4 个 64 通道电极阵列(8×8 布局,电极间距 10mm)采集,其中 2 个阵列置于伸肌,2 个置于屈肌,采样率 2048Hz。每个手势重复 2 次,每次持续 4 秒。

 
 
图5. DB_Hyser_PR 数据库手势
 
数据预处理与样本生成
为确保信号质量并统一分析标准,对两个数据库的原始 sEMG 信号执行相同预处理流程:通过减去通道平均值消除基线漂移,替换极端值(绝对值超出均值 + 8 倍标准差),采用 20Hz 高通滤波去除运动伪影,最终通过整流提取信号包络。
研究者对预处理后的数据采用滑动窗口法生成样本:窗口长度设为 100 数据点,步长 50 数据点。
针对 DB_U 数据库,从每个手势重复段的第 2-3 秒提取有效样本,最终每个手势生成 19 个窗口样本,单受试者单手势单试验的样本量为 8(重复)×19(窗口)=152,样本维度为 128(通道)×100(数据点)。
针对 DB_Hyser_PR 数据库,基于 4 秒持续时长及 2048Hz 采样率,每个手势重复段生成 162 个窗口样本,单受试者单手势样本量为 2(重复)×162(窗口)=324,样本维度为 256(通道)×100(数据点)。
 
最优指令手势集确定方案
该方案的核心是通过量化手势间的可分离性筛选最优指令集。研究者采用 T 分布随机邻域嵌入(T-SNE)算法,将高维 sEMG 特征映射至二维空间。该方法通过构建高维空间中的概率分布(基于高斯核函数)与低维空间中的概率分布(基于 T 分布),最小化两者的 KL 散度,在保留数据局部结构的同时,拉大高维空间中距离较远的聚类距离,增强类间区分度。
对降维后的二维特征,遍历所有可能的两手势组合,计算两两手势组合的重叠度建立 “大规模手势重叠信息库”,记录每对组合的重叠度参数O。
基于重叠信息库,筛选最优指令集:
1.初始化候选集为空,从所有手势中选择与其他手势平均重叠度最低的手势加入候选集;
2.每次迭代时,选择新手势加入候选集,使得新增手势与候选集中所有已有手势的平均重叠度最小;
3.重复步骤 2 直至候选集规模达到预设值 N(N≥2),最终形成适用于用户独立模式的最优指令手势集。同时,随机选择相同数量的手势组成 “对照手势集”,用于后续性能对比。
 
本研究提取了最优(高可分离性)手势集和劣质(低可分离性)手势集以进行性能对比。对于特定规模的手势集,将重叠度参数 O 最小的 5 个手势组合确定为最优集,O 最大的 5 个组合确定为劣质集。针对 DB_U_UI,确定了包含 2 至 8 个手势的指令集;由于 DB_Hyser_PR 的数据量较大,仅确定了包含 2 至 4 个手势的指令集。
 
验证实验设计
用户独立模式:以部分受试者数据为训练集,其余为测试集(无交叉),对比最优集与劣等集的识别准确率。研究者使用 Bi-LSTM 和SVM作为分类器,并比较了两种分类器的分类准确度。
8 通道肌电样本:这 8 个通道从 128 通道中选取,对应与腕部和手指运动相关的肌肉,以探究从高密度表面肌电数据库中提取的最优指令手势集是否适用于低密度场景。
•电极偏移模式:对 DB_U 中 7 名受试者的 5 次重复采集数据(含电极重新放置导致的偏移)测试,采用 “跨试验” 验证:以第 1 次试验数据为训练集,第 2-5 次试验数据为测试集,对比两类手势集的识别准确率下降幅度,评估其对物理干扰的稳健性。

结果评估
T-SNE 降维提升手势可分离性可视化
图 6 显示了 T-SNE 降维后的二维特征分布:最优手势集中的手势(如腕伸、握拳)特征点聚类紧凑,重叠区域不足 5%;而劣等手势集(如轻捏、食指伸展)特征点交叉重叠达 30% 以上,直观证明了筛选方案的有效性。

 
 
图6. 两两手势集通过 T-SNE 得到的二维散点图:(a) DB_U_UI 中重叠度 O 最小(0.25%)的 G12-G16;(b) DB_U_UI 中重叠度 O 最大(58%)的 G13-G15;(c) DB_Hyser_PR 中重叠度 O 最小(12.25%)的 G14-G21;(d) DB_Hyser_PR 中重叠度 O 最大(67.25%)的 G1-G12
 
最优手势集和劣质手势集
研究者提取了最优(高可分离性)手势集和劣质(低可分离性)手势集以进行性能对比。对于特定规模的手势集,将重叠度参数 O 最小的 5 个手势组合确定为最优集,O 最大的 5 个组合确定为劣质集。DB_U_UI的 2 至 8 个手势的指令集,表1列出了其中部分手势的指令集,其中 N-G 表示包含 N 个手势的指令集;由于 DB_Hyser_PR 的数据量较大,仅确定了包含 2 至 4 个手势的指令集,见表2。

 
 
表1. DB_U_UI数据集的最优手势集和劣质手势集
 
 
表2. DB_Hyser_PR数据集的最优手势集和劣质手势集
 
最优手势集显著提升识别性能
在用户独立模式下,使用 支持向量机(SVM)和双向长短期记忆网络(Bi-LSTM)分别对DB_U_UI 和 DB_Hyser_PR 的高密度表面肌电样本来验证所提最优指令手势集确定方案的有效性。结果分别如表3和表4 所示,其中 “均值(Mean)” 和 “标准差(Std)” 通过对 5 个最优集或 5 个劣质集的准确率和标准差取平均计算得到。对于 DB_U_UI 和 DB_Hyser_PR,最优集的手势可分离性均显著优于劣质集(p<0.001)。
在 DB_U_UI 中,对比两种分类器的结果,SVM 在识别准确率上具有显著优势(p=0.027)。在 DB_Hyser_PR 中,尽管 SVM 和 Bi-LSTM 的识别准确率无显著差异(p=0.836),但 SVM 在标准差上更具优势(p<0.001)。

 
 
表3. DB_U_UI 中 128 通道样本的用户独立模式手势识别结果
 
 
表4. 针对DB_HYSER_PR的用户独立模式手势识别结果
 
对于8 通道肌电样本,最优集的手势可分离性仍优于劣质集(p<0.001,见表5)。最优集的平均准确率范围为 53.57%–94.72%,劣质集为 30.15%–72.48%,前者比后者高 17.70%–36.92%。对于 8 通道样本的手势识别,Bi-LSTM 分类器表现更优(p=0.012),尤其在劣质集的识别中。对比 128 通道和 8 通道样本的识别结果,尽管通道数量大幅减少,但最优集的识别准确率从 2 手势任务到 8 手势任务仅下降 2.14%–6.33%,表明提取的最优集适用于低密度场景。

 
 
表5. DB_U_UI 中 8 通道样本的用户独立模式手势识别结果
 
图7 显示了在电极偏移模式下,最优集准确率下降幅度(≤8%)显著低于劣等集(≥15%),证明其对物理干扰的稳定性。
 
 
图7. 在电极偏移模式下的实验识别结果
讨论与展望 
本研究提出的基于T-SNE的指令手势集确定方案,通过筛选高可分离性手势,在两个数据库中均显著提升了用户独立模式下的肌电识别性能,且对电极偏移具有较强鲁棒性,为解决肌电控制的用户依赖性提供了“从手势设计出发”的创新路径。但该研究仍存在一定不足,例如样本存在局限,受试者均为健康青年,未涵盖神经损伤或运动障碍人群,且手势集未包含复杂复合动作;方法上也存在限制,T-SNE对极端样本敏感,可能影响重叠度计算精度;场景方面也有局限,未结合实际设备(如假肢)的实时性需求验证方案效率。未来可从以下方面展开研究,一是扩展数据库,纳入更多人群(如中风患者、截肢者)和复杂手势,增强方案普适性;二是优化方法,结合深度学习(如自监督降维)提升特征映射精度,缩短筛选耗时;三是推动落地应用,将方案集成到肌电假肢、康复机器人等设备中,验证其在实际场景中的交互效果。
 
原文链接
Y. Ruan, X. Chen and X. Zhang, "A Novel Instruction Gesture Set Determination Scheme for Robust Myoelectric Control Applications," in IEEE Transactions on Biomedical Engineering, vol. 72, no. 3, pp. 909-920, March 2025.

DOI: 10.1109/TBME.2024.3479232.

研究团队介绍
该文章的作者为阮雨文、陈香和张旭,其中陈香为通讯作者,均来自中国科学技术大学信息科学技术学院。该团队长期专注于肌电信号处理、人机交互与康复工程领域,致力于推动肌电控制技术的临床转化与实际应用。
 
关于维拓启创
维拓启创(北京)信息技术有限公司成立于2006年,是一家专注于脑科学、康复工程、人因工程、心理学、体育科学等领域的科研解决方案供应商。公司与国内外多所大学、研究机构、企业长期保持合作关系,致力于将优质的产品、先进的技术和服务带给各个领域的科研工作者,为用户提供有竞争力的方案和服务,协助用户的科研工作,持续提升使用体验。

相关产品

 
 
相关文章 更多 >