news 2026/5/12 10:14:17

SMNet复合故障诊断用于工业机器人关节

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SMNet复合故障诊断用于工业机器人关节

论文标题:SMNet: A Novel Compositional Generalization Model for Industrial Robot Multijoint Fault Diagnosis

期刊:IEEE Internet of Things Journal (中科院一区)

DOI:10.1109/JIOT.2026.3652582

作者:胡小溪(清华大学/北京交通大学), 蒋程至(浙江财经大学), 彭丹丹(西北工业大学/香港理工大学), 陈祝云(广东工业大学/华南理工大学)

摘要

工业互联网场景中,机械设备往往会出现机器人多关节同时退化的复合故障,但现有研究多聚焦于单关节或低阶组合设定,导致模型在真实部署中面临关键难题——组合泛化:训练阶段仅覆盖正常/单关节/双关节等简单故障,测试阶段必须识别未见过的三关节、四关节等高阶组合故障。

为此,本文提出 StateMix Network (SMNet),以“保留单关节表征到跨关节组合诊断”为核心策略,构建多阶段端到端架构:Single-Joint Feature Extraction (SJFE) 提取关节私有特征;Attention-Guided Dilated Fusion (AGDF) 通过并行 Cascaded Dilated Convolution Blocks (CDCBs) 实现多尺度融合,并结合双路径注意力进行自适应重加权;最后采用基于 Mamba 的序列混合器建模长程跨关节依赖。在原位振动数据上,基于严格的 train-on-simple / evaluate-on-complex 实验设置,实验结果表明 SMNet 在宏平均 Precision/Recall/F1 上整体优于代表性基线,尤其在未见的三关节与四关节组合故障上表现更突出;消融与敏感性分析进一步验证了各模块的有效性。

关键词:组合泛化;复合故障诊断;深度学习;振动信号

1 引言

工业场景下,机械设备的关节在高频载荷下长期运行,磨损与故障不可避免;一旦异常,精度下降甚至导致产线停机。现实中诊断仍高度依赖停机人工排查,效率低、成本高,促使自动化智能诊断成为重要方向。

近年来,振动诊断从“特征工程 + 传统分类器”逐步转向端到端深度学习:模型直接从多通道时序数据中学习表征,并通过 CNN/LSTM、多尺度卷积、Transformer 等结构强化时序与长依赖建模能力。

现有方法多默认“单故障”或“低阶组合”设定,难以应对真实工况下的多关节同时退化。这带来核心难题——组合泛化:训练只见正常/单关节/双关节等简单模式,部署却要识别未见的三关节、四关节高阶组合;而组合空间指数增长,使全覆盖数据采集在工程上不可行。

为此,我们提出 StateMix Network (SMNet),以“先保留单关节表征,再做跨关节组合推理”为主线:先用 Single-Joint Feature Extraction (SJFE) 提取各关节私有特征,再用 Attention-Guided Dilated Fusion (AGDF) 做多尺度融合与重加权,最后通过 Mamba 建模长程跨关节依赖,从而将“由简单到复杂”的推断能力固化为端到端模型能力。

主要贡献

1. 提出 AGDF 颈部结构:并行 CDCBs 由输入/输出两侧的 Dual-Path Attention (DPA) 夹持,实现对关节原子特征的有效融合与自适应重加权,面向复合故障诊断更稳健。

2. 将 Mamba 作为本任务的序列混合器,高效捕获长程跨关节依赖,与 AGDF 协同构成适用于多关节组合诊断的特征处理框架。

3. 在原位振动数据上,采用严格的 train-on-simple / evaluate-on-complex 组合泛化设置进行系统评估,并通过消融与敏感性分析验证各核心模块的独立贡献与工程价值。

2 方法

2.1 问题定义

我们有多关节振动数据集:

其中输入样本为多通道时序窗口:

其中:

J 为关节数,M 为每关节传感器轴数,T 为窗口长度;

表示第 j 个关节的多轴信号。

标签为多标签故障向量:

目标是学习映射:

并在部署时对未见过的高阶组合故障仍能输出可靠预测:

2.2 总体框架

流程如下:

数据与实验:对每个通道进行标准化后输入网络;采用严格的 train-on-simple / evaluate-on-complex:

DatasetA:正常 / 单关节 / 双关节(训练与测试)

DatasetB:三关节 / 四关节(组合泛化测试)

模型流水线:SJFE → AGDF → Mamba Mixer → Head,输出每个关节的多标签故障概率。

2.3 SJFE:

为避免过早跨关节融合导致“单关节信息被稀释”,SJFE 对每个关节振动信号并行建模,先提取关节私有特征。

每个关节分支使用 ResCUM 单元,并以门控激活 Tanh-Sigmoid-Dropout (TSD) 形成稳定的关节表征:

2.4 AGDF

复合故障需要跨关节“组合模式”。AGDF 的目标是在不冲淡关节私有信息的前提下完成多尺度融合与重加权。

拼接:

Pre-DPA:双路径注意力 (CBAM1D + CSA)抑制冗余、突出关键证据。

CDCB:不同 dilation 捕获互补时间尺度,拼接形成融合特征。

Post-DPA:在融合后再次重加权,缓解多尺度融合可能引入的尺度/相位偏置,输出 AGDF 特征V。

2.5 Mamba Mixer

AGDF 提供局部与中程模式,但高阶组合故障通常依赖更长的时序证据与跨关节耦合。SMNet 使用 Mamba 作为序列混合器,以线性复杂度建模长程依赖。

2.6 Head 与损失

分类头输出每个关节的 logits,经 Sigmoid 得到多标签概率。训练采用多标签二元交叉熵 (BCE):

3 实验与结果

3.1 数据集

故障覆盖:本数据仅研究在 J1–J4 关节出现故障的情况;J5、J6 在所有样本中始终正常,因此本文不讨论包含 J5/J6 的复合故障。

样本构造:每个场景通过在原始连续信号中选取起点截取窗口得到样本;窗口长度 T = 2560,每关节 M = 3 轴,J = 6 关节,共 18 通道,单样本形状为 (2560, 18);每个定义场景生成 4000 个样本,保证场景间样本数均衡。

组合泛化实验设置 (train-on-simple / evaluate-on-complex):

DatasetA:正常 + 单关节 + 双关节 (用于训练/验证,并在简单组合上测试,记为 TestA)

DatasetB:三关节 (TestB3)与四关节 (TestB4)复合故障(仅用于组合泛化评估)

3.2 实验设置

硬件/软件:Intel Xeon Platinum 8352V (16 vCPUs)+ NVIDIA RTX 4090 (24GB);Ubuntu 22.04,Python 3.12,PyTorch 2.5.1,CUDA 12.4。

训练策略:最多 40 epochs;AdamW(lr=2e-3,weight decay=1e-4);余弦退火学习率,warm-up 预热占总步数 35%;以验证集 Macro-F1 选最优权重,early-stopping patience = 20。

3.3 Backbone 设计

在复合故障诊断中,一个核心工程问题是:多尺度时序上下文应当在骨干阶段“提前建模”,还是在专门的 neck 阶段“后置融合”。为验证该点,我们构建了替代骨干 Multi-Scale Joint Feature Extractor (MSJFE):在每个关节原始数据流上直接使用并行空洞卷积进行多尺度提取,随后拼接并由 DPA 自适应重加权,同时移除 AGDF 的其余块,使整体结构变为 “MSJFE backbone + Mamba + Head”,用于对比本文提出的 “SJFE backbone + AGDF neck + Mamba + Head”。

在保持 相同的 Mamba、相同的 Head、相同训练策略的前提下,将多尺度算子“前移”到骨干会导致复杂度显著膨胀(7.091M vs 0.868M 参数;13437.63 vs 426.23 MFLOPs),但在所有测试集上性能均下降,且在组合泛化测试集(TestB3/TestB4)上差距更明显。

进一步地,为隔离“关节独立骨干”这一因素,我们构建了三种 shared-backbone 变体 (Shared ResCUM / Shared ResNet / Shared CNN):在六个关节间共享同一特征提取器,同时保持 AGDF、Mamba 与 Head 不变。尽管这些模型的参数量与 SJFE 相近甚至更低,但在最困难的 TestB4 上的 F1 明显落后,表明:共享一个通用骨干不足以学习不同关节的差异;相反,SJFE 的关节并行分支能够更好地保留关节私有表征,为后续的跨关节组合推理提供更可靠的“可组合基元”。

3.4 敏感性分析

为评估关键超参数对组合泛化性能的影响,我们对 Mamba mixer 的两项配置(Mamba Layers 和 Embedding Dimension)进行敏感性分析。对每组配置均按统一训练流程训练完整 SMNet,并在 TestB3 与 TestB4 上报告 F1 与宏平均 Recall。

3.5 消融实验

3.5.1 AGDF 注意力策略:两阶段双路径 DPA 的必要性

我们首先分析 AGDF neck 中 DPA 的设计。无论将单一路径注意力(仅 CBAM1D 或仅 CSA)放置在融合前或融合后,虽然在 TestB3 上仍可获得较高精度,但在 TestB4 上的 F1 明显低于完整 SMNet。这说明:面对四关节未见组合时,仅依赖单一路径/单阶段重加权难以兼顾“证据选择”与“上下文保留”。

进一步地,Pre-DPA only / Post-DPA only / No DPA 在 TestB3 上差距有限,但在 TestB4 上均显著弱于两阶段 DPA,且其参数量与计算量与完整 SMNet 同量级,并不存在明显的计算收益。移除多尺度 CDCBs 仅保留 DPA(DPA only)会导致 TestB3/TestB4 明显退化,表明:多尺度时序上下文是高阶组合诊断的必要条件,DPA 不能替代多尺度建模。同时,用更简单的 SE 替代 DPA 也无法达到两阶段双路径 DPA 的效果,说明本文的 DPA 设计具有更强的重加权能力与稳定性。

3.5.2 序列模块消融:Mamba 的优势体现在更稳的 Recall

除 AGDF 外,序列模块决定了模型能否在完整时间窗内整合跨关节证据。我们将 SMNet 中的 Mamba mixer 替换为多种代表性结构 (Transformer、DLinear、FreTS、TimesNet、TCN、LSTM、1DCNN),其余组件保持不变。在相近的参数量与 MFLOPs 下,Mamba 在 TestB3/TestB4 上均取得更优的综合表现,尤其在更难的 TestB4 上保持更高的 Recall,从而带来更高 F1。相对而言,一些更“局部”的结构 (如 1DCNN/TCN)更容易出现“高精度、低召回”的形态,反映其更可能学习训练集中简单组合的快捷模式,遇到未见组合时漏检显著增加。

3.6 对比实验

我们在统一训练协议下,将 SMNet 与多种故障诊断代表模型进行对比,包括 WDCNN、TICNN、SRDCNN、CNN-LSTM、MSMCNN 与 MJAR。

在简单组合测试 TestA 上,SMNet 取得最高的 F1,说明其对常规故障模式具有更强的判别能力。更关键的是,在组合泛化测试中,SMNet 的优势进一步扩大:大量基线在 TestB3/TestB4 上呈现“精度接近饱和但召回显著下降”的趋势,这意味着模型更倾向于只识别训练中最典型的故障模式,而在未见组合上出现系统性漏检;相比之下,SMNet 能在 TestB4 上维持更高的 Recall,从而保持更高的 F1。与最强基线 MJAR 相比,SMNet 的改进主要体现在未见组合上的 Recall:其结构差异在于 SMNet 使用两阶段双路径 DPA 在融合前后同时实现“选择 + 保留”的互补重加权,并通过 Mamba 进一步整合长程跨关节依赖,使弱但关键的关节证据不易在融合与长窗建模中被淹没。

4. 结论

本文围绕多关节复合故障诊断中的关键难点——组合泛化展开:模型训练仅覆盖正常/单关节/双关节等简单故障,却需在部署时识别未见过的三关节、四关节高阶组合。为此,我们提出SMNet,以“先保留关节私有表征,再进行跨关节组合推理”为核心设计原则,构建了从单关节表征到全局状态推断的递进式诊断流程。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 10:12:45

项目介绍 MATLAB实现基于CNN-BiGRU卷积神经网络结合双向门控循环单元进行锂电池SOC估计(含模型描述及部分示例代码)专栏近期有大量优惠 还请多多点一下关注 加油 谢谢 你的鼓励是我前行的动

MATLAB实现基于CNN-BiGRU卷积神经网络结合双向门控循环单元进行锂电池SOC估计的详细项目实例 请注意此篇内容只是一个项目介绍 更多详细内容可直接联系博主本人 或者访问对应标题的完整博客或者文档下载页面(含完整的程序,GUI设计和代码详解&#xff…

作者头像 李华
网站建设 2026/5/12 10:10:10

GaN功率器件EMI挑战与实战解决方案:从原理到测量

1. 氮化镓技术:一场静悄悄的效率革命如果你是一位电源工程师、射频工程师,或者任何需要和高速开关电路打交道的硬件开发者,那么最近几年,一个词一定频繁地出现在你的视野里:氮化镓,也就是GaN。它不再仅仅是…

作者头像 李华
网站建设 2026/5/12 10:09:12

答辩前夜别硬熬!paperxie 用 AI 把你的论文变成拿得出手的 PPT

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPThttps://www.paperxie.cn/ppt/createhttps://www.paperxie.cn/ppt/create 毕业季的深夜,电脑屏幕的蓝光映着你通红的眼睛。论文终于定稿,却卡在了答辩 PPT 这一关。三五万字的…

作者头像 李华
网站建设 2026/5/12 10:07:50

AI时代前端自动化代码审查引擎:原理、实践与价值

1. 项目概述:一个面向AI时代的自动化前端代码审查引擎如果你是一名前端开发者,或者正在管理一个快速迭代的前端团队,那么“代码审查”这个词对你来说一定不陌生。它既是保证代码质量的最后一道防线,也常常是开发流程中最耗时的环节…

作者头像 李华