news 2026/4/18 6:12:29

基于小波核卷积与动态路由胶囊网络的旋转机械故障诊断方法(Pytorch)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于小波核卷积与动态路由胶囊网络的旋转机械故障诊断方法(Pytorch)

首先从西储大学轴承数据库中加载三种健康状态的振动信号数据(正常、滚珠故障、内圈故障),对原始长信号进行分割、标准化预处理,并按比例划分为训练集和测试集。然后构建小波胶囊网络模型,该模型的核心是小波核卷积层,它使用可训练的Laplace小波核替代传统卷积核,能够从振动信号中提取具有物理意义和可解释性的时频特征;特征经过多层卷积和池化后,输入到胶囊层进行特征聚类,胶囊层采用动态路由算法对特征进行编码,每个胶囊代表一个故障类别的存在概率和特征参数。模型训练阶段使用交叉熵损失函数和Adam优化器,通过反向传播算法更新网络参数,同时采用学习率衰减策略优化训练过程。训练完成后,在测试集上评估模型性能,计算准确率、精确率、召回率等指标,并生成混淆矩阵和分类报告。最后,系统通过多种可视化方法展示模型的可解释性,包括可视化学习到的小波核形状、展示特征图、对比不同故障类别的特征提取效果,以及分析胶囊层的输出概率,从而验证模型从振动信号中学到的特征与故障机理之间的关联性,提高了诊断结果的可信度和可解释性。

第一步:数据准备与预处理

首先从西储大学轴承数据库中加载三种健康状态的振动信号数据文件,包括正常轴承信号、滚珠故障信号和内圈故障信号。对每个长振动信号按照设定的窗口长度和重叠率进行分割,生成固定长度的信号样本片段。对分割后的所有样本进行Z-score标准化处理,使数据均值为0、标准差为1,以加速模型收敛并提高训练稳定性。然后将标准化后的数据随机打乱顺序,按照预设的比例划分为训练集和测试集,确保训练集和测试集中的各类别样本分布均衡。

第二步:构建小波胶囊网络模型

创建小波胶囊网络模型结构,该模型由特征提取器和分类器两部分组成。特征提取器的第一层采用小波核卷积层,使用可训练的Laplace小波函数作为卷积核,这些小波核具有不同的中心频率和阻尼参数,能够从振动信号中提取具有物理意义的时频特征。特征提取器还包括多层传统卷积层、批归一化层、ReLU激活函数和最大池化层,用于进一步提取深层特征并进行特征降维。提取的特征经过重塑后输入到胶囊层,胶囊层采用动态路由算法对特征进行聚类和编码,每个胶囊代表一个故障类别的存在概率和姿态参数,通过Squash激活函数将胶囊向量长度压缩到0-1之间表示概率。最后通过全连接层将胶囊输出转换为最终的故障类别预测。

第三步:模型训练与优化

初始化模型的所有参数,设定训练的超参数如批量大小、学习率、训练轮数等。使用交叉熵损失函数作为优化目标,选择Adam优化器进行参数更新,并设置学习率衰减策略以在训练后期微调参数。训练过程中,每个epoch依次从训练集中取出批次数据,进行前向传播计算预测结果和损失值,然后通过反向传播算法计算梯度,使用优化器更新网络参数。记录每个epoch的训练损失和准确率,定期在测试集上评估模型性能,监控模型的泛化能力,防止过拟合现象的发生。

第四步:模型评估与性能分析

在训练完成后,使用独立的测试集对模型进行全面评估。计算模型在测试集上的总体准确率,以及每个故障类别的精确率、召回率和F1分数,生成详细的分类报告和混淆矩阵。通过混淆矩阵分析模型的错误类型,识别是否存在特定类别的混淆问题。同时分析训练过程中损失和准确率的变化趋势,评估模型的学习效率和收敛稳定性,确保模型达到了预期的性能要求。

第五步:可解释性分析与可视化

为了增强模型的透明度和可信度,进行多方面的可解释性分析。首先可视化学习到的小波核形状,观察这些核函数是否具有合理的时频特性。然后选择代表性的振动信号样本,展示小波核卷积层提取的特征图,分析特征提取的过程和效果。接着可视化胶囊层的输出概率,观察不同故障类别对应的胶囊激活情况。最后进行可解释性对比分析,展示不同故障类别的振动信号经过模型处理后得到的特征差异,验证模型学到的特征与故障物理机理之间的关联性,提高诊断结果的可解释性和可信度。

模型性能优异:

训练效率高:仅训练5个epoch就达到99.30%的测试准确率,10个epoch达到100%准确率

收敛速度快:训练损失从1.04迅速下降到0.03,说明模型学习能力强

泛化能力好:在测试集上达到100%准确率,没有过拟合现象

类别平衡性好:三个类别(正常、滚珠故障、内圈故障)都达到100%的识别率

数据分布分析:

样本数量:共706个样本,其中正常471个,滚珠故障118个,内圈故障117个

数据划分:训练集564个(80%),测试集142个(20%)

类别不平衡:正常样本远多于故障样本,但模型仍能很好地区分

模型特点:

参数规模适中:33,747个参数,既不是过大导致过拟合,也不是过小导致欠拟合

特征提取能力强:从振动信号中提取了有效的特征

胶囊网络优势:胶囊层能够更好地建模特征之间的空间关系

训练过程分析:

快速收敛:第1个epoch损失就显著下降

稳定学习:后续epoch持续优化,损失稳步下降

优异表现:最终达到完美的分类效果

参考文章:

基于小波核卷积与动态路由胶囊网络的旋转机械故障诊断方法(Pytorch) - 哥廷根数学学派的文章
https://zhuanlan.zhihu.com/p/1983488609760846023

工学博士,担任《Mechanical System and Signal Processing》审稿专家,担任
《中国电机工程学报》优秀审稿专家,《控制与决策》,《系统工程与电子技术》,《电力系统保护与控制》,《宇航学报》等EI期刊审稿专家。
擅长领域:现代信号处理,机器学习,深度学习,数字孪生,时间序列分析,设备缺陷检测、设备异常检测、设备智能故障诊断与健康管理PHM等。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 12:10:26

基于神经微分方程和对比学习的长短期多分支自编码器机械故障诊断算法(Pytorch)

算法首先通过滑动窗口技术将原始振动时序数据分割成固定长度的片段,然后利用基于神经随机微分方程NSDE的编码器对数据进行深度特征提取,捕捉时间序列的随机动态特性。接着通过长短期多分支自编码器LST-AE对特征进行重构学习,分别提取数据的长…

作者头像 李华
网站建设 2026/4/18 11:27:48

Qwen2.5-0.5B应用场景:JSON生成自动化实操

Qwen2.5-0.5B应用场景:JSON生成自动化实操 1. 为什么小模型也能干好JSON生成这件事? 你可能第一反应是:0.5B(5亿参数)的模型,能胜任结构化数据生成这种“精细活”吗?毕竟JSON对格式、嵌套、字…

作者头像 李华
网站建设 2026/4/18 11:03:25

医疗场景专用?用热词功能提升行业词汇识别准确度

医疗场景专用?用热词功能提升行业词汇识别准确度 在医院查房、手术记录、病历整理、远程问诊等实际医疗工作中,语音转文字工具正成为医生和医技人员的“数字助手”。但普通语音识别模型常把“CT增强扫描”听成“CT曾强扫描”,把“病理切片”…

作者头像 李华
网站建设 2026/4/18 10:58:31

3步突破显卡性能瓶颈:DLSS版本升级工具深度评测

3步突破显卡性能瓶颈:DLSS版本升级工具深度评测 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 在4K分辨率游戏场景中,许多玩家面临显卡性能不足导致的画质模糊与帧率波动问题。这种现象本质上是…

作者头像 李华
网站建设 2026/4/17 23:06:42

开发者必看:Z-Image-Turbo WebUI五大核心功能使用技巧实战推荐

开发者必看:Z-Image-Turbo WebUI五大核心功能使用技巧实战推荐 1. 初识Z-Image-Turbo:不止是“快”,更是“稳准狠”的图像生成新体验 阿里通义Z-Image-Turbo WebUI不是又一个参数堆砌的AI画图工具,而是面向开发者和专业创作者打…

作者头像 李华
网站建设 2026/4/18 8:39:34

Z-Image-ComfyUI实战教程:Jupyter一键启动生成中文图文

Z-Image-ComfyUI实战教程:Jupyter一键启动生成中文图文 1. 为什么这个文生图模型值得你花10分钟试试? 你有没有遇到过这些情况: 想快速做个带中文标题的电商海报,但Midjourney不支持中文排版; 用Stable Diffusion生成…

作者头像 李华