news 2026/6/10 13:40:05

基于SHAP可解释性AI的支持向量机和K近邻工业轴承故障诊断特征贡献分析(Python,jupyter nootbook文件)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于SHAP可解释性AI的支持向量机和K近邻工业轴承故障诊断特征贡献分析(Python,jupyter nootbook文件)

首先加载包含23个时域和频域特征的模拟振动数据集,这些特征模拟了真实轴承在健康、内圈故障、外圈故障和滚动体故障等不同状态下的振动特性。算法通过t-SNE降维技术可视化高维特征空间的数据分布,展示不同故障类型在二维空间的聚类情况。接着,算法构建并优化两个分类模型——支持向量机(SVM)和K近邻(kNN),采用网格搜索交叉验证方法分别寻找最优的超参数组合(如SVM的核函数与正则化参数C,kNN的邻居数K),确保模型在训练集上达到最佳分类性能。然后,算法利用SHAP(Shapley Additive exPlanations)可解释性框架,通过核解释器计算每个特征对模型预测的贡献值,从合作博弈论的角度量化各特征在故障分类决策中的重要性。最后,算法生成两类可视化结果:一是SHAP特征重要性汇总图,以点云分布形式展示每个特征值大小与SHAP值的关系;二是特征重要性条形图,按平均绝对SHAP值排序显示前10个关键特征,从而直观揭示SVM和kNN模型在不同故障类别分类决策中依赖的核心特征及其影响方向。

详细算法步骤

数据准备与特征选择:加载模拟轴承振动数据集,从中提取23个预先定义的时域和频域特征作为模型输入,这些特征包括偏度、峭度、形状因子等关键诊断指标,对应文献中所述的轴承故障敏感特征。

数据可视化与探索:对标准化后的特征数据应用t-SNE降维算法,将高维特征空间映射到二维平面,生成散点图以观察不同故障类型(健康、内圈故障、外圈故障、滚动体故障)的数据分布与聚类情况,初步评估特征的可分性。

分类模型构建与训练:分别建立支持向量机(SVM)和K近邻(kNN)分类模型,采用流水线方式整合数据标准化与分类器。使用网格搜索结合5折交叉验证,在训练集上优化SVM的核函数类型、正则化参数C以及kNN的邻居数K,以准确率为评价指标选择最优超参数组合。

模型可解释性分析:利用SHAP(Shapley加性解释)框架,基于合作博弈论原理,通过核解释器分别计算SVM和kNN模型中每个特征对各类别预测结果的贡献值(SHAP值)。SHAP值量化了特征对单个样本预测结果相对于基线(平均预测)的影响大小与方向。

特征重要性可视化:生成两类可视化图表:一是SHAP汇总图,用散点展示每个样本的特征值(颜色)与对应SHAP值(水平位置)的关系,揭示特征如何影响各类别的预测概率;二是特征重要性条形图,按平均绝对SHAP值排序展示前10个最重要的特征,直观比较不同特征对SVM和kNN模型决策的总体贡献程度。

诊断结果解读与应用:基于SHAP分析结果,识别对轴承故障分类最具判别力的关键特征(如偏度、形状因子等),解释这些特征在物理意义上如何反映不同故障类型的振动特性,从而为工业现场轴承状态监测提供可解释的故障诊断依据,并指导特征工程的优化方向。

参考文章:

基于SHAP可解释性AI的支持向量机和K近邻工业轴承故障诊断特征贡献分析(Python,jupyter nootbook文件) - 哥廷根数学学派的文章
https://zhuanlan.zhihu.com/p/1998401433163294662

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 9:55:49

数字化转型下零售门店管理软件的功能与选择考量

在实体零售朝着数字化转变这一潮流里,门店管理软件变成了商家为提高运营效率、优化顾客体验而使用的关键工具。这种软件一般整合了进销存管理、收银支付、会员营销、多渠道订单处理等各项功能,目的是协助商家达成业务流程的在线化以及数据化。当下市场上…

作者头像 李华
网站建设 2026/6/10 9:53:44

JBoltAI网关:Java企业级AI的稳定“交通枢纽”

在Java企业级AI应用开发里,AI请求的高效处理与稳定传输至关重要。JBoltAI框架的AI路由网关,凭借统一接入、智能路由、负载均衡和熔断降级等功能,为Java开发搭建起可靠的“交通枢纽”。统一接入:简化流程,提升效率在企业…

作者头像 李华
网站建设 2026/6/10 9:44:39

Xcode中iOS资源混淆问题与解决方案详解

iOS 资源混淆 概述 XCode项目中的文件夹分成两类: group 和 directory reference, 分别是虚结构和实结构. 黄色的 group 是默认的格式, 它的结构和磁盘上的文件夹毫无关系, 仅仅表示资源的逻辑组织结构, 这在管理源文件是非常方便. 同一段代码可以被很多项目使用, 也可能只使…

作者头像 李华
网站建设 2026/6/10 9:53:59

Git代码规范

分支命名分支与环境对应关系( 1 ) type(必须) : commit 的类别,只允许使用下面几个标识:常用的提交类型包括提交类型描述示例feat新功能增加(feature)feat: add user login featurefix修复BUGfix: correct …

作者头像 李华
网站建设 2026/6/10 9:56:45

嵌入式 C++ 高性能流式架构的设计

嵌入式 C 高性能流式架构的设计 摘要:在算力受限的嵌入式 SoC 平台上,高带宽传感器数据的实时处理是一个挑战。传统的基于多线程与操作系统原语的架构,往往受限于调度抖动、内存拷贝开销及锁竞争。 本文提出了一种平台无关的**“流式架构&am…

作者头像 李华