news 2026/6/10 18:04:20

YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

论文介绍

摘要

视觉注意力网络(VAN)中的大核注意力(LKA)模块已被证明在一系列视觉任务中表现出卓越性能,甚至超越视觉变换器(ViTs)。然而,LKA模块中的深度卷积层在卷积核尺寸增大时,计算量和内存占用呈二次方增长。为缓解这一问题,并支持在VAN的注意力模块中使用极大卷积核,本文提出了一种大分离核注意力模块(LSKA)。LSKA将深度卷积层的二维卷积核分解为级联的水平与垂直一维核。相比标准LKA设计,该分解方法可直接在注意力模块中使用大核深度卷积层,无需额外模块。
实验表明,VAN中提出的LSKA模块在性能上与标准LKA模块相当,同时降低了计算复杂度和内存占用。研究还发现,随着核尺寸增大,LSKA设计使VAN更倾向于关注物体形状而非纹理。此外,本文首次在ImageNet的五种损坏版本数据集上系统评估了VAN中的LKA与LSKA、ViTs及近期ConvNeXt的鲁棒性。
大量实验结果表明,随着核尺寸增大,VAN中的LSKA模块显著降低了计算复杂度和内存占用,同时在物体识别、检测、语义分割及鲁棒性测试中优于ViTs和ConvNeXt,并与VAN中的LKA模块性能相当。

文章地址:论文地址

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 13:35:16

恶意代码演变:AI 生成的多态恶意软件与免杀技巧

⚠️ 免责声明 本文仅用于网络安全技术交流与学术研究。文中涉及的技术、代码和工具仅供安全从业者在获得合法授权的测试环境中使用。任何未经授权的攻击行为均属违法,读者需自行承担因不当使用本文内容而产生的一切法律责任。技术无罪,请将其用于正途。…

作者头像 李华
网站建设 2026/6/10 8:12:53

基于深度学习YOLO26算法的智慧电力与智慧工业钢缆缺陷检测 电缆散股检测钢丝绳断裂缺陷检测 深度学习图像识别第10463期

计算机视觉数据集说明 往期热门主题 主页搜两字"关键词"直达 代码数据获取: 获取方式:***文章底部卡片扫码获取***. 覆盖了YOLO相关项目、OpenCV项目、CNN项目等所有类别, 覆盖各类项目场景: 项目名称项目名称基于Y…

作者头像 李华
网站建设 2026/6/10 8:14:33

C++可变模板参数详细讲解

先给你一句终极人话(背下来,这就是全部)Args 你随便起的一个名字,跟 int a 里的 a 一样,想改成 ABC、Params、Shit 都行,没有任何魔法。... 只有两个功能:打包、拆包写在左边:...A…

作者头像 李华
网站建设 2026/6/10 8:14:34

【图像处理相关毕设选题选题指导】2026新颖优质选题推荐

目录 前言毕设选题更多帮助选题迷茫选题的重要性最后前言 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说…

作者头像 李华