news 2026/4/18 3:34:46

即插即用系列 | ICCV 2025 LEGNet:基于边缘-高斯聚合的轻量级遥感检测网络

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
即插即用系列 | ICCV 2025 LEGNet:基于边缘-高斯聚合的轻量级遥感检测网络

论文名称:LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection

论文原文 (Paper):https://arxiv.org/abs/2503.14012
代码 (code):https://github.com/AeroVILab-AHU/LEGNet


GitHub 仓库链接(包含论文解读及即插即用代码):https://github.com/AITricks/AITricks
哔哩哔哩视频讲解:https://space.bilibili.com/57394501?spm_id_from=333.337.0.0

目录

  • [CVPR/arXiv 2025] LEGNet 论文精读:传统算子“复活”!边缘与高斯驱动的轻量级遥感目标检测网络
      • 1. 核心思想(3–5句话)
      • 2. 背景与动机
        • 2.1 背景与痛点
        • 2.2 动机图解分析
      • 3. 主要创新点
      • 4. 方法细节(核心干货)
        • 4.1 整体网络架构
        • 4.2 核心模块 A:LEG Module (Lightweight Edge-Gaussian Module)
        • 4.3 核心模块 B:EGA Module (Edge-Gaussian Aggregation)
        • 理念与机制总结
      • 5. 即插即用模块的作用
      • 6. 实验简单分析
      • 7. 获取即插即用代码关注 【AI即插即用】

[CVPR/arXiv 2025] LEGNet 论文精读:传统算子“复活”!边缘与高斯驱动的轻量级遥感目标检测网络

论文标题:LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection


1. 核心思想(3–5句话)

本文针对遥感图像中常见的低质量问题(如低分辨率、运动模糊、阴影遮挡等),提出了一种轻量级骨干网络LEGNet。其核心创新在于设计了Edge-Gaussian Aggregation (EGA)模块,巧妙地结合了传统图像处理的先验知识:在浅层网络利用Scharr 算子锐化边缘以对抗模糊,在深层网络利用高斯先验 (Gaussian Prior)抑制噪声并增强特征显著性。这种“显式算子引导 + 隐式特征学习”的策略,使得模型在极低的参数量下,能够从退化图像中稳健地提取判别性特征。


2. 背景与动机

2.1 背景与痛点

遥感目标检测(RSOD)面临的最大挑战不仅仅是尺度变化,更在于成像质量的退化。传感器噪声、大气干扰、运动模糊以及光照不足(如阴影区域)会导致:

  1. 对比度降低:前景与背景难以分离。
  2. 结构断裂:关键的边缘信息丢失。
  3. 特征响应模糊:深度特征难以聚焦目标中心。
    现有的方法(如 LSKNet, PKINet)虽然在多尺度方面做得很好,但往往忽略了针对“低质量特征”的显式增强,且轻量化模型通常难以保留微弱的细节。
2.2 动机图解分析

看图说话:

  • 对比现状:请观察图中的红色虚线框区域。在面对树木遮挡(第一行)和建筑物阴影/低光照(第二行)等极端情况时,强大的基线模型如 ResNet-50、ARC-R50 甚至专门设计的 PKINet-S 都出现了严重的漏检 (Missing)。这说明现有网络在特征模糊或信噪比低时,特征提取能力失效。
  • 本文优势:最右侧的LEGNet-S在同样恶劣的条件下,成功检测出了被遮挡的车辆和阴影中的目标。
  • 核心引出:这直接证明了单纯堆叠卷积层是不够的,我们需要引入一种机制,能够主动地去“锐化”边缘、“提亮”特征,这就是本文提出 EGA 模块的直接动机。

3. 主要创新点

  1. EGA (Edge-Gaussian Aggregation) 模块:创新性地将传统图像处理算子引入深度网络。浅层使用方向感知的 Scharr 滤波器提取边缘,深层使用高斯核进行特征建模,有效对抗图像退化。
  2. LoG-Stem 层:在网络入口处设计了基于“高斯-拉普拉斯算子 (LoG)”的 Stem 层,替代传统的卷积 Stem,在初始阶段就实现了噪声抑制与边缘增强的双重功效。
  3. LEGNet 轻量级架构:构建了一个高效的四阶段骨干网络,在参数量显著低于 ResNet-50(仅约 1/3甚至更少)的情况下,在 DOTA、VisDrone 等数据集上取得了 SOTA 性能。
  4. 分层处理策略:提出了“浅层重边缘,深层重语义(高斯)”的宏观设计理念,避免了在深层强行提取边缘导致的特征冗余和干扰。

4. 方法细节(核心干货)

4.1 整体网络架构

数据流解析:

  • Input:输入图像I II
  • LoG-Stem:图像首先经过 LoG-Stem 层。这里利用 LoG 滤波器(高斯平滑+拉普拉斯边缘检测)进行下采样,输出1 / 4 1/41/4分辨率的特征图,能够有效过滤高频噪声并保留边缘。
  • 4-Stage Pyramidal Structure
    • Stage 1:处理1 / 4 1/41/4分辨率特征。包含N 1 N_1N1LEG Block关键点:此阶段侧重于边缘提取。
    • Stage 2-4:分别处理1 / 8 , 1 / 16 , 1 / 32 1/8, 1/16, 1/321/8,1/16,1/32分辨率特征。通过DRFD 模块进行下采样,随后堆叠LEG Block关键点:这些阶段侧重于高斯特征建模。
  • Output:输出多尺度特征金字塔,送入检测头(如 Oriented R-CNN)。

4.2 核心模块 A:LEG Module (Lightweight Edge-Gaussian Module)

模块拆解:
这是 LEGNet 的基本构建单元,设计非常精简:

  1. 输入:特征F i n F_{in}Fin
  2. EGA 处理:输入首先通过EGA 模块(核心中的核心,见下文),得到增强后的特征F e g a F_{ega}Fega
  3. ECA 注意力:为了突出关键通道,F e g a F_{ega}Fega经过 GAP(全局平均池化)和 1D 卷积(ECA 策略),生成通道权重。
  4. 特征重加权:将通道权重作用于F e g a F_{ega}Fega,并与原始输入F i n F_{in}Fin进行残差连接和归一化,得到输出。
    设计目的:在极低的计算成本下,通过 EGA 注入先验知识,并通过 ECA 筛选关键通道信息。

4.3 核心模块 B:EGA Module (Edge-Gaussian Aggregation)

设计拆解与工作机制:
这是本文的灵魂所在,它包含一个条件分支选择机制

  • 分支 1:Edge Extraction (用于 Stage 1)

    • 操作:使用固定的Scharr 算子(比 Sobel 旋转不变性更好)分别计算 X 和 Y 方向的梯度,然后合成边缘图A e d g e A_{edge}Aedge
    • 目的:在浅层,特征分辨率高,显式的边缘信息能帮助网络在模糊图像中“看清”物体轮廓。
  • 分支 2:Gaussian Modeling (用于 Stage 2-4)

    • 操作:使用固定的高斯卷积核对特征图进行平滑处理,得到A g a u s s A_{gauss}Agauss
    • 目的:在深层,分辨率降低,边缘不再清晰,特征呈现“斑点状”分布。高斯核能抑制背景噪声,强化目标中心的响应(类似 Heatmap),解决特征响应微弱的问题。
  • 特征融合

    • 将提取的先验特征(边缘或高斯图)加回到输入特征上。
    • 通过一个轻量级的Conv Block进行特征变换。
    • 最后通过Sigmoid生成权重图,对原始特征进行空间加权(Element-wise Multiplication)
理念与机制总结

LEGNet 的哲学是“Prior-Guided Feature Refinement” (先验引导的特征细化)
作者认为,与其让网络从零开始学习如何对抗模糊和噪声,不如直接把“去噪”和“边缘增强”的数学算子(LoG, Scharr, Gaussian)硬编码到网络中。

  • 浅层:网络需要“眼镜”看清轮廓→ \rightarrow引入 Scharr 算子。
  • 深层:网络需要“聚光灯”找到物体核心→ \rightarrow引入高斯核。
    这种设计不仅计算量极小(算子参数固定,不需要训练),而且物理意义明确,极大地提高了模型在低质量图像上的鲁棒性。

5. 即插即用模块的作用

本论文提出的模块具有很强的通用性,适用于以下场景:

  1. LoG-Stem 层

    • 适用场景:任何对噪声敏感的视觉任务(如夜间检测、雨雾天检测)。
    • 用法:可以直接替换 ResNet、VGG 等标准骨干网络的第一层7 × 7 7\times77×7卷积,能显著提升初始特征的纯净度。
  2. EGA 模块 (Edge-Gaussian Aggregation)

    • 适用场景轻量化模型设计低质量图像增强
    • 用法:可以作为一种 Attention 机制插入到现有 CNN 的 Block 中。如果你做的是无人机航拍(运动模糊多)或卫星遥感(分辨率低),在浅层插入 Scharr 分支,在深层插入 Gaussian 分支,往往能带来涨点。

6. 实验简单分析

  • DOTA-v1.0 SOTA
    • LEGNet-S (Small版本) 达到了80.03% mAP,这是单尺度训练下首次突破 80% 大关的轻量级模型,甚至超过了 ResNet-50 和专门设计的 ARC-R50。
    • LEGNet-T (Tiny版本) 仅用3.6M的参数量就达到了78.96% mAP,性价比极高。
  • 鲁棒性验证
    • 在 VisDrone2019(无人机视角,小目标极多)上,LEGNet-S 达到了32.2% AP,在小目标 (A P s AP_sAPs) 上比基线提升了 2.1%,证明了其对微弱特征的捕捉能力。
  • 消融实验
    • 去掉 LoG-Stem 掉点,去掉 EGA 掉点更为严重。
    • 有趣的是,如果只用 Edge 分支或者只用 Gaussian 分支,效果都不如“浅层Edge+深层Gaussian”的组合好,验证了作者“分层处理”理念的正确性。

到此,所有的内容就基本讲完了。如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

7. 获取即插即用代码关注 【AI即插即用】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:02:02

JoyAgent-JDGenie系统流程图

系统流程图 📌 查看流程图说明 本文档使用 Mermaid 语法绘制流程图。如果流程图无法正常显示,请使用以下方式查看: VS Code: 安装 “Markdown Preview Mermaid Support” 扩展 GitHub/GitLab: 直接查看,自动支持 Mermaid 在线编辑器: 访问 Mermaid Live Editor 复制代码查…

作者头像 李华
网站建设 2026/4/12 19:05:57

不需要下载夸克直链网盘下载-在线免费工具

2025年12月最新今天教大家一招能解决夸克网盘限制的在线工具。这个工具也是完全免费使用的。下面让大家看看我用这个工具的下载速度咋样。地址获取:放在这里了,可以直接获取 这个速度还是不错的把。对于平常不怎么下载的用户还是很友好的。下面开始今天的…

作者头像 李华
网站建设 2026/4/15 15:39:42

53、STREAMS 流处理机制深度解析

STREAMS 流处理机制深度解析 1. I_PUSH 操作 I_PUSH 是 strioctl 的一部分,其主要作用是将模块推入流中。以下是其详细处理流程: 1. 资源检查 :检查 STREAMS 内存和已推入模块的数量,如果出现错误则直接返回。 2. 模块名称检查 :确认模块名称是否存在于 fmodsw 中…

作者头像 李华
网站建设 2026/4/9 17:22:31

8、C++算法与数据结构实用案例解析

C++算法与数据结构实用案例解析 在C++编程中,算法和数据结构是核心内容,它们能帮助解决各种实际问题。本文将介绍多个实用算法和数据结构的实现,包括电话号码规范化、字符串排列生成、电影平均评分计算、配对算法、压缩算法、选择算法、排序算法以及图中最短路径查找等,同…

作者头像 李华
网站建设 2026/4/16 11:20:29

58、深入理解信号量:原理、使用与实现

深入理解信号量:原理、使用与实现 1. 信号量控制命令 信号量的操作通过一系列控制命令实现,这些命令为进程间通信提供了强大的支持。以下是常见的信号量控制命令: - SETVAL :将信号量的值设置为参数 arg.value 中的值。 - GETPID :返回 semid ds 中的 sempid…

作者头像 李华
网站建设 2026/4/18 0:04:04

63、系统崩溃分析与内核栈深入解析

系统崩溃分析与内核栈深入解析 1. 信号相关机制与状态 在系统运行过程中,存在一些关键的信号相关机制和状态信息。例如, sigflag 和 oldmask 与 w sigflag 字段的值相关。若该字段非零,表明进程此前执行过 sigsuspend 系统调用,正等待信号。 w sigoldmask 字段…

作者头像 李华