news 2026/4/18 5:51:10

【中国海洋大学-蔡青组-AAAI26】SEMC:用于超声图像标准平面识别的结构增强型混合专家对比学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【中国海洋大学-蔡青组-AAAI26】SEMC:用于超声图像标准平面识别的结构增强型混合专家对比学习

文章:SEMC: Structure-Enhanced Mixture-of-Experts Contrastive Learning for Ultrasound Standard Plane Recognition

代码:https://github.com/YanGuihao/SEMC

单位:中国海洋大学


一、问题背景:超声标准平面识别,难在哪?

超声检查的核心是“找对角度”,但实际操作中难题重重:

  1. 图像本身不“给力”:超声图有斑点噪声、对比度低,器官边界模糊,想精准识别结构本身就难;

  2. 同类不同样,异类却相似:同一标准平面的图像可能因扫描角度、医生操作不同差异显著(比如同一肝脏平面,不同医生拍的样子大相径庭),而不同平面的图像又可能因为边界模糊显得很像,需要精细区分;

  3. 现有AI有短板:之前的AI模型要么只关注深层语义特征,忽略了图像里的浅层结构细节(比如器官轮廓、血管走向),要么没法通过对比学习捕捉到细微差异,导致识别准确率不够稳定。

这些问题直接影响诊断准确性,比如产检中胎儿生长指标测量、肝脏病变筛查等,都可能因标准平面识别不准出现误差。

二、方法创新:SEMC框架+LP2025数据集,双管齐下

为了解决上述痛点,研究团队推出了“SEMC框架”和“LP2025肝脏超声数据集”,核心创新点有两个:

1. SEMC框架:让AI既懂“结构”又懂“区分”

这个框架就像给AI配了“双引擎”,还请了“多位专家”协作:

  • 第一引擎:语义-结构融合模块(SSFM):之前的AI只看深层特征,好比“只见森林不见树木”。这个模块专门把浅层结构细节(比如器官轮廓、血管分支)和深层语义特征(比如这是肝脏左叶、那是门静脉)对齐融合,让AI既能看清细节,又能理解整体;

  • 第二引擎:混合专家对比识别模块(MCRM):相当于给AI安排了3个“专业小助手”,各自专注不同的特征维度,再通过协作做对比学习——既让同类平面的识别结果更统一,又让不同平面的差异更明显。同时还设计了自适应权重机制,不用人工调参,AI能自己根据图像难度调整学习重点。

2. LP2025数据集:填补数据空白

现有公开超声数据集稀缺,研究团队专门打造了高质量肝脏超声数据集:

  • 包含9369张图片,覆盖6种肝脏关键标准平面,还有4626张非标准平面图像(模拟真实临床场景);

  • 所有图片都由5年以上经验的超声医生标注,经过多轮交叉审核、共识验证,确保标签准确,还做了患者信息匿名化处理,兼顾实用性和隐私保护。

三、实验结果:性能碾压主流方法,多场景都好用

研究团队在3个数据集上做了测试,结果都很亮眼:

  1. 胎儿超声数据集(FPUS23):准确率达到95.78%,比第二名的主流模型高0.26%,F1-score更是达到95.06%,在胎儿头、腹部、股骨等标准平面识别中表现突出;

  2. 心脏超声数据集(CAMUS):准确率82.13%,F1-score80.93%,远超其他模型,证明在心脏两腔、四腔等复杂平面识别中同样靠谱;

  3. 自制肝脏数据集(LP2025):准确率82.30%,比现有方法高2.23%,F1-score79.32%,在6种肝脏标准平面和非标准平面的区分中优势明显。

四、优势与局限:实用但仍有提升空间

核心优势

  1. 兼顾细节与整体:首次把浅层结构和深层语义结合,解决了超声图像“细节难辨、同类差异大”的痛点;

  2. 泛化能力强:在胎儿、心脏、肝脏3类不同超声场景中都表现优异,不用针对单一部位重新训练;

  3. 开源共享:代码和数据集都已公开(https://github.com/YanGuihao/SEMC),能推动整个领域的研究进展;

  4. 临床适配性高:数据集包含非标准平面,模拟真实临床环境,模型鲁棒性强,更容易落地应用。

现存局限

  1. 数据范围有限:目前LP2025只覆盖肝脏6种标准平面,未来还需要扩展到更多器官(比如肾脏、甲状腺)和更多临床场景;

  2. 实时性待优化:框架包含多个专家分支和融合模块,虽然准确率高,但推理速度还有提升空间,需要进一步轻量化才能适配超声实时检查的需求;

  3. 极端情况表现未知:对于严重噪声、器官畸形等极端病例,模型的识别效果还需要更多临床数据验证。

五、一句话总结

SEMC框架通过“结构+语义融合”和“多专家对比学习”,解决了超声标准平面识别的核心痛点,搭配开源的高质量LP2025数据集,为临床超声AI辅助诊断提供了更精准、更实用的新方案!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 15:18:11

Elasticsearch菜鸟必看:Kibana可视化环境完整部署教程

从零开始搭建可视化分析平台:Kibana Elasticsearch 实战部署指南你是不是也曾在面对一堆日志文件时束手无策?想查个错误信息,翻来覆去grep半天还找不到源头;想看下接口响应趋势,却只能靠 Excel 手动统计。别急——这正…

作者头像 李华
网站建设 2026/4/18 8:47:54

一文说清数字频率计的核心组成模块

数字频率计的“五脏六腑”:从信号入口到显示终端,一探究竟你有没有遇到过这样的场景?手头一个信号发生器输出的波形看似稳定,但设备反馈的数据却飘忽不定。或者在调试射频模块时,明明标称是10.7 MHz的中频,…

作者头像 李华
网站建设 2026/4/18 8:08:04

腾讯云CDN加速全球分发,提升DDColor镜像访问体验

腾讯云CDN加速全球分发,提升DDColor镜像访问体验 在数字人文与AI技术交汇的今天,一张泛黄的老照片不再只是尘封的记忆——它可以被重新赋予色彩、细节甚至情感。随着深度学习在图像修复领域的突破性进展,像DDColor这样的智能上色工具正从专业…

作者头像 李华
网站建设 2026/4/18 10:52:47

知乎问答营销:‘有哪些好用的老照片修复工具?’首选DDColor

DDColor:让老照片“活”过来的AI修复利器 在知乎上看到一个问题:“有哪些好用的老照片修复工具?”——这问题背后,其实藏着无数人对记忆的珍视。一张泛黄、褪色甚至布满折痕的老照片,可能是一位老人年轻时的模样&#…

作者头像 李华
网站建设 2026/4/18 5:35:37

开源中国Gitee项目页优化:增加DDColor star数和fork量

开源中国Gitee项目页优化:提升DDColor老照片修复项目的社区影响力 在数字时代,一张泛黄的老照片不仅承载着个体记忆,也记录着一个时代的集体影像。然而,传统黑白照片普遍存在褪色、划痕、模糊等问题,人工修复成本高且周…

作者头像 李华
网站建设 2026/4/18 8:54:30

系统学习RS485全双工通信的电气特性与距离限制

深入理解RS485全双工通信:从电气特性到实战布线的完整指南在工业自动化、楼宇控制和远程数据采集系统中,RS485是最经久不衰的串行通信标准之一。尽管近年来以太网和无线技术发展迅猛,但 RS485 凭借其高抗干扰性、多点连接能力和远距离传输潜力…

作者头像 李华