news 2026/4/18 1:55:16

只需一张图,无需训练、无需先验、无需提示、类别无关!这个通用物体计数模型即将开源!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
只需一张图,无需训练、无需先验、无需提示、类别无关!这个通用物体计数模型即将开源!

原文链接:真正类别无关的、理想的、可用于全自动物体计数系统的解决方案。

在智能交通系统中,算法需实时监测不同区域的人流、车流密度。在工业流水线上,模型要快速清点成千上万个形态各异的零件。

看似简单的计数任务,实则涉及物体识别、定位与区分。当然,目前来讲类别特定的物体计数已经非常成熟。

只要能够为每个物体类别获取足够大的带标注训练数据集,这些计数模型就可以可靠地计数属于单个预定类别的大量物体。

如何应对新增类别的需求?这是在真实场景中我们需要应对的方向:开放词汇目标计数!旨在统计图像中任意类别物体的实例数量。

现有大模型方法大多假设每张图像中仅存在一个物体类别,其依赖额外的输入(如视觉示例或文本提示)来指定应计数的物体。

那能否不借助任何辅助信息及训练,仅通过一张图像,就能统计任意类别物体的实例数量呢?今天介绍的OCCAM框架是真正类别无关的、理想的、可用于全自动物体计数系统的、以及目前最通用的解决方案。

原文链接:真正类别无关的、理想的、可用于全自动物体计数系统的解决方案。

# PaperClass-Agnostic, Training-Free, Prior-Free and Multi-Class Object Counting# Arxivhttps://arxiv.org/pdf/2601.13871# Codehttps://mikespanak.github.io/OCCAM_counter/

一、类别无关计数的三大流派

现有的类别无关计数方法可以根据以下几点进行分类:是否依赖先验信息、是否需要专门训练以及是否支持多类别计数。

1. 先验依赖型

先验依赖型方法是类别无关计数领域的开山鼻祖,也是目前最成熟的技术路线。核心思路很简单:既然AI不知道要数什么,那就明确告诉它,给模型提供示例物体、文本描述或点标注。

基于示例的方法通过给定图像中的1-3个实例提供最强的指导,代表性的工作PseCo 将SAM的通用分割能力与CLIP的语义理解能力相结合。

2. 无需训练型

无需训练的方法旨在通过利用基础模型来克服对训练数据的需求,之前文章中介绍过的 CountingDINO 依赖完全无监督的DINOv2特征来提取潜在物体原型并生成基于相似性的密度图。

3. 多类别全能型

现实世界的图像很少只包含一类物体,多类别全能型方法旨在一次性解决所有类别物体的计数问题。

ABC123是首个多类别计数框架,它是一种基于Transformer的密度回归方法,能够在无需先验的情况下同时计数多种物体类型。每个物体类别最多可以有300个实例,且每张图像最多只能计数4个不同类别。

二、三个基础突破定义通用计数新标准

一张野外观测照片中可能有羚羊、斑马、树木和岩石,无论是稀疏分布还是密集排列。OCCAM 都能一次性给出每类物体的准确数量,且其实例数量没有上限。

如何实现无需训练?查看原文链接:真正类别无关的、理想的、可用于全自动物体计数系统的解决方案。https://mp.weixin.qq.com/s/Dw7J-MFiwcHoJ1NxgG0ljg

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/24 14:17:43

【开题答辩全过程】以 基于微信小程序的咖啡销售系统的设计与实现为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

作者头像 李华
网站建设 2026/4/16 18:09:47

【开题答辩全过程】以 基于SSM的航班管理系统的设计与实现为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

作者头像 李华
网站建设 2026/4/8 9:54:12

多 GitHub 账号与多平台 Git 使用(附加场景:就想用指定账号clone)

前一篇【多 GitHub 账号与多平台 Git 使用】解释了标准流程,有时我就是这么非常的想用指定账号clone,还就想在一个不一样的目录,这是就有了下边的问题: ----------------------------------------------- 如果我临时clone一些gi…

作者头像 李华
网站建设 2026/4/15 21:47:44

专精特新培育:从政策红利到能力红利的系统跃迁之路

专精特新培育:从政策红利到能力红利的系统跃迁之路在中国制造业转型升级的关键时期,“专精特新”已成为中小企业高质量发展的明确路径。然而,真正的专精特新培育,绝非简单的资质申报或政策对接,而是一场深刻的系统性能…

作者头像 李华
网站建设 2026/4/17 13:03:43

MongoDB实现发布订阅机制

一、MongoDB Pub/Sub 的实现原理 MongoDB 的发布订阅不是像 Redis 那样的原生 “频道式” Pub/Sub,而是基于变更流(Change Streams)(MongoDB 3.6 推荐)或早期的tailable cursor(可尾游标)实现&a…

作者头像 李华
网站建设 2026/4/7 13:40:13

特殊符号绕过-ctfshow-web40

一、打开环境看源码if(isset($_GET[c])){$c $_GET[c];if(!preg_match("/[0-9]|\~|\|\|\#|\\$|\%|\^|\&|\*|\&#xff08;|\&#xff09;|\-|\|\|\{|\[|\]|\}|\:|\|\"|\,|\<|\.|\>|\/|\?|\\\\/i", $c)){eval($c);}}else{highlight_file(__FILE__); }…

作者头像 李华