监督学习训练图像聚类模型，性能大幅提升-程序员充电站

使用监督学习训练图像聚类模型

在机器学习领域，大多数模型都依赖于监督学习，需要耗费高昂成本和时间来获取带标注的数据。无监督学习的主要方法——聚类，旨在根据显著特征将数据点分组，每个组（簇）代表一个类别，例如同一人物的照片或同一物种的动物图像。

传统的聚类算法通常依赖启发式规则来决定簇之间的边界，例如簇中心之间的阈值距离或簇的分布形状。在一篇提交给国际计算机视觉大会（ICCV）的论文中，提出了一种新方法：直接从数据中学习如何划分边界。

核心方法：分层图神经网络

该方法首先将视觉数据表示为一个图，其中每个节点代表一张图像，每个节点与其在特征空间中的k个最近邻节点相连。

然后，使用一个图神经网络来生成图中节点的向量表示（节点嵌入）。与先前工作不同的是，该方法不依赖启发式规则，而是使用带标签的元训练数据来学习如何对这些向量进行聚类，并决定聚类的精细程度。

该方法的核心创新在于其分层处理方式。聚类模型基于节点嵌入预测节点之间的连接边，共享边的节点组被定义为一个簇。完成一层聚类后，将每个簇聚合成一个代表该簇的“超节点”，然后在新的超节点图上重复整个过程：构建k最近邻图，通过GNN传递，并预测超节点之间的连接边。这个过程迭代进行，直到模型不再预测出新的连接边为止。

模型训练与优势

该聚类模型基于两个目标进行训练：

准确预测节点之间的连接：正确的连接是指那些将元训练数据中同类型的两个代表（例如，同一演员的两张照片）联系起来的边。
准确预测局部数据密度：对于每个节点，模型需要预测其附近邻居中属于同类型的比例。

通过单一模型联合预测连接和密度，显著提高了计算效率。同时，由于采用了分层处理方案，模型可以优化整个输入图的聚类效果，避免了先前方法中将图分割成子图再进行处理所带来的局限性。

实验与结果

在实验中，使用两组不同的元训练数据：一组是人类面部特写，另一组是特定动物物种的图像。用训练好的面部模型在两个与训练集类别重叠极低（0%和低于2%）的数据集上进行测试；用训练好的物种模型在一个包含未见过的物种的数据集上进行测试。结果显示，与之前的基于GNN的聚类模型和无监督聚类方法相比，该方法的F分数平均提升了49%和47%。

这项正在进行的研究，正在探索训练一个更通用的聚类模型的可能性，以使其推理性能能够更好地跨不同数据类型（例如同时精确聚类人脸和动物物种）迁移。

鸣谢：Tianjun Xiao, Yongxin Wang, Yuanjun Xiong, Wei Xia, David Wipf, Zhang Zheng, Stefano Soatto
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

思源宋体CN实战应用与性能优化全解析

思源宋体CN实战应用与性能优化全解析【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 在数字内容创作领域，中文字体的选择直接影响着作品的视觉效果和用户体验。思源宋体CN作…

李华

Raylib实战指南：7天掌握C语言游戏开发核心技术

Raylib实战指南：7天掌握C语言游戏开发核心技术【免费下载链接】raylib raysan5/raylib 是一个用于跨平台 C 语言游戏开发库。适合在进行 C 语言游戏开发时使用，创建 2D 和 3D 图形应用程序。特点是提供了丰富的图形和音频处理功能、易于使用的 API 和多…

李华

键盘防抖神器：告别连击困扰的终极解决方案

键盘防抖神器：告别连击困扰的终极解决方案【免费下载链接】KeyboardChatterBlocker A handy quick tool for blocking mechanical keyboard chatter. 项目地址: https://gitcode.com/gh_mirrors/ke/KeyboardChatterBlocker 你是否曾经在打字时，明…

李华

DroidCam OBS插件：将手机变身高清直播摄像头的终极方案

DroidCam OBS插件：将手机变身高清直播摄像头的终极方案【免费下载链接】droidcam-obs-plugin DroidCam OBS Source 项目地址: https://gitcode.com/gh_mirrors/dr/droidcam-obs-plugin 还在为高昂的专业摄像头设备而烦恼吗？DroidCam OBS插件为你…

李华

监督学习训练图像聚类模型，性能大幅提升