news 2026/4/18 12:51:10

腾讯KaLM-Embedding登顶MMTEB,12B模型刷新检索性能

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
腾讯KaLM-Embedding登顶MMTEB,12B模型刷新检索性能

腾讯KaLM-Embedding登顶MMTEB,12B模型刷新检索性能

【免费下载链接】KaLM-Embedding-Gemma3-12B-2511项目地址: https://ai.gitcode.com/tencent_hunyuan/KaLM-Embedding-Gemma3-12B-2511

导语:腾讯最新发布的KaLM-Embedding-Gemma3-12B-2511模型在多语言文本嵌入基准测试(MMTEB)中以72.32的任务均值和62.51的任务类型均值斩获榜首,标志着中文技术团队在通用嵌入模型领域的重要突破。

行业现状:嵌入模型(Embedding Model)作为连接自然语言与机器学习系统的核心组件,已成为大语言模型应用生态的关键基础设施。随着RAG(检索增强生成)技术的普及,嵌入模型的性能直接影响智能问答、知识检索、语义分析等场景的效果。当前市场呈现"轻量高效"与"大而全"并行发展的趋势,主流模型参数规模从数百万到数十亿不等,而10B级模型正成为兼顾性能与成本的黄金平衡点。

模型核心亮点

KaLM-Embedding-Gemma3-12B-2511基于Google Gemma3-12B模型进行优化,通过腾讯自研的训练技术实现了性能跃升。从MMTEB评测数据看,该模型在12项任务中展现全面优势:在检索(Retrieval)任务中以75.66分位居第一,比第二名高出近7分;在跨语言文本挖掘(Bitext Mining)和多标签分类(Multilabel Classification)任务中也分别以83.76分和33.03分刷新纪录。

技术特性方面,该模型具备三大优势:一是32k的超长上下文处理能力,可直接处理长文档语义理解;二是支持7种不同维度的嵌入输出(从64维到3840维),满足不同场景的存储和计算需求;三是同时兼容Sentence-Transformers和vLLM推理框架,开发者可根据算力条件选择优化方案。

行业影响:此次登顶意味着中文团队在通用嵌入模型领域已具备与国际顶尖水平竞争的实力。对企业用户而言,该模型在信息检索、智能客服、内容推荐等场景将带来显著效果提升——特别是在跨语言检索和长文档理解场景,75.66分的检索性能意味着更精准的信息匹配和更低的误检率。

值得注意的是,腾讯采用"基础模型+专业优化"的技术路线,在Gemma3架构基础上针对嵌入任务进行专项优化,这种模式为行业提供了高效的模型迭代思路。随着该模型的开源,预计将推动国内RAG应用生态的进一步繁荣。

结论与前瞻:KaLM-Embedding-Gemma3-12B-2511的性能突破印证了大参数嵌入模型在复杂语义理解上的优势。未来,随着多模态嵌入技术的发展,以及与大语言模型的深度协同,嵌入模型将在知识图谱构建、智能决策支持等更广泛领域发挥核心作用。对于开发者而言,选择兼顾性能与效率的10B级模型正成为平衡成本与效果的理性选择。

【免费下载链接】KaLM-Embedding-Gemma3-12B-2511项目地址: https://ai.gitcode.com/tencent_hunyuan/KaLM-Embedding-Gemma3-12B-2511

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 9:08:41

高效窗口管理工具RBTray:提升工作效率的4大核心方法

高效窗口管理工具RBTray:提升工作效率的4大核心方法 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 在当今多任务处理的工作环境中,高效窗口管理已…

作者头像 李华
网站建设 2026/4/18 7:57:27

复旦开源MOSS:16B参数大模型支持中英双语与插件调用

复旦开源MOSS:16B参数大模型支持中英双语与插件调用 【免费下载链接】moss-moon-003-sft 项目地址: https://ai.gitcode.com/OpenMOSS/moss-moon-003-sft 复旦大学开源的160亿参数大语言模型MOSS(moss-moon-003-sft)正式对外发布&…

作者头像 李华
网站建设 2026/4/18 7:58:12

Chatbot生成不了?从零构建对话系统的避坑指南

1. 先别急着写代码,先看清“chatbot生成不了”到底长啥样 我第一次把对话系统跑起来时,兴冲冲地对着麦克风喊“今天天气怎么样?”,结果前端直接弹了个空白的聊天气泡——后台日志里只有一句 response: null。那一刻我才体会到什么…

作者头像 李华
网站建设 2026/4/17 19:27:32

复旦开源MOSS大模型:16B参数支持多插件与量化部署

复旦开源MOSS大模型:16B参数支持多插件与量化部署 【免费下载链接】moss-moon-003-base 项目地址: https://ai.gitcode.com/OpenMOSS/moss-moon-003-base 导语:复旦大学开源MOSS大模型(moss-moon-003-base),以…

作者头像 李华
网站建设 2026/4/18 8:20:06

BGE-VL-v1.5-mmeb:2600万数据打造终极多模态检索模型

BGE-VL-v1.5-mmeb:2600万数据打造终极多模态检索模型 【免费下载链接】BGE-VL-v1.5-mmeb 项目地址: https://ai.gitcode.com/BAAI/BGE-VL-v1.5-mmeb 导语:由BAAI推出的BGE-VL-v1.5-mmeb多模态检索模型凭借2600万MegaPairs数据集训练,…

作者头像 李华
网站建设 2026/4/18 9:22:45

探索Character-LLM:克丽奥佩特拉7B模型新体验

探索Character-LLM:克丽奥佩特拉7B模型新体验 【免费下载链接】character-llm-cleopatra-7b-wdiff 项目地址: https://ai.gitcode.com/OpenMOSS/character-llm-cleopatra-7b-wdiff 导语:Character-LLM系列再添新成员,克丽奥佩特拉7B模…

作者头像 李华