news 2026/6/26 5:36:55

熵与分布(更懂「犹豫」):整个候选分布有多分散; P(True) 自评估:追加一个问题「上述答案是否正确?(A) True (B) False」,再看 logprob;

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
熵与分布(更懂「犹豫」):整个候选分布有多分散; P(True) 自评估:追加一个问题「上述答案是否正确?(A) True (B) False」,再看 logprob;

基于logprob,幻觉抑制 创新方案。

目录

  • 基于 `logprob`,幻觉抑制 创新方案。
    • 一、基础层:单值置信度(简单但有效)
      • 1. 平均对数概率 / 困惑度(Perplexity)
      • 2. 最小 token 概率(Min-Prob,强烈推荐)
    • 二、 熵与分布(更懂「犹豫」):整个候选分布有多分散
      • 3. 预测熵(Predictive Entropy)
      • 4. 语义熵(Semantic Entropy)—— ⭐ 创新、登上 Nature 2024
    • 三、采样层:用「多次调用 + logprob」交叉验证
      • 5. SelfCheckGPT —— ⭐ 经典创新
      • 6. P(True) 自评估
    • 四、生成层:让 logprob 实时干预生成(最前沿、最有效)
      • 7. FLARE:主动检索增强 —— ⭐ 创新且非常实用
      • 8. 对比解码(Contrastive Decoding)
      • 9. 约束解码 + logprob 重排
    • 五、校准层:让概率「数值上可信」
      • 10. 温度缩放 / Conformal Prediction(保形预测)—— ⭐ 创新方向
    • 总结

一、基础层:单值置信度(简单但有效)

这一层只用 logprob 算一个标量分数,做阈值过滤。工程上最快落地。

1. 平均对数概率 / 困惑度(Perplexity)

  • 做法:整句 token 的 logprob 求平均,或算perplexity = exp(-平均logprob)。困惑度越高 = 模型越「懵」。
  • 有效性:⭐⭐⭐ 简单粗暴,能抓住「整体在胡说」的回答,但会被长句稀释(一句话里只有一个数字错,平均下来看不出来)。

2. 最小 token 概率(Min-Prob,强烈推荐)

  • 做法:不看平均,而是看整句里概率最低的那个 token。因为幻觉常常只是「一个关键实体错了」,平均值会掩盖它,但最小值能精准暴露。
  • 有效性:⭐⭐⭐⭐ 比平均值实战效果好很多,尤其适合抽取/事实类任务。这是个被验证过的「便宜又好用」的技巧。

二、 熵与分布(更懂「犹豫」):整个候选分布有多分散

光看选中词的概率不够,还要看整个候选分布有多分散——这才是「不确定性」的本质。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 5:35:42

【Springboot毕设全套源码+文档】基于SpringBoot的智慧药店药品信息管理系统的设计与实现(丰富项目+远程调试+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/26 5:34:50

下载claude并接入deepseek api详细教程

用window的winget命令行工具下载claude 在命令行输入winget search claude 搜索winget中关于claude的安装包 如P1 我们可以看到其中有claude 但是这个Claude无法下载 可以下载ClaudeCode也是可以使用的step 1 在电脑下载claude 通过winr在输入cmd打开命令行 在命令行中输入wi…

作者头像 李华
网站建设 2026/6/26 5:31:56

2026年用Gemini镜像站解决Java微服务架构难题

汇聚国内外各大顶级Ai最新大模型,免费一站式使用:gemini3.5,gpt,claude,grok 出图模型gpt-image-2低至每张0.03 视频模型:sora2,seed2,grok,全网最低价。网页入口&#x…

作者头像 李华
网站建设 2026/6/26 5:31:28

计算机毕业设计之jsp基于SSM的智能公寓管理系统的设计与实现

随着经济的发展,互联网络时代也在飞速进步,每个行业都在努力发展现在先进技术,通过这些先进的技术来提高自己的水平和优势。本文将讲述设计开发一个智能公寓管理系统,这个智能公寓管理系统包括两个部分:管理员与用户。…

作者头像 李华
网站建设 2026/6/26 5:27:09

面向 AI 的 FPGA 开发流程:别急着让它写代码,先把方向定好

摘要AI 编码助手已经能帮我们写 RTL、补 testbench、查 bug、整理文档,但在 FPGA 开发里,真正危险的不是“AI 不会写代码”,而是它写得太快、改得太多、想得太少。软件代码改错了,大不了跑单测、回滚提交;FPGA 代码改错…

作者头像 李华
网站建设 2026/6/26 5:24:21

帮优不帮劣吗

一.很多时候优势和劣势该怎么帮对线优势的话,尽量去围绕着优势路打,然后去拿到更多的资源二.这个理论是正确的吗不一定是正确的,需要根据实际情况而来,例如狗头这是发育性的尽量去让他发育,但是不能让优势路变成劣势路三.扫描还是假眼大多的时候在gank一波以后换成扫描,如果自己…

作者头像 李华