news 2026/5/9 5:58:14

Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息

概述

虽然 LLM 在复杂推理和问题解答中表现出了卓越的性能,但一种被称为 "上下文遗忘 "的现象却是一个挑战。这是指模型在长时间的语境中会逐渐遗忘提示中给出的信息,这会对准确生成回答产生负面影响。本研究重点研究了这种语境遗忘现象,并详细探讨了当前 LLM 在什么条件下会 "遗忘 "信息。

此外,作者还提出了一种简单的提示设计工具,称为 “忘我”(FMN)。该工具是一种通过插入上下文的单句指示来提醒模型注意重要信息的机制。值得注意的是,它并不改变 LLM 的结构,也不涉及任何训练,却能显著提高模型的上下文记忆能力。实验结果表明,即使是最先进的模型(如 GPT-4),插入 FMN 也能将准确率提高 40 分或更多。

建议的方法

本研究的核心建议是一种基于提示的辅助句插入方法,称为 “勿忘我”(FMN)。

FMN 是简短的自然语言句子,用于再次 "提醒 "模型注意通常被埋没在较长上下文中的重要信息。例如,可以在原始指令后立即添加一句话,如 “这条指令非常重要:您对问题的回答应完全基于这句话”,以达到预期效果。

FMN 旨在强调模型中的特定信息,同时尽量减少词块数量的增加。其特点是,它不会对模型的内部结构或参数做任何改动,而只是调整提示中的措辞以提高成绩。FMN 还能弥补模型对上下文理解的模糊性,因为它能用自然语言明确指出 “哪些信息是重要的”。

此外,FMN 还可与其他上下文记忆支持方法结合使用,如少点学习(few-shot learning),是一种多功能方法。因此,与传统方法相比,它能更简单、更有效地缓解语境遗忘。

实验

作者在几种 LLM(如 GPT-3.5、GPT-4、Claude 2、Gemini Pro)上设计并执行了共 10 项语境遗忘任务,以评估语境遗忘并测试 FMN 的有效性。每项任务都详细测量了模型是否能在上下文中保留特定信息,以及插入 FMN 对准确性的提高程度。

实验结果表明,GPT-4 的成绩提高了 43 分,Claude 2 的成绩提高了 37 分。此外,还观察到与模型记忆特征一致的趋势,如 FMN "信息位置越靠后越有效 "和 “离问题越远越有效”。

此外,为了评估 FMN 对整个提示信息的影响,我们还测试了 FMN 对提示信息中其他信息的干扰和误导风险,但在大多数情况下都没有发现负面影响,反而报告了成绩的稳定提高。特别是在 GPT-4 中,明确指出调频网络几乎总是有积极作用。

从这些结果中可以得出结论:FMN 是一种实用的方法,可以轻松有效地缓解情境遗忘。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 21:19:37

为什么没有统一协议,多智能体永远无法真正互操作?

最近,“多智能体协作”(Multi-Agent Systems, MAS)的概念被炒得火热。在 Demo 视频里,我们看到:销售 Agent 接单,自动指挥库存 Agent 查货,再调度物流 Agent 发货,最后由财务 Agent …

作者头像 李华
网站建设 2026/4/18 7:34:38

23、实例负载均衡流量管理指南

实例负载均衡流量管理指南 在负载均衡的管理过程中,我们需要掌握多种操作,包括对池、池成员、健康监视器和监听器的管理,以及如何构建一个完整的负载均衡器。下面将详细介绍相关的操作步骤和命令。 1. 池管理 1.1 列出所有池 在命令行界面(CLI)中,使用以下命令列出所…

作者头像 李华
网站建设 2026/5/2 10:51:32

8、使用 Linux 网桥构建虚拟网络基础设施

使用 Linux 网桥构建虚拟网络基础设施 在 OpenStack 云环境中构建网络资源之前,需要对网络插件进行定义和配置。ML2 插件提供了一个通用框架,允许多个驱动程序相互协作。下面将详细介绍如何在 controller01 和 compute01 主机上配置 Linux 网桥 ML2 驱动和代理。 1. 配置网…

作者头像 李华
网站建设 2026/5/2 20:14:39

16、网络安全与访问控制:从安全组到角色访问控制

网络安全与访问控制:从安全组到角色访问控制 1. 端口安全与允许地址对管理 端口安全是网络安全的重要组成部分。当端口安全扩展启用时,可以在创建或更新端口期间,通过相应设置 port_security_enabled 属性,来启用或禁用单个端口的端口安全。启用端口安全后,默认的反欺…

作者头像 李华
网站建设 2026/4/20 15:56:22

5步诊断法:彻底解决WSL环境中Open-Interpreter无法连接本地模型的难题

5步诊断法:彻底解决WSL环境中Open-Interpreter无法连接本地模型的难题 【免费下载链接】open-interpreter Open Interpreter 工具能够让大型语言模型在本地执行如Python、JavaScript、Shell等多种编程语言的代码。 项目地址: https://gitcode.com/GitHub_Trending…

作者头像 李华
网站建设 2026/5/8 22:53:42

NVIDIA DALI GPU数据预处理优化:7大实战策略提升深度学习训练效率

NVIDIA DALI GPU数据预处理优化:7大实战策略提升深度学习训练效率 【免费下载链接】DALI NVIDIA/DALI: DALI 是一个用于数据预处理和增强的 Python 库,可以用于图像,视频和音频数据的处理和增强,支持多种数据格式和平台&#xff0…

作者头像 李华