news 2026/6/10 21:21:14

12.5 注意力机制革命:Bahdanau注意力与Luong注意力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
12.5 注意力机制革命:Bahdanau注意力与Luong注意力

12.5 注意力机制革命:Bahdanau注意力与Luong注意力

注意力机制的提出是序列到序列学习领域的一次根本性革命,它有效解决了传统编码器-解码器架构中的“信息瓶颈”问题。该机制允许解码器在生成输出的每一个时间步,动态地、有选择地聚焦于输入序列的不同部分,而非依赖于单一的、固定维度的上下文向量。这种模仿人类认知中“选择性关注”的思想,极大地提升了模型处理长序列和复杂依赖关系的能力。在神经网络机器翻译的发展历程中,Bahdanau等人[1]与Luong等人[2]的工作分别代表了注意力机制的开创性引入与系统性改进,奠定了现代注意力模型的基础。

12.5.1 核心思想与基本框架

传统编码器-解码器模型将整个输入序列X=(x1,x2,…,xT)X = (x_1, x_2, \ldots, x_T)X=(x1,x2,,xT)压缩为一个固定长度的上下文向量ccc。当处理长句子时,该向量难以承载全部必要信息,导致模型性能下降。注意力机制的核心思想是:在解码的每一步ttt,为解码器生成一个独特的、与当前步相关的上下文向量ctc_tct

其基本框架包含三个核心步骤:

  1. 计算注意力分数:度量解码器当前状态sts_tst与编码器所有隐藏状态hih_ihi之间的相关性。
  2. 计算注意力权重:将注意力分数通过Softmax函数归一化,得到权重向量αti\alpha_{ti}αti,满足∑i=1Tαti=1\sum_{i=1}^{T} \alpha_{ti} = 1i=1Tαti=1。权重αti\alpha_{ti}αti表示在生成第ttt个目标词时,对第iii个源语言词的关注程度。
  3. 生成上下文向量:对编码器隐藏状态进行加权求和,得到当前步的动态上下文向量ctc_tct
    ct=∑i=1Tαtihi c_t = \sum_{i=1}^{T} \alpha_{ti} h_ict=i=1Tαtihi

最终,解码器在预测下一个词yty_tyt时,不仅依赖于自身的隐藏状态sts_tst和上一个词yt−1y_{t-1}yt1,更关键地依赖于这个动态生成的上下文向量ctc_tct。条件概率写为:
P(yt∣y<t,X)=g(yt−1,st,ct) P(y_t | y_{<t}, X) = g(y_{t-1}, s_t, c_t)P(yty<

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 13:14:59

13.2 GAN变体:DCGAN、WGAN、CycleGAN、StyleGAN

13.2 GAN变体:DCGAN、WGAN、CycleGAN、StyleGAN 生成对抗网络的演进史,是一部围绕训练稳定性、生成质量与可控性三大核心挑战的攻坚史。原始GAN虽然提出了对抗学习的革命性范式,但其在实践中的不稳定性与生成模式的单一性,催生了大量旨在解决特定问题的变体模型。本节将聚…

作者头像 李华
网站建设 2026/6/10 11:39:45

Excalidraw错误提示文案优化:更友好易懂

Excalidraw错误提示文案优化&#xff1a;更友好易懂 在远程协作日益频繁的今天&#xff0c;一款数字白板工具是否“好用”&#xff0c;往往不取决于它能画出多复杂的图表&#xff0c;而在于当事情出错时——比如点了一下却什么都没发生、文件打不开、AI没反应——它能不能告诉你…

作者头像 李华
网站建设 2026/6/10 11:18:44

Excalidraw品牌色系定义:VI视觉识别系统

Excalidraw 视觉识别系统设计解析&#xff1a;从色彩到手绘风格的工程实践 在数字协作工具百花齐放的今天&#xff0c;大多数白板产品选择走“精准、规整、拟物化”的视觉路线——线条笔直、颜色鲜艳、界面光洁如新。但 Excalidraw 却反其道而行之&#xff1a;它不追求完美&…

作者头像 李华
网站建设 2026/6/10 6:05:32

Python实战小游戏(二): 文字冒险游戏

引言 在Python入门到精通&#xff08;二&#xff09;中&#xff0c;我们了解基本的控制流以及重要的数据结构&#xff1a;列表、字典、 集合等。 现在编写一个小游戏对数据结构、控制流进行简单应用&#xff0c;巩固基础&#xff0c;加深理解。 文章目录引言文字冒险游戏说明…

作者头像 李华
网站建设 2026/6/10 13:50:13

Excalidraw用户故事征集:真实反馈激励传播

Excalidraw&#xff1a;从一笔涂鸦到协同智能的进化 在一次跨国产品评审会上&#xff0c;一位工程师用指尖在屏幕上随意画了几个歪歪扭扭的方框和箭头&#xff0c;配上几句简短注释&#xff1a;“用户登录 → 验证服务 → 数据库查询”。不到十秒&#xff0c;这些潦草线条自动延…

作者头像 李华