news 2026/5/11 7:45:35

CANN/ops-nn自适应层归一化算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-nn自适应层归一化算子

AdaLayerNorm

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:AdaLayerNorm算子将LayerNorm和下游的Add、Mul融合起来,通过自适应参数scale和shift来调整归一化过程。

  • 计算公式:

    $$ out = LayerNorm(x) * (1 + scale) + shift $$

    LayerNorm计算公式:

    $$ LayerNorm(x) = {{x-E(x)}\over\sqrt {Var(x)+epsilon}} * weight + bias $$

    其中,E(x)表示输入的均值,Var(x)表示输入的方差。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入表示进行归一化的输入数据,对应公式中的`x`。shape为[B, S, H],其中B支持0到6维。FLOAT32、FLOAT16、BFLOAT16ND
scale输入表示自适应缩放参数。对应公式中的`scale`。shape为[B, H]或[B, 1, H],其中B支持0到6维,维度数量和大小与`x`中的B保持一致,H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
shift输入表示自适应偏移参数。对应公式中的`shift`。shape为[B, H]或[B, 1, H],其中B支持0到6维,维度数量和大小与`x`中的B保持一致,H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
weight可选输入表示归一化缩放参数。对应公式中的`weight`。shape为[H],H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
bias可选输入表示归一化偏移参数。对应公式中的`bias`。shape为[H],H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
epsilon可选属性
  • 添加到分母中的值,以确保数值稳定,对应公式中的`epsilon`。
  • 默认值为1e-5f。
FLOAT32-
out输出表示归一化后的结果,对应公式中的`out`。shape与`x`保持一致。FLOAT32、FLOAT16、BFLOAT16ND

约束说明

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_ada_layer_norm通过aclnnAdaLayerNorm接口方式调用AdaLayerNorm算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 7:45:10

深度解析原神帧率解锁技术:5大核心特性与源码架构实战指南

深度解析原神帧率解锁技术:5大核心特性与源码架构实战指南 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 原神帧率解锁项目(genshin-fps-unlock)是一…

作者头像 李华
网站建设 2026/5/11 7:43:31

face-recognition.js 模型训练与保存:构建可复用的人脸识别系统

face-recognition.js 模型训练与保存:构建可复用的人脸识别系统 【免费下载链接】face-recognition.js Simple Node.js package for robust face detection and face recognition. JavaScript and TypeScript API. 项目地址: https://gitcode.com/gh_mirrors/fa/f…

作者头像 李华
网站建设 2026/5/11 7:39:49

BepInEx IL2CPP启动失败终极解决指南:从异常诊断到游戏正常运行

BepInEx IL2CPP启动失败终极解决指南:从异常诊断到游戏正常运行 【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx BepInEx作为Unity游戏插件框架,为玩家和开发…

作者头像 李华
网站建设 2026/5/11 7:31:30

CANN批量归一化统计算子

aclnnBatchNormStats 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A…

作者头像 李华
网站建设 2026/5/11 7:29:48

CANN/ops-nn AddRmsNormDynamicQuant算子

AddRmsNormDynamicQuant 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推…

作者头像 李华