news 2026/5/10 0:19:42

CANN/ops-nn HardSwish梯度计算算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-nn HardSwish梯度计算算子

HardSwishGrad

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品

功能说明

  • 算子功能:HardSwish激活函数的反向传播,完成张量self的梯度计算。

  • 计算公式:

    $$ out_{i} = gradOutput_{i} \times gradSelf_{i} $$

    其中 gradSelf 的计算公式为:

    $$ gradSelf_{i} = \begin{cases} 0, & self_{i} \le -3, \ self_{i} / 3 + 0.5, & -3 < self_{i} < 3, \ 1, & self_{i} \ge 3 \end{cases} $$

参数说明

参数名输入/输出/属性描述数据类型数据格式
grad_output输入表示HardSwish激活函数正向输出的梯度,公式中的gradOutput。BFLOAT16、FLOAT16、FLOAT32ND
self输入表示用于计算激活函数的张量,公式中的self。BFLOAT16、FLOAT16、FLOAT32ND
grad_input输出表示HardSwish正向输入的梯度值,即对输入进行求导后的结果。BFLOAT16、FLOAT16、FLOAT32ND

约束说明

  • 确定性计算:aclnnHardswishBackward默认确定性实现。

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_hard_swish_backward通过aclnnHardswishBackward接口方式调用HardSwishGrad算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 0:19:09

AI病理诊断实战:从单模态到多模态的印戒细胞癌识别技术解析

1. 项目概述&#xff1a;当AI遇见病理诊断的“硬骨头”在病理诊断领域&#xff0c;印戒细胞癌一直被视为一块难啃的“硬骨头”。这种癌细胞形态特殊&#xff0c;细胞质内充满黏液&#xff0c;将细胞核挤到一侧&#xff0c;形似一枚戒指&#xff0c;因而得名。它的诊断难点在于&…

作者头像 李华
网站建设 2026/5/10 0:15:34

XHS-Downloader:小红书无水印下载与内容采集终极指南

XHS-Downloader&#xff1a;小红书无水印下载与内容采集终极指南 【免费下载链接】XHS-Downloader 小红书&#xff08;XiaoHongShu、RedNote&#xff09;链接提取/作品采集工具&#xff1a;提取账号发布、收藏、点赞、专辑作品链接&#xff1b;提取搜索结果作品、用户链接&…

作者头像 李华
网站建设 2026/5/10 0:14:42

DownKyi完整使用教程:3步掌握B站视频下载终极技巧

DownKyi完整使用教程&#xff1a;3步掌握B站视频下载终极技巧 【免费下载链接】downkyi 哔哩下载姬downkyi&#xff0c;哔哩哔哩网站视频下载工具&#xff0c;支持批量下载&#xff0c;支持8K、HDR、杜比视界&#xff0c;提供工具箱&#xff08;音视频提取、去水印等&#xff0…

作者头像 李华
网站建设 2026/5/10 0:13:38

LLM推理服务调度优化:KV$缓存与负载均衡的乘法组合方法

1. LLM推理服务调度优化概述大型语言模型(LLM)推理服务面临的核心挑战之一是如何高效调度用户请求。当多个用户同时向部署在GPU集群上的LLM服务发送请求时&#xff0c;调度系统需要决定将每个请求分配给哪个计算实例。这个决策直接影响两个关键性能指标&#xff1a;首令牌延迟(…

作者头像 李华
网站建设 2026/5/10 0:13:36

AI如何重塑教育科研:从效率工具到思维伙伴的实践与挑战

1. 项目概述&#xff1a;当AI成为你的“学术副驾”最近和几位高校的朋友聊天&#xff0c;发现一个挺有意思的现象&#xff1a;以前大家见面聊的是“最近在做什么课题”&#xff0c;现在开场白变成了“你最近在用哪个AI工具辅助研究&#xff1f;”。从ChatGPT到Claude&#xff0…

作者头像 李华
网站建设 2026/5/10 0:13:36

CANN/community GE SIG

ge SIG 【免费下载链接】community 本项目是CANN开源社区的核心管理仓库&#xff0c;包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息 项目地址: https://gitcode.com/cann/community 概述 GE SIG 是 CANN 图模式研发的技术兴趣小组&#xff0c;聚焦于…

作者头像 李华