news 2026/5/11 3:33:32

CANN/ops-nn反量化算子文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-nn反量化算子文档

AscendAntiQuantV2

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品
Atlas 训练系列产品×

功能说明

  • 算子功能:根据输入的scale和offset对输入x进行反量化。

  • 计算公式:

    • sqrt_mode为true,offset为None时,计算公式为:

      $$ y = cast_to_dst_type((x) * scale * scale) $$

    • sqrt_mode为true,offset不为None时,计算公式为:

      $$ y = cast_to_dst_type((x + offset) * scale * scale) $$

    • sqrt_mode为false,offset为None时,计算公式为:

      $$ y = cast_to_dst_type((x) * scale) $$

    • sqrt_mode为false,offset不为None时,计算公式为:

      $$ y = cast_to_dst_type((x + offset) * scale) $$

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入
  • 表示算子输入的Tensor,对应公式中的x;
  • 不支持空Tensor;
  • 当数据类型是INT4时,shape的尾轴为偶数。
INT4、INT8、HIFLOAT8、FLOAT8_E4M3、FLOAT8_E5M2ND
scale输入
  • 表示反量化中的scale值。对应公式中的scale;
  • 不支持空Tensor;
  • scale的维数必须与x相同,或者是1维;
  • 如果x是1维,scale的形状必须是[1]或与x相同;
  • 如果scale是1维,其大小必须是1、x[-1]或x[-2];
  • 如果scale是多维,最多只能有一个非1的维度,且这个非1的维度只能是-1或-2轴;
  • 当输入x的类型为HIFLOAT8、FLOAT8_E4M3、FLOAT8_E5M2时,scale只支持FLOAT32。
FLOAT32、BFLOAT16ND
offset可选输入
  • 表示反量化中的offset值。对应公式中的offset;
  • 不支持空Tensor;
  • 数据类型和shape需要与scale保持一致。
和scale一致ND
dst_type可选属性
  • 表示输出的数据类型;
  • 支持取值1、27,分别表示FLOAT16、BFLOAT16。
INT64-
sqrt_mode可选属性
  • 表示scale参与计算的逻辑。对应公式中的sqrt_mode;
  • 当x的数据类型为HIFLOAT8、FLOAT8_E4M3、FLOAT8_E5M2时,sqrt_mode为false。
BOOL-
y输出
  • 表示反量化的计算输出。对应公式中的y;
  • shape和输入x一致。
FLOAT16、BFLOAT16ND
  • Atlas 推理系列产品 :
    • 数据类型:
      • 入参x仅支持INT8。
      • 入参scaleoffset和出参y不支持BFLOAT16。
    • 入参dstType仅支持取值1,表示FLOAT16。
    • 入参scaleoffset仅支持一维,且只能等于x尾轴大小或1,当x为int32类型时,必须为x尾轴大小的8倍。
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品/Atlas A3 训练系列产品/Atlas A3 推理系列产品 :
    • 入参x仅支持INT4、INT8。
    • 入参scaleoffset仅支持一维,且只能等于x尾轴大小或1,当x为int32类型时,必须为x尾轴大小的8倍。

约束说明

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_ascend_anti_quant通过aclnnAscendAntiQuant接口方式调用AscendAntiQuantV2算子。
图模式-通过算子IR构图方式调用AscendAntiQuantV2算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 3:30:36

台达DVP50MC11T与威纶触摸屏ModbusTCP地址映射实战解析

1. 台达PLC与威纶触摸屏通信基础 第一次接触台达DVP50MC11T PLC和威纶触摸屏的ModbusTCP通信时,我被它们独特的地址映射规则搞得晕头转向。特别是M区的按位拆分机制,和传统PLC的地址分配方式完全不同。经过几个项目的实战摸索,我终于搞清楚了…

作者头像 李华
网站建设 2026/5/11 3:27:31

reverse-shell工作原理深度解析:智能检测与多语言payload实现

reverse-shell工作原理深度解析:智能检测与多语言payload实现 【免费下载链接】reverse-shell Reverse Shell as a Service 项目地址: https://gitcode.com/gh_mirrors/re/reverse-shell reverse-shell作为一种强大的网络安全工具,其核心功能是让…

作者头像 李华
网站建设 2026/5/11 3:22:32

我们只能要求手机在拍摄的时候呈现45度-----采用常用模型

因为大多数模型都是根据人脸来辨别性别和年龄的,这些代码稳定性比较高,而且稍微旋转手机拍摄角度是完全可以轻易做到的。所以就这么干好了。------------------------------------------手机端离线部署客流量统计可以引导用户把手机转到 45 斜着拍路人用…

作者头像 李华