AscendAntiQuantV2
【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn
产品支持情况
| 产品 | 是否支持 |
|---|---|
| Ascend 950PR/Ascend 950DT | √ |
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
| Atlas 200I/500 A2 推理产品 | × |
| Atlas 推理系列产品 | √ |
| Atlas 训练系列产品 | × |
功能说明
算子功能:根据输入的scale和offset对输入x进行反量化。
计算公式:
sqrt_mode为true,offset为None时,计算公式为:
$$ y = cast_to_dst_type((x) * scale * scale) $$
sqrt_mode为true,offset不为None时,计算公式为:
$$ y = cast_to_dst_type((x + offset) * scale * scale) $$
sqrt_mode为false,offset为None时,计算公式为:
$$ y = cast_to_dst_type((x) * scale) $$
sqrt_mode为false,offset不为None时,计算公式为:
$$ y = cast_to_dst_type((x + offset) * scale) $$
参数说明
| 参数名 | 输入/输出/属性 | 描述 | 数据类型 | 数据格式 |
|---|---|---|---|---|
| x | 输入 |
| INT4、INT8、HIFLOAT8、FLOAT8_E4M3、FLOAT8_E5M2 | ND |
| scale | 输入 |
| FLOAT32、BFLOAT16 | ND |
| offset | 可选输入 |
| 和scale一致 | ND |
| dst_type | 可选属性 |
| INT64 | - |
| sqrt_mode | 可选属性 |
| BOOL | - |
| y | 输出 |
| FLOAT16、BFLOAT16 | ND |
- Atlas 推理系列产品 :
- 数据类型:
- 入参
x仅支持INT8。 - 入参
scale、offset和出参y不支持BFLOAT16。
- 入参
- 入参
dstType仅支持取值1,表示FLOAT16。 - 入参
scale、offset仅支持一维,且只能等于x尾轴大小或1,当x为int32类型时,必须为x尾轴大小的8倍。
- 数据类型:
- Atlas A2 训练系列产品/Atlas A2 推理系列产品/Atlas A3 训练系列产品/Atlas A3 推理系列产品 :
- 入参
x仅支持INT4、INT8。 - 入参
scale、offset仅支持一维,且只能等于x尾轴大小或1,当x为int32类型时,必须为x尾轴大小的8倍。
- 入参
约束说明
无
调用说明
| 调用方式 | 样例代码 | 说明 |
|---|---|---|
| aclnn接口 | test_aclnn_ascend_anti_quant | 通过aclnnAscendAntiQuant接口方式调用AscendAntiQuantV2算子。 |
| 图模式 | - | 通过算子IR构图方式调用AscendAntiQuantV2算子。 |
【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考