news 2026/5/10 3:43:56

CANN/ops-math PadV2填充算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-math PadV2填充算子

PadV2

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

  • 算子功能:对输入 tensor 进行指定值的常量填充。

  • 示例

    输入 tensor([[0,1,2]]) paddings([[2,2]]) constant_values(0) 输出为([[0,0,0,1,2,0,0]])

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入待进行填充的原始 tensor。FLOAT、FLOAT16、INT32、INT64、INT16、INT8、UINT8、UINT16、UINT32、UINT64、BOOL、DOUBLE、COMPLEX64、COMPLEX128、BFLOAT16、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、FLOAT8_E8M0、FLOAT4_E2M1、FLOAT4_E1M2。ND
paddings输入填充配置,shape=[N, 2],其中 N 为 x 的维度数。INT32、INT64ND
constant_values输入填充常量值,标量 tensor。FLOAT、FLOAT16、INT32、INT64、INT16、INT8、UINT8、UINT16、UINT32、UINT64、BOOL、DOUBLE、COMPLEX64、COMPLEX128、BFLOAT16、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、FLOAT8_E8M0、FLOAT4_E2M1、FLOAT4_E1M2。ND
y输出填充后的 tensor。FLOAT、FLOAT16、INT32、INT64、INT16、INT8、UINT8、UINT16、UINT32、UINT64、BOOL、DOUBLE、COMPLEX64、COMPLEX128、BFLOAT16、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、FLOAT8_E8M0、FLOAT4_E2M1、FLOAT4_E1M2。ND
  • Atlas 训练系列产品 、 Atlas 推理系列产品 、 Atlas 200I/500 A2 推理产品 :数据类型不支持BFLOAT16、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、FLOAT8_E8M0、FLOAT4_E2M1、FLOAT4_E1M2。
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品 、 Atlas A2 训练系列产品/Atlas A2 推理系列产品 :数据类型不支持 HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、FLOAT8_E8M0、FLOAT4_E2M1、FLOAT4_E1M2。

输出 shape 计算

y.shape[d] = x.shape[d] + paddings[d][0] + paddings[d][1]

约束说明

  1. 维度约束

    • x 的维度数必须在 [1, 8] 范围内
    • paddings 的第一维必须等于 x 的维度数
    • paddings 的第二维必须等于 2
  2. 数据类型约束

    • x、constant_values、y 必须使用相同的数据类型
    • paddings 必须使用 INT32 或 INT64
  3. 填充约束

    • 负填充(slice)时,输出 shape = x.shape[d] + left + right >= 0
  4. paddings 参数约束

    • paddings 的形状必须为 [rank, 2],其中 rank 为输入 x 的维度数(1~8)
    • 每一行 [left, right] 表示对应维度的填充数量
      • left: 在该维度的开头填充的元素数
      • right: 在该维度的末尾填充的元素数
    • paddings的值可以为:
      • 正数:表示填充
      • 负数:表示 slice(裁剪)
      • 零:表示不填充

调用说明

调用方式调用样例说明
aclnn 调用test_geir_pad_v2.cpp通过 算子IR 接口方式调用 PadV2 算子

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 3:42:57

无人搬运平台锂电池包完整设计方案要求【浩博电池】

无人搬运平台(Unmanned Transport Platform)锂电池广泛应用于港口无人运输车、厂区重载运输平台、矿山无人运输系统、智能工厂重型物流底盘、军工无人载重平台以及特种移动机器人底盘系统。该类平台的本质是“可扩展的重载移动能源动力底盘”&#xff0c…

作者头像 李华
网站建设 2026/5/10 3:39:55

知识蒸馏与Transformer在能源管理中的优化应用

1. 知识蒸馏与Transformer强化学习在能源管理中的融合住宅能源管理系统正面临前所未有的挑战。随着光伏发电的普及,家庭用电模式从单纯的消费者转变为"产消者",这种转变带来了复杂的能量调度问题。传统基于规则的控制器难以应对光伏发电的间歇…

作者头像 李华
网站建设 2026/5/10 3:39:53

AI智能体驱动无代码开发:从自然语言指令到完整Web应用实战

1. 项目概述:从一句指令到完整产品“一个人,一句话,一个产品。” 这听起来像是某个科技布道者的夸张口号,但《CEO of One》这个开源项目实实在在地把它变成了一个可执行、可复现的教程。它的核心主张非常激进:在2026年…

作者头像 李华
网站建设 2026/5/10 3:26:47

自动驾驶切入关键场景泛化生成与加速仿真测试【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)变分自编码器与扩散模型融合的场景参数生成&#x…

作者头像 李华
网站建设 2026/5/10 3:20:33

ASIC功能验证:基于规范的方法学与实践

1. ASIC功能验证的现状与挑战在当今的芯片设计领域,功能验证已成为整个开发流程中最耗时且资源密集的环节。根据行业统计数据,现代ASIC项目中验证工作占据了整个开发周期的50%-70%,而设计实现本身仅占较小比例。这种不平衡的资源分配直接反映…

作者头像 李华