news 2026/5/9 21:41:32

CANN/pyasc max函数API文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc max函数API文档

asc.language.basic.max

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, count: int, is_set_mask: bool = True) → None

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: int, repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: List[int], repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

按元素求最大值。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, const int32_t& count);
template <typename T, bool isSetMask = true> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask[], const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);
template <typename T, bool isSetMask = true> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask, const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);

参数说明

  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src0, src1:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count:参与计算的元素个数。
  • mask:用于控制每次迭代内参与计算的元素。
  • repeat_times:重复迭代次数。
  • params:控制操作数地址步长的参数。
  • is_set_mask: 是否在接口内部设置mask。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。
  • 使用整个tensor参与计算接口符号重载时,运算量为目的LocalTensor的总长度。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 128 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.max(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.max(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.max(dst, src0, src1, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 21:39:44

JSON可视化利器:用图形思维解析复杂数据结构

1. 项目概述&#xff1a;从JSON到可视化图谱的“降维打击”如果你也经常和JSON数据打交道&#xff0c;尤其是那种嵌套了七八层、动辄几千行的配置文件或者API响应&#xff0c;那你一定懂我的痛苦。盯着密密麻麻的括号和引号&#xff0c;想理清一个对象里到底有什么、谁引用了谁…

作者头像 李华
网站建设 2026/5/9 21:36:59

用Pluto SDR和MATLAB复现经典:四种模拟波形传输实测与波形畸变全解析

用Pluto SDR和MATLAB复现经典&#xff1a;四种模拟波形传输实测与波形畸变全解析 在通信工程实验室里&#xff0c;我们常常需要验证教科书上的理论——那些关于信号完整性、采样定理和滤波器效应的数学推导&#xff0c;是否真的能在实际硬件中重现&#xff1f;Pluto SDR作为一…

作者头像 李华
网站建设 2026/5/9 21:36:56

硬件木马检测:跨尺度持久性分析方法解析

1. 硬件木马检测的挑战与现状硬件木马&#xff08;Hardware Trojans, HTs&#xff09;已成为集成电路安全领域最严峻的威胁之一。与软件层面的恶意代码不同&#xff0c;硬件木马直接植入芯片设计或制造环节&#xff0c;具有物理层面的隐蔽性和持久性。其中&#xff0c;始终激活…

作者头像 李华
网站建设 2026/5/9 21:35:46

金融大模型FinGLM:从架构设计到生产部署的实战指南

1. 项目概述&#xff1a;当大语言模型遇上金融垂直领域最近几年&#xff0c;大语言模型&#xff08;LLM&#xff09;的风潮席卷了几乎所有行业&#xff0c;从代码生成到创意写作&#xff0c;无所不能。但作为一名在金融科技领域摸爬滚打了十多年的从业者&#xff0c;我一直在思…

作者头像 李华
网站建设 2026/5/9 21:35:15

为OpenClaw智能体工作流配置Taotoken后端

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 为OpenClaw智能体工作流配置Taotoken后端 对于使用OpenClaw框架构建AI智能体的开发者而言&#xff0c;将后端服务接入稳定、多模型…

作者头像 李华