CANN/pyasc max函数API文档-程序员充电站

asc.language.basic.max

【免费下载链接】pyasc本项目为Python用户提供算子编程接口，支持在昇腾AI处理器上加速计算，接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, count: int, is_set_mask: bool = True) → None

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: int, repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: List[int], repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

按元素求最大值。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, const int32_t& count);

template <typename T, bool isSetMask = true> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask[], const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);

template <typename T, bool isSetMask = true> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask, const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);

参数说明

dst：目的操作数。类型为LocalTensor，支持的TPosition为VECIN/VECCALC/VECOUT。
src0, src1：源操作数。类型为LocalTensor，支持的TPosition为VECIN/VECCALC/VECOUT。
count：参与计算的元素个数。
mask：用于控制每次迭代内参与计算的元素。
repeat_times：重复迭代次数。
params：控制操作数地址步长的参数。
is_set_mask: 是否在接口内部设置mask。

约束说明

操作数地址对齐要求请参见《Ascend C算子开发接口》中的“通用说明和约束-通用地址对齐约束”。
操作数地址重叠约束请参考《Ascend C算子开发接口》中的“通用说明和约束-通用地址重叠约束”。
使用整个tensor参与计算接口符号重载时，运算量为目的LocalTensor的总长度。

调用示例

tensor高维切分计算样例-mask连续模式

mask = 128 # repeat_times = 4，一次迭代计算128个数，共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1，单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8，相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.max(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)

tensor高维切分计算样例-mask逐bit模式

mask = [uint64_max, uint64_max] # repeat_times = 4，一次迭代计算128个数，共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1，单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8，相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.max(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)

tensor前n个数据计算样例
```
asc.max(dst, src0, src1, count=512)
```

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

JSON可视化利器：用图形思维解析复杂数据结构

1. 项目概述：从JSON到可视化图谱的“降维打击”如果你也经常和JSON数据打交道，尤其是那种嵌套了七八层、动辄几千行的配置文件或者API响应，那你一定懂我的痛苦。盯着密密麻麻的括号和引号，想理清一个对象里到底有什么、谁引用了谁…

李华

2026年论文引言部分AI率偏高攻略：引言绪论章节免费降AI处理知网达标完整操作指南

2026年论文引言部分AI率偏高攻略：引言绪论章节免费降AI处理知网达标完整操作指南截止日期逼近，AI率还有71%。从论坛找资料、问学长、实测工具，最后用嘎嘎降AI（www.aigcleaner.com）把71%降到了6.2%，4.8元…

李华

用Pluto SDR和MATLAB复现经典：四种模拟波形传输实测与波形畸变全解析

用Pluto SDR和MATLAB复现经典：四种模拟波形传输实测与波形畸变全解析在通信工程实验室里，我们常常需要验证教科书上的理论——那些关于信号完整性、采样定理和滤波器效应的数学推导，是否真的能在实际硬件中重现？Pluto SDR作为一…

李华

硬件木马检测：跨尺度持久性分析方法解析

1. 硬件木马检测的挑战与现状硬件木马（Hardware Trojans, HTs）已成为集成电路安全领域最严峻的威胁之一。与软件层面的恶意代码不同，硬件木马直接植入芯片设计或制造环节，具有物理层面的隐蔽性和持久性。其中，始终激活…

李华

金融大模型FinGLM：从架构设计到生产部署的实战指南

1. 项目概述：当大语言模型遇上金融垂直领域最近几年，大语言模型（LLM）的风潮席卷了几乎所有行业，从代码生成到创意写作，无所不能。但作为一名在金融科技领域摸爬滚打了十多年的从业者，我一直在思…

李华

为OpenClaw智能体工作流配置Taotoken后端

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度为OpenClaw智能体工作流配置Taotoken后端对于使用OpenClaw框架构建AI智能体的开发者而言，将后端服务接入稳定、多模型…

李华