CANN/cann-bench：Gcd算子API描述-程序员充电站

Gcd 算子 API 描述

【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力，涵盖算子生成、算子优化等领域，支撑模型选型、训练效果评估，统一量化评估标准，识别Agent能力短板，构建CANN领域评测平台，推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench

1. 算子简介

计算两个整数的最大公约数。

主要应用场景：

整数约分与最简分数计算
数组维度对齐与分块策略中的公因子计算
密码学中的模运算与欧几里得算法相关场景

算子特征：

难度等级：L2（Broadcast）
双输入单输出，逐元素运算，输入支持广播

2. 算子定义

数学公式

$$ y = \gcd(x_1, x_2) $$

其中 $\gcd(a, b)$ 表示 $a$ 与 $b$ 的最大公约数，即同时整除 $a$ 和 $b$ 的最大正整数。当 $a = b = 0$ 时，$\gcd(0, 0) = 0$。

3. 接口规范

算子原型

cann_bench.gcd(Tensor x1, Tensor x2) -> Tensor y

输入参数说明

参数	类型	默认值	描述
x1	Tensor	必选	第1个输入张量
x2	Tensor	必选	第2个输入张量

输出

参数	Shape	dtype	描述
y	广播后的 shape	与输入一致	输出张量，最大公约数

数据类型

输入 dtype	输出 dtype
int16	int16
int32	int32
int64	int64

规则与约束

两个输入张量的 shape 需满足广播规则，输出 shape 为广播后的 shape
两个输入张量的 dtype 必须一致
仅支持整数类型（int16、int32、int64）
Golden 实现使用torch.gcd直接计算，输出 dtype 与输入保持一致

4. 精度要求

采用生态算子精度标准进行验证。

误差指标：

平均相对误差（MERE）：采样点中相对误差平均值
$$ \text{MERE} = \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)+\text{1e-7}}) $$
最大相对误差（MARE）：采样点中相对误差最大值
$$ \text{MARE} = \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)+\text{1e-7}}) $$

通过标准：

数据类型	FLOAT16	BFLOAT16	FLOAT32	HiFLOAT32	FLOAT8 E4M3	FLOAT8 E5M2
通过阈值(Threshold)	2^-10	2^-7	2^-13	2^-11	2^-3	2^-2

当平均相对误差 MERE < Threshold，最大相对误差 MARE < 10 * Threshold 时判定为通过。

5. 标准 Golden 代码

import torch """ Gcd算子Torch Golden参考实现 计算两个整数的最大公约数 公式: y = gcd(x1, x2) """ def gcd( x1: torch.Tensor, x2: torch.Tensor ) -> torch.Tensor: """ 计算两个整数的最大公约数 公式: y = gcd(x1, x2) Args: x1: 第1个输入张量 x2: 第2个输入张量 Returns: 输出张量，最大公约数（dtype 与输入一致） """ y = torch.gcd(x1, x2) return y

6. 额外信息

算子调用示例

import torch import cann_bench x1 = torch.randint(-1000, 1000, (1024, 1024), dtype=torch.int32, device="npu") x2 = torch.randint(-1000, 1000, (1024, 1024), dtype=torch.int32, device="npu") y = cann_bench.gcd(x1, x2) # 广播场景 x1 = torch.randint(-100, 100, (2048, 512), dtype=torch.int16, device="npu") x2 = torch.randint(-10, 10, (1, 512), dtype=torch.int16, device="npu") y = cann_bench.gcd(x1, x2)

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

XML 映射文件快速生成方案：提升开发效率的利器

在后端开发中，尤其是在使用 MyBatis、Hibernate 等 ORM 框架时，XML 映射文件是不可或缺的一部分。然而，手动编写这些文件往往非常耗时且容易出错，特别是当数据库表结构复杂、字段众多时，这种低效的手工劳动会严重拖慢开…

李华

移动端AI推理框架PocketPaw：架构解析与实战部署指南

1. 项目概述：一个为移动端优化的AI模型推理框架最近在移动端AI应用开发圈子里，一个名为PocketPaw的项目开始引起不少开发者的注意。简单来说，PocketPaw是一个专门为移动设备（尤其是Android和iOS）优化的轻量级AI模型推理…

李华

TABDSR框架：表格数据处理与复杂数值推理解决方案

1. TABDSR框架概述TABDSR框架是专门针对表格数据中复杂数值推理问题设计的系统性解决方案。这个框架的名字来源于其三个核心处理阶段：Table decomposition（表格分解）、Bad data cleaning（不良数据清理）和Symbolic reas…

李华

构建可信AI：XAI评估框架的多维度实践与挑战

1. 项目概述：从“黑箱”到“白箱”的必经之路最近几年，人工智能，特别是深度学习模型，在图像识别、自然语言处理等领域取得了令人瞩目的成就。然而，一个日益凸显的挑战是：这些模型往往以“黑箱”的形式运作。…

李华

基于GRU与注意力机制的ICU多重耐药菌感染风险预测模型构建与应用

1. 项目概述与核心价值在重症监护室（ICU）里，时间就是生命，而感染则是悬在患者和医生头顶的达摩克利斯之剑。其中，多重耐药菌（MDRO）感染更是让临床治疗陷入困境的“硬骨头”——常规抗生素无效&a…

李华

CANN/ge DataFlow C++接口参考

DataFlow构图接口参考（C） 【免费下载链接】ge GE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。…

李华