news 2026/5/10 3:06:34

CANN/ops-math 广播算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-math 广播算子

BroadcastTo

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

  • 算子功能:将输入tensor广播到指定的shape。如输入tensor的shape为(1, 4),指定的shape为(2, 4),则输出是shape为(2, 4)的tensor。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入张量需要被广播的张量。BF16、FLOAT16、FLOAT、 DOUBLE、INT64、INT32、UINT8、UINT16、UINT32、UINT64、INT8、INT16、COMPLEX32、COMPLEX64、COMPLEX128、QINT8、QUINT8、QINT16、QUINT16、QINT32、BOOL、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、STRINGND
shape输入张量表示 x 广播后的shape大小。INT64、INT32-
y输出维度最大不超过8维,shape由shape输入决定,dtype需要与self一致。同 xND

约束说明

调用说明

调用方式样例代码说明
图模式调用test_geir_broadcast_to通过算子IR构图方式调用broadcast_to算子。

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 3:06:01

CANN元数据定义Format转换API

FormatToSerialString 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能 将Format类型值转化为字符串表达。 从GCC 5.1版本开始,libstdc为了更好的实现C11规范,更改了std::string和st…

作者头像 李华
网站建设 2026/5/10 3:00:37

MCP服务器模板:快速构建AI数据连接器的脚手架指南

1. 项目概述:MCP服务器模板的定位与价值 最近在构建AI应用时,我经常需要让大语言模型(LLM)访问和处理外部数据源,比如数据库、API接口或者本地文件。传统的做法要么是写死一堆插件代码,要么就是让模型直接调…

作者头像 李华
网站建设 2026/5/10 2:53:14

AI应用测试工程2026:如何系统化测试你的LLM应用

"我们怎么测试AI应用?"是2026年AI工程师最常被问到的问题之一。传统软件测试方法在这里只够用一半,另一半需要全新的思路。本文给你一套完整的AI应用测试框架。一、AI应用测试的特殊挑战传统软件测试的假设:相同输入 → 相同输出AI…

作者头像 李华
网站建设 2026/5/10 2:51:37

为Cursor编辑器打造专属浅色主题:从色彩体系到实践应用

1. 主题设计的初衷与定位作为一名长期在代码编辑器里摸爬滚打的开发者,我深知一个趁手的开发环境有多重要。这不仅仅是功能层面的,更是视觉和体验层面的。我主力使用 Cursor 编辑器已经有一段时间了,它基于 VS Code,但在 AI 辅助编…

作者头像 李华
网站建设 2026/5/10 2:50:56

《龙虾OpenClaw系列:从嵌入式裸机到芯片级系统深度实战60课》037、流水线冒险——数据冒险、控制冒险与分支预测

OpenClaw系列037:流水线冒险——数据冒险、控制冒险与分支预测 一、一次让我熬夜到凌晨三点的调试 去年做一款RISC-V MCU的FPGA原型验证,跑CoreMark时发现IPC(每周期指令数)死活上不去,理论值0.9,实测只有0.6。用逻辑分析仪抓流水线状态,发现每三条指令就有一条被清空…

作者头像 李华
网站建设 2026/5/10 2:49:33

数字示波器频率响应与上升时间测量技术解析

1. 数字示波器频率响应基础解析在电子测量领域,频率响应特性是评估示波器性能的核心指标之一。传统模拟示波器采用多级模拟放大器串联架构,从输入端到CRT显示通常需要将信号放大三个数量级。这种结构自然形成了高斯频率响应特性,其数学表达式…

作者头像 李华