news 2026/5/9 12:30:27

CANN/catlass Gemm/Block类模板概述

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/catlass Gemm/Block类模板概述

Gemm/Block 类模板概述

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

API 清单

blockMmad清单

组件描述
block_mmad基础模板,包含BlockMmad
block_mmad_pingpongBlockMmad偏特化实现,pingpong矩阵乘

swizzle清单

组件描述
block_swizzleswizzle基本方法介绍
GemmIdentityBlockSwizzleGemm算子基础swizzle策略

API 拆解

blockMmad

封装了Block层的mmad计算(矩阵乘计算),对应于昇腾NPU的一个AI Core上的计算。 通过模板参数,BlockMmad_接收矩阵计算中的Shape(特征尺寸)、Layout(数据排布,如行优先、列优先排布)与DType(数据类型)方面的信息。

命名空间为Catlass::Gemm::Block,包含如下核心成员:

类型名称功能
构造函数BlockMmad()通常包含初始化buffer、Event ID,插入流水间同步setFlag
析构函数~BlockMmad()通常包含插入流水间同步waitFlag
函数void operator()执行一个block任务块的矩阵乘计算

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:28:54

数据不再是成本,而是资产:企业为何必须拥抱数据治理?

在许多企业的月度经营分析会上,常会出现以下尴尬局面:销售副总裁汇报客户增长率为15%,财务总监测算的销售收入增幅仅为8%,而市场部展示的获客名单又与两者截然不同。各部门不仅为业绩好坏争执不休,更因“哪个数据才是真…

作者头像 李华
网站建设 2026/5/9 12:28:38

CANN/metadef C_Format接口

C_Format 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef typedef enum {C_FORMAT_NCHW 0, // NCHWC_FORMAT_NHWC, // NHWCC_FORMAT_ND, // Nd TensorC_FORMAT_NC1HWC0, // NC1HWC0C_FORMAT_FRAC…

作者头像 李华
网站建设 2026/5/9 12:27:49

GD32中的DMA使用教程

一、概述平台:GD32F4XX资源:DMA,当前系列的DMA可分为DMA0和DMA1,每个DMA各有8个通道,总共16个通道可以映射到外设,提供使用数据:长度最大65536,支持8位,16位和32位的数据…

作者头像 李华
网站建设 2026/5/9 12:26:42

CANN/ops-tensor算子开发指南

算子开发指南 【免费下载链接】ops-tensor ops-tensor 是 CANN (Compute Architecture for Neural Networks)算子库中提供张量类计算的基础算子库,采用模块化设计,支持灵活的算子开发和管理。 项目地址: https://gitcode.com/ca…

作者头像 李华
网站建设 2026/5/9 12:26:38

CANN/ops-math矩阵对角线生成算子

MatrixDiagV3 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持 Ascend 950PR/Ascend 950DT √ Atlas A3 训练系列产品/Atlas A3 推理…

作者头像 李华
网站建设 2026/5/9 12:25:28

从热图到文本:多模态可解释AI的技术原理与实践路径

1. 项目概述:为什么我们需要“看得懂”的AI决策?在人工智能,特别是深度学习模型日益渗透到医疗诊断、自动驾驶、金融风控等关键领域的今天,一个核心的信任危机也随之浮现:我们如何相信一个“黑箱”做出的决定&#xff…

作者头像 李华