news 2026/6/23 8:17:56

CANN/asc-devkit: asc_loadunalign非对齐加载接口

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit: asc_loadunalign非对齐加载接口

asc_loadunalign

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

reg计算数据搬运接口,适用于从UB非32B对齐的起始地址连续搬入矢量数据寄存器的场景。

该接口不改变源操作数在UB上的地址,每次循环的调用都需要用户手动更新源操作数在UB上的地址。

函数原型

__simd_callee__ inline void asc_loadunalign(vector_int8_t& dst, vector_load_unalign& src0, __ubuf__ int8_t *src1) __simd_callee__ inline void asc_loadunalign(vector_uint8_t& dst, vector_load_unalign& src0, __ubuf__ uint8_t *src1) __simd_callee__ inline void asc_loadunalign(vector_int16_t& dst, vector_load_unalign& src0, __ubuf__ int16_t *src1) __simd_callee__ inline void asc_loadunalign(vector_uint16_t& dst, vector_load_unalign& src0, __ubuf__ uint16_t *src1) __simd_callee__ inline void asc_loadunalign(vector_int32_t& dst, vector_load_unalign& src0, __ubuf__ int32_t *src1) __simd_callee__ inline void asc_loadunalign(vector_uint32_t& dst, vector_load_unalign& src0, __ubuf__ uint32_t *src1) __simd_callee__ inline void asc_loadunalign(vector_half& dst, vector_load_unalign& src0, __ubuf__ half *src1) __simd_callee__ inline void asc_loadunalign(vector_float& dst, vector_load_unalign& src0, __ubuf__ float *src1) __simd_callee__ inline void asc_loadunalign(vector_int64_t& dst, vector_load_unalign& src0, __ubuf__ int64_t *src1) __simd_callee__ inline void asc_loadunalign(vector_bfloat16_t& dst, vector_load_unalign& src0, __ubuf__ bfloat16_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp8_e4m3fn_t& dst, vector_load_unalign& src0, __ubuf__ fp8_e4m3fn_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp8_e5m2_t& dst, vector_load_unalign& src0, __ubuf__ fp8_e5m2_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp8_e8m0_t& dst, vector_load_unalign& src0, __ubuf__ fp8_e8m0_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp4x2_e2m1_t& dst, vector_load_unalign& src0, __ubuf__ fp4x2_e2m1_t *src1) __simd_callee__ inline void asc_loadunalign(vector_fp4x2_e1m2_t& dst, vector_load_unalign& src0, __ubuf__ fp4x2_e1m2_t *src1) __simd_callee__ inline void asc_loadunalign(vector_hifloat8_t& dst, vector_load_unalign& src0, __ubuf__ hifloat8_t *src1) __simd_callee__ inline void asc_loadunalign(vector_int4x2_t& dst, vector_load_unalign& src0, __ubuf__ int4b_t *src1)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src0输入/输出非对齐寄存器,用于保存非对齐数据,长度32B。
src1输入源操作数(矢量)的起始地址。

矢量数据寄存器和非对齐寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

  • 该接口中的src1不需要32B对齐。
  • 调用该接口之前,需要调用asc_loadunalign_pre进行非对齐搬入前的初始化。

调用示例

vector_load_unalign ureg; __ubuf__ half* src = (__ubuf__ half*)asc_get_phy_buf_addr(0); uint32_t offset = 5; asc_loadunalign_pre(ureg, src + offset); vector_half dst; asc_loadunalign(dst, ureg, src + offset);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 6:50:13

工程师创富路径解析:从贸易红利到技术深潜的财富逻辑

1. 从两个“几千万”故事看工程师的财富路径最近和圈内几位老朋友聊天,听到了两个挺有意思的生意人故事。这两位老哥,背景都挺“硬核”——都是技术出身,一个搞过科研,一个干了一辈子嵌入式开发。巧的是,他们都在各自的…

作者头像 李华
网站建设 2026/6/8 1:20:02

Mermaid CLI实战指南:3步实现文本到专业图表的自动化转换

Mermaid CLI实战指南:3步实现文本到专业图表的自动化转换 【免费下载链接】mermaid-cli Command line tool for the Mermaid library 项目地址: https://gitcode.com/gh_mirrors/me/mermaid-cli 你是否曾经为了在文档中插入一张流程图而花费大量时间调整图形…

作者头像 李华
网站建设 2026/6/5 18:11:07

AI农业革命:数字田园的下一个十年

AI农业革命:数字田园的下一个十年种地和写代码一样酷:AI如何重塑中国农业想象一下这样的画面:金秋时节,东北黑土地上,联合收割机轰鸣而过,但驾驶舱里并没有人。GPS定位精准导航、传感器实时监测产量、无人农…

作者头像 李华
网站建设 2026/6/5 18:07:09

FunClip终极指南:如何用AI在5分钟内完成专业级视频剪辑

FunClip终极指南:如何用AI在5分钟内完成专业级视频剪辑 【免费下载链接】FunClip Open-source, accurate and easy-to-use video speech recognition & clipping tool. LLM-based AI clipping integrated. 项目地址: https://gitcode.com/GitHub_Trending/fu/…

作者头像 李华
网站建设 2026/6/7 23:06:03

QQ音乐解析工具:一站式高效获取高品质音乐资源的技术方案

QQ音乐解析工具:一站式高效获取高品质音乐资源的技术方案 【免费下载链接】MCQTSS_QQMusic QQ音乐解析 项目地址: https://gitcode.com/gh_mirrors/mc/MCQTSS_QQMusic 在数字音乐时代,音乐爱好者们常常面临一个普遍难题:如何便捷地获取…

作者头像 李华