news 2026/5/9 14:19:36

CANN驱动PCIe错误查询API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN驱动PCIe错误查询API

dcmi_get_device_pcie_error_cnt

【免费下载链接】driver本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。项目地址: https://gitcode.com/cann/driver

函数原型

int dcmi_get_device_pcie_error_cnt(int card_id, int device_id, struct dcmi_chip_pcie_err_rate *pcie_err_code_info)

功能说明

查询芯片的PCIe链路误码信息。

参数说明

参数名称

输入/输出

类型

描述

card_id

输入

int

设备ID,当前实际支持的ID通过dcmi_get_card_list接口获取。

device_id

输入

int

芯片ID,通过dcmi_get_device_id_in_card接口获取。取值范围如下:

NPU芯片:[0, device_id_max-1]。

pcie_err_code_info

输出

struct dcmi_chip_pcie_err_rate *

struct dcmi_chip_pcie_err_rate {

unsigned int reg_deskew_fifo_overflow_intr_status;//是否发生deskew_fifo溢出:1表示已发生,0表示未发生。

unsigned int reg_symbol_unlock_intr_status;//是否发生symbol_unlock事件:1表示已发生,0表示未发生。

unsigned int reg_deskew_unlock_intr_status;//是否发生deskew_unlock事件:1表示已发生,0表示未发生。

unsigned int reg_phystatus_timeout_intr_status;//是否发生phystatus超时事件:1表示已发生,0表示未发生。

unsigned int symbol_unlock_counter;//symbol_unlock错误计数

unsigned int pcs_rx_err_cnt;//PCS层接收错误计数

unsigned int phy_lane_err_counter;//lane错误计数

unsigned int pcs_rcv_err_status;//PCS层接收错误状态,每bit映射到每个使用的通道:1表示有错误,0表示正常。

unsigned int symbol_unlock_err_status;//symbol_unlock标志,每bit映射到每个使用的通道:1表示有错误,0表示正常。

unsigned int phy_lane_err_status;//lane错误,每bit映射到每个使用的通道:1表示有错误,0表示正常。

unsigned int dl_lcrc_err_num;//PCIe DLLP LCRC的错误计数

unsigned int dl_dcrc_err_num;//PCIe DLLP DCRC的错误计数

};

返回值说明

类型

描述

int

处理结果:

  • 成功:返回0。
  • 失败:返回码请参见return_codes。

异常处理

无。

约束说明

设备重新启动后请先清除芯片的PCIe链路误码信息。

表 1不同部署场景下的支持情况

产品形态

物理机场景(裸机)root用户

物理机场景(裸机)运行用户组(非root用户)

物理机+普通容器场景root用户

Atlas 900 A2 PoD 集群基础单元

N

N

N

Atlas 800T A2 训练服务器

N

N

N

Atlas 800I A2 推理服务器

N

N

N

Atlas 200T A2 Box16 异构子框

N

N

N

A200I A2 Box 异构组件

N

N

N

Atlas 300I A2 推理卡

N

N

N

Atlas 300T A2 训练卡

N

N

N

注:Y表示支持;N表示不支持;NA表示不涉及,当前未规划此场景。

调用示例

int ret = 0; int card_id = 0; int device_id = 0; struct dcmi_chip_pcie_err_rate pcie_err_code_info = {0}; ret = dcmi_get_device_pcie_error_cnt(card_id, device_id, &pcie_err_code_info); …

【免费下载链接】driver本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。项目地址: https://gitcode.com/cann/driver

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:17:32

CANN运行时简单模型实例示例

0_simple_model 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 描述 本样例展示了如何捕获Stream中的任务并创建一个模型实例,然后执行该模型实例得到结果。 产品支持情况 本样例在以下…

作者头像 李华
网站建设 2026/5/9 14:14:31

CANN竞赛Cumsum算子测试报告

【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 元信息(请如实填写,此区块将由组委会脚本自动解析&#xf…

作者头像 李华
网站建设 2026/5/9 14:13:30

CANN FlashAttention反向梯度计算V4

aclnnFlashAttentionScoreGradV4 【免费下载链接】ops-transformer 本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-transformer 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√A…

作者头像 李华
网站建设 2026/5/9 14:11:50

FPGA-MPSoC边缘AI加速实战:从模型量化到硬件部署全解析

1. 项目概述:为什么要在边缘用FPGA-MPSoC做AI加速?这几年,但凡跟AI沾边的项目,无论是自动驾驶里识别一个突然窜出来的行人,还是工厂质检摄像头判断一个零件的瑕疵,大家挂在嘴边的都是“实时性”和“低功耗”…

作者头像 李华
网站建设 2026/5/9 14:11:01

股市学习心得-近期感悟和总结

作为一个新手,经过一段时间的学习和交易,我感同深受的认识到了一些东西。现在写出来总结自己也分享给大家,看能不能引起共鸣,同时让大家少踩坑。一、持股总结目前这个阶段,轮动特别快,没有特别确定的主线&a…

作者头像 李华
网站建设 2026/5/9 14:11:00

换背景颜色怎么操作?一个微信小程序就能搞定,免费无限使用

最近有个朋友问我,"换背景颜色怎么操作啊?我有张证件照,想换个蓝底的。"我才意识到,很多人可能还在用PS或者其他复杂的工具来处理这个问题。其实现在换背景颜色已经变得超简单了,今天就给大家分享一下我最常…

作者头像 李华