news 2026/5/9 11:17:31

CANN/ge:昇腾图引擎GE

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ge:昇腾图引擎GE

GE(Graph Engine 图引擎)

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

🔥 Latest News

  • [2026/03] 持续增强图优化能力,完善单元测试覆盖,修复多个边缘场景的编译问题;优化文档结构,提升开发者体验。
  • [2026/02] 优化自动融合与广播场景支持,新增 BF16 数据类型支持;增强 HostCPU 引擎能力,优化 session 创建销毁锁机制;修复外置权重、线程加载等场景下的 bug;支持 Reduce 分核轴 Store 地址冲突惩罚,提升算子融合效果。
  • [2026/01] GE 项目首次上线,开源图编译器和执行器,支持 PyTorch、TensorFlow 前端接入以及 ONNX、PB 模型格式解析与编译。

🚀 概述

GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。详见昇腾社区文档-图模式开发指南。

⚡️ 快速入门

若希望快速体验 GE 的工作方式及基本开发流程,可参考以下文档:

  • 构建验证:介绍组件的完整构建、测试样例运行流程。
  • 快速开始:以 ResNet50 模型为例,介绍如何使用 ATC 工具进行模型转换,并在昇腾 AI 处理器上执行推理。
  • 快速开始-LLM:以 Qwen 模型为例,介绍如何使用 ATC 工具进行LLM模型转换,并实现LLM模型的加载、执行和获取执行结果等。

📚 文档

如需了解如何使用 GE 进行模型编译与执行,可参见图模式开发指南、技术文章等内容: GE 参考资料

如果希望深入了解 GE 的内部设计、架构机制与开发流程,可参考以下文档:

  • GE 架构说明文档:介绍核心组件、执行流程、优化机制等内部原理。
  • 贡献指南:说明如何提交 Issue、Pull Request 以及代码规范。
  • AI Agent支持:介绍仓内默认使用的一些skills及使用agent辅助开发流程

🌐 生态集成

以下项目已集成 GE 作为推理或图模式后端:

  • TorchAir:将 GE 接入 PyTorch 图模式。链接
  • TFA(TensorFlow Adapter):将 GE 作为 TensorFlow 后端。链接
  • JittorInfer:基于昇腾芯片的大模型 C++ 推理框架。链接
  • Triton GE Backend:GE 的 Triton Inference Server 后端。链接

说明:上述列表为已知并对外公开的集成案例,并非完整清单。 若您正在使用 GE,欢迎通过 Issue 或 PR 补充,我们将持续更新相关信息。

📝 其他信息

  • 安全声明
  • 许可证

📝 联系我们

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 11:13:53

DS2431与DS2430A 1-Wire EEPROM对比与迁移指南

1. 项目概述在嵌入式系统设计中,1-Wire EEPROM因其简单的单线接口和稳定的非易失性存储特性,被广泛用于设备标识、配置参数存储等场景。DS2430A作为经典的256位1-Wire EEPROM,曾广泛应用于各类嵌入式设备中。但随着应用需求的增长&#xff0c…

作者头像 李华
网站建设 2026/5/9 11:13:51

脉冲神经网络与事件相机的自监督学习新方法

1. SpikeCLR:脉冲神经网络的自监督学习新范式在计算机视觉领域,事件相机(Event-based Camera)正逐渐崭露头角。与传统帧式相机不同,事件相机通过异步方式记录每个像素的亮度变化,输出稀疏的事件流&#xff…

作者头像 李华
网站建设 2026/5/9 11:12:34

一款基于.NET开源的爬虫库,小白也能直接上手,简单、全能,高效

🌈前言做开发、做数据分析、做内容运营的朋友,经常会有抓取各大平台热榜、热门资讯、榜单数据的需求。自己从零写爬虫,要处理请求头、适配接口规则、做解析、加缓存、搭代理池,不仅耗时费力,还要反复适配各个平台格式&…

作者头像 李华
网站建设 2026/5/9 11:08:52

CANN GE后端CN_CLIP优化示例

CN_CLIP模型优化示例 【免费下载链接】triton-inference-server-ge-backend ge-backend基于triton inference server框架实现对接NPU生态,快速实现传统CV\NLP等模型的服务化。 项目地址: https://gitcode.com/cann/triton-inference-server-ge-backend CLIP全…

作者头像 李华
网站建设 2026/5/9 11:08:30

增量备份为什么还是这么慢?KingbaseES块级永久增量备份给出答案!

🔥承渊政道:个人主页 ❄️个人专栏: 《C语言基础语法知识》 《数据结构与算法》 《C知识内容》 《Linux系统知识》 《算法刷题指南》 《测评文章活动推广》 《大模型语言路线学习》 ✨逆境不吐心中苦,顺境不忘来时路!✨ 🎬 博主简介: 增量备…

作者头像 李华
网站建设 2026/5/9 11:06:31

AI入门学习之工地人员图像识别 基于深度学习的YOLOv11施工人员安全装备识别系统 工地安全图像识别

YOLOv11 施工人员安全装备识别系统 1. 数据集预处理与增强本项目的数据集构建过程经过精心设计,主要包含以下关键步骤:原始数据采集: 通过多渠道网络爬取施工现场图像,初步收集30张包含各类施工人员的现场作业图片图片涵盖不同光照…

作者头像 李华