news 2026/4/18 13:33:41

AMD Nitro-E:304M轻量AI绘图4步出图39.3张/秒

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Nitro-E:304M轻量AI绘图4步出图39.3张/秒

AMD Nitro-E:304M轻量AI绘图4步出图39.3张/秒

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日推出轻量级文本到图像扩散模型Nitro-E,以304M参数实现高效AI绘图,其蒸馏版本在单张AMD Instinct MI300X GPU上可达到39.3张/秒的生成速度,仅需4步推理即可完成512px图像生成,为资源受限场景下的高效图像合成提供新选择。

当前AI绘图领域正面临性能与效率的双重挑战。随着Stable Diffusion、Midjourney等模型推动AIGC普及,行业对生成速度和硬件成本的敏感度持续提升。据行业观察,现有主流文生图模型通常需要数十亿参数规模和数十步推理过程,在普通硬件上生成单张图像耗时常达数秒甚至数十秒。同时,企业级应用对批量处理能力的需求,使得模型效率成为制约落地的关键因素。在此背景下,轻量化、高吞吐的AI绘图模型成为技术突破的重要方向。

Nitro-E系列模型的核心优势在于"轻量高效"的设计哲学。该模型采用AMD提出的Efficient Multimodal Diffusion Transformer(E-MMDiT)架构,通过三重技术创新实现性能突破:首先采用高压缩率视觉tokenizer和多路径压缩模块,大幅降低计算密集型的token数量;其次引入Position Reinforcement技术增强空间连贯性,配合Alternating Subregion Attention(ASA)机制在子区域内进行注意力计算;最后通过AdaLN-affine模块优化Transformer块中的调制参数计算,在304M参数规模下保持生成质量。

该系列包含三个版本:基础版Nitro-E-512px为20步推理模型,从 scratch 训练仅需8张MI300X GPU组成的单节点训练1.5天;蒸馏版Nitro-E-512px-dist将推理步数压缩至4步,实现39.3张/秒的吞吐量;GRPO版本则通过Group Relative Policy Optimization策略进一步优化生成效果。这种多层次产品矩阵设计,使其能够适配从实时交互到批量处理的多样化场景需求。

Nitro-E的推出将加速AI绘图技术的工业化应用。对于开发者而言,304M的轻量模型显著降低部署门槛,仅需消费级GPU即可实现高性能推理;对企业用户,39.3张/秒的吞吐能力意味着单卡每日可处理超300万张图像,大幅降低云端AIGC服务的硬件投入。特别在电商商品图生成、游戏素材批量制作、虚拟人场景渲染等领域,该模型的高效特性有望重塑生产流程。值得注意的是,模型训练采用约2500万张公开图像数据,包括Segment-Anything-1B、JourneyDB等数据集,基于MIT许可证开源,进一步降低行业应用门槛。

从技术演进角度看,Nitro-E代表了AI绘图模型向"高效实用化"发展的重要趋势。其4步推理、39.3张/秒的性能指标,将推动实时AIGC交互成为可能,而304M参数规模为边缘设备部署开辟新路径。随着AMD将ROCm生态与AI模型深度整合,硬件-软件协同优化可能成为下一代AIGC技术的竞争焦点。未来,随着模型在1024px高分辨率生成、风格迁移等方向的持续优化,轻量级文生图模型有望在内容创作、广告营销、教育培训等领域催生更多创新应用场景。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 11:18:44

清华镜像支持CDN加速:全球范围内PyTorch访问优化

清华镜像支持CDN加速:全球范围内PyTorch访问优化 在人工智能技术高速发展的今天,深度学习项目的启动效率往往直接决定了研发节奏。然而,许多开发者都曾经历过这样的场景:深夜准备开始训练模型,结果 pip install torch…

作者头像 李华
网站建设 2026/4/18 11:01:58

手把手教你如何在嵌入式系统中选型理想二极管

嵌入式电源设计的“隐形冠军”:如何用理想二极管打造高效、可靠的供电系统?你有没有遇到过这样的问题——一块小小的肖特基二极管,在你的便携设备里发烫得像个小火炉?电池明明还有电,却因为外部电源轻微反灌而提前耗尽…

作者头像 李华
网站建设 2026/4/18 8:05:40

GitHub Discussions开启PyTorch社区问答板块

GitHub Discussions开启PyTorch社区问答板块 在深度学习领域,一个常见的开发困境是:明明代码逻辑正确,却因为环境差异导致“在我机器上能跑”的尴尬局面。更不用说新手面对复杂的 CUDA、cuDNN 和 PyTorch 版本匹配时的无所适从。而与此同时&a…

作者头像 李华
网站建设 2026/4/14 1:22:43

RePKG工具终极指南:3步解锁Wallpaper Engine壁纸资源

RePKG工具终极指南:3步解锁Wallpaper Engine壁纸资源 【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg RePKG工具作为专业的Wallpaper Engine资源解包解决方案&#xff0c…

作者头像 李华
网站建设 2026/4/18 7:53:59

终极DLSS版本管理指南:掌握DLSS Swapper的完整使用技巧

终极DLSS版本管理指南:掌握DLSS Swapper的完整使用技巧 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 如果你正在寻找一种能够完全掌控游戏DLSS版本的方法,那么DLSS Swapper正是你需要的解决方…

作者头像 李华
网站建设 2026/4/18 8:29:40

如何快速掌握终极自动化抢票工具:告别手忙脚乱

还在为心仪演唱会门票秒空而苦恼吗?手动刷新总是慢人一步,网络延迟让你与偶像失之交臂。现在,一款基于Python的自动化抢票工具DamaiHelper横空出世,用技术手段让普通用户也能轻松抢到心仪的门票!这款大麦网抢票神器采用…

作者头像 李华