news 2026/4/18 12:35:50

Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

Amazon EC2 G7e实例现已正式可用,为生成式AI推理和图形工作负载提供高性价比与卓越性能。

Amazon EC2 G7e实例搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU,适用于空间计算、科学计算等多种GPU加速型工作负载。相较于Amazon EC2 G6e实例,Amazon EC2 G7e实例的推理性能最高可提升2.3倍。

与前代实例相比,Amazon EC2 G7e实例的核心升级如下:

NVIDIA RTX PRO 6000 Blackwell GPU:相比Amazon EC2 G6e,Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存,用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。

NVIDIA GPUDirect P2P:对于单块GPU内存无法承载的模型,用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术,通过PCIe互连实现GPU间的直接通信,从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外,与G6e实例搭载的L40s GPU相比,G7e实例的GPU间带宽最高可提升4倍,大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务,并且这些GPU提供的GPU内存总容量可高达768GB。

网络性能:Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍,可满足小规模多节点工作负载的运行需求。同时,多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问(RDMA),有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage,与Amazon EC2 G6e实例相比,实例吞吐量最高可提升至1.2Tbps,助力用户更快加载模型。

Amazon EC2 G7e规格参数

Amazon EC2 G7e实例最高可配置8块NVIDIA RTX PRO 6000 Blackwell服务器版GPU,GPU内存总量最高可达768GB(单块GPU配备96GB内存),并搭载Intel Emerald Rapids处理器,支持最高192个vCPU、1600Gbps网络带宽、2048GiB系统内存以及15.2TB本地NVMe SSD存储。

Amazon EC2 G7e实例具体规格参数如下:

您可借助Amazon Deep Learning AMIs(DLAMI)运行机器学习工作负载,启动Amazon EC2 G7e实例,并通过亚马逊云科技管理控制台、Amazon CLI及SDK进行操作,搭配Amazon ECS、Amazon EKS可获得托管式体验。该实例对Amazon SageMaker AI的支持功能即将上线。

现已可用

Amazon EC2 G7e实例现已在美国东部(北弗吉尼亚州)与美国东部(俄亥俄州)的亚马逊云科技区域可用。如需了解该实例区域部署情况及未来规划,请参阅亚马逊云科技区域功能页面的Amazon CloudFormation资源标签页中搜索。

Amazon EC2 G7e实例支持On-Demand Instances、Savings Plan及Spot Instances三种方式购买,以及Dedicated Instances与Dedicated Hosts两种部署模式。定价详情参阅Amazon EC2定价页面。

即刻前往Amazon EC2控制台上手体验!更多信息请参阅Amazon EC2 G7e实例页面

亚马逊云科技区域功能页面:

https://builder.aws.com/build/capabilities/explore?tab=cfn-resources&trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

Amazon EC2定价页面:

https://aws.amazon.com/ec2/pricing

Amazon EC2 G7e实例页面:

https://aws.amazon.com/ec2/instance-types/g7e/?trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

本篇作者

Channy

亚马逊云科技新闻博客首席博主、首席开发者布道师。

新用户注册海外区域账户,可获得最高200美元服务抵扣金,覆盖Amazon Bedrock生成式AI相关服务。“免费计划”账户类型,确保零花费,安心试用。

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

点击阅读原文查看博客!获得更详细内容!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 8:49:41

Speech Seaco Paraformer微信技术支持?科哥对接流程与问题反馈指南

Speech Seaco Paraformer微信技术支持?科哥对接流程与问题反馈指南 1. Speech Seaco Paraformer ASR阿里中文语音识别模型 构建by科哥 Speech Seaco Paraformer 是基于阿里云 FunASR 开源项目开发的高性能中文语音识别系统,由开发者“科哥”完成本地化…

作者头像 李华
网站建设 2026/4/17 17:55:58

WinSetView终极指南:3分钟搞定Windows文件夹视图统一配置

WinSetView终极指南:3分钟搞定Windows文件夹视图统一配置 【免费下载链接】WinSetView Globally Set Explorer Folder Views 项目地址: https://gitcode.com/gh_mirrors/wi/WinSetView 还在为Windows资源管理器中杂乱的文件夹视图而烦恼?每次打开…

作者头像 李华
网站建设 2026/4/17 22:59:47

终极Android投屏神器:QtScrcpy完整使用指南

终极Android投屏神器:QtScrcpy完整使用指南 【免费下载链接】QtScrcpy QtScrcpy 可以通过 USB / 网络连接Android设备,并进行显示和控制。无需root权限。 项目地址: https://gitcode.com/GitHub_Trending/qt/QtScrcpy QtScrcpy是一款功能强大的An…

作者头像 李华
网站建设 2026/4/17 17:52:08

IPTV频道智能检测工具:告别播放卡顿的终极解决方案

IPTV频道智能检测工具:告别播放卡顿的终极解决方案 【免费下载链接】iptv-checker IPTV source checker tool for Docker to check if your playlist is available 项目地址: https://gitcode.com/GitHub_Trending/ip/iptv-checker 还在为IPTV频道频繁失效而…

作者头像 李华
网站建设 2026/4/18 4:51:56

告别环境配置!用YOLOv13镜像一键启动目标检测

告别环境配置!用YOLOv13镜像一键启动目标检测 你是否也曾为跑通一个目标检测模型,花上整整两天时间折腾环境?CUDA版本不对、PyTorch不兼容、依赖包冲突……这些“配置地狱”问题,早已成为AI开发路上的常态。但现在,这…

作者头像 李华