news 2026/4/18 9:11:05

CST软件非官方支持的GPU卡加速性能评估

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CST软件非官方支持的GPU卡加速性能评估

作者 | Wang Yuanteng

CST支持多核、GPU、分布式计算和MPI多种加速方式。对于使用工作站进行仿真的用户,多核和GPU加速是最为普遍采用的方式,尤其对于时域求解器,GPU加速提供了更加高效的加速效果(GPU具有更宽的带宽)。本期我们将会展示一些GPU及CPU的加速性能测试结果供用户参考。

在CST的Help中有专门的GPU Computing Guide,这份指导书能够帮助我们找到合适的GPU提升计算效率。其中第6章和第13章分别介绍了NVIDIA和AMD GPU卡使用的注意事项和官方支持的GPU卡列表。

以下为NVIDA GPU使用的注意事项,这里需特别注意红框中的两条:CST官方支持的GPU是经过同CST软件良好测试和验证过的;FP64性能低于FP32性能的GPU不适合需要FP64高性能的求解器。

这里以CST 2024版为例,如下是官方支持的NVIDIA GPU列表和性能参数。

我们重点关注的性能参数是内存、带宽和单精度(FP32)、双精度(FP64)。FP32格式除用于高性能计算外,一直也是深度学习使用的主力;FP64(双精度)格式则更多用于精度要求较高的科学计算,通常不用于深度学习计算。所以,我们可以看到出于应用领域不同,有些GPU卡的FP32和FP64性能差距是非常大的。在上面表格中已经通过注释3将这一类卡标出,对照GPU Computing Guide中2.1章节Supported Solvers and Features for NVIDIA GPUs,可以看到是I、M和A求解器对良好的双精度性能有要求。如果我们主要使用时域求解器进行计算,那么对双精度的要求则不是必须的。

因此,这次测试我选取了4个不同网格数量的模型使用时域求解器进行仿真对比。

这里测试使用的GPU卡为NVIDIA RTX 5880 Ada ,它是一款面向消费级和AI训推等专业领域应用的产品。我们将它与曾经的NVIDIA旗舰卡V100做个参数对比,可以看到在显存容量、显存带宽和单精度3个方面,RTX 5880 Ada 都有不错的性能参数。那具体在CST的仿真加速上会表现如何呢?

为了排除使用不同的CPU对整体计算时间的影响,仅对比仿真过程中的Loop time。

可以看到,其中3组结果,RTX5880性能都超过了V100。并且在总网格数量2亿的BleuCar算例中,一张V100无法完成计算的情况下,使用一张 RTX5880的性能已经接近两张V100了。这说明RTX5880在时域求解器的提速表现是非常不错的。

另外,由于一些客户对多核加速性能感兴趣,我们也进行了一组CPU多核加速的对比。所使用到的CPU是AMD Ryzen Threadripper PRO 7995WX,搭载96个物理核心,主频2.5GHz,最高睿频可至5.1GHz,这使其提供了卓越的计算能力。只使用这款CPU进行多核仿真也达到了不错的仿真效率,这里对比另外一款32核,2.0GHz主频的CPU,可以看到在4组仿真的速度提升都非常明显。

总的来说,我们仍然推荐用户首先考虑官网支持列表内的GPU进行计算提速,这些卡已经经过CST软件全面的测试和验证。但如果基于实际的市场情况必须考虑列表之外的GPU卡时,可以参考本例中的测试进行性能评估。如果没有GPU情况下,那么使用高性能的CPU也会使你的计算提速。

【相关内容】

CST仿真超表面怎么判断结果是否收敛?

CST studio suite的各种边界条件汇总-达索正版CST代理

除了S参数和Z参数,电磁仿真还涉及哪些参数?2026 CST软件原厂价

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 6:24:22

Dify 接入Coze 平台语音合成插件(MCP 服务)实战教程

🌐 简介 在 AI 应用开发中,语音合成(Text-to-Speech, TTS) 是提升用户体验的重要功能。本文将详细介绍如何在 Coze 平台上,通过 MCP 服务(HTTP 类型) 接入第三方语音合成插件,并完成…

作者头像 李华
网站建设 2026/4/18 8:21:00

收藏!AI会抢走程序员工作吗?小白必看的大模型生存指南

“AI真的会取代我这个程序员吗?” 这恐怕是当下每一位IT从业者,尤其是刚踩进行业门槛的编程小白,深夜辗转反侧时最常纠结的灵魂拷问。毕竟如今的AI大模型,在开发场景里的表现实在太过“逆天”,简直是把“效率神器”焊在…

作者头像 李华
网站建设 2026/4/17 16:28:06

收藏!大模型学习与就业/保研全指南:前景、门槛与实操建议

大模型领域无疑是当下AI赛道的核心风口,前景广阔却也暗藏挑战——就业市场需求持续爆发,但行业门槛居高不下。无论是求职的程序员、入门小白,还是计划保研深造的学子,都需精准把握核心能力要求、找对发力方向。本文将从大模型基础…

作者头像 李华
网站建设 2026/4/17 16:48:33

自建埋点分析系统的成本对比(含 ClkLog 开源方案)

很多团队在业务发展到一定阶段后,都会认真评估一次:用户行为分析系统,是继续用现成产品,还是自己搭一套?实际上,当企业需要埋点分析时,往往已经没有太多时间成本可投入。 业务方希望尽快看到数据…

作者头像 李华