news 2026/4/18 3:14:14

如何快速测试GPU的推理速度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何快速测试GPU的推理速度
importtorchimporttime# 1. 设置设备iftorch.cuda.is_available(): device=torch.device("cuda")print(f"检测到设备: {torch.cuda.get_device_name(0)}")else: device=torch.device("cpu")print("使用 CPU")# 2. 增加矩阵尺寸,让 GPU 有事可做 (比如 4000x4000 或 8000x8000)# 1000x1000 对高端卡来说太小了size=4000print(f"正在初始化矩阵 (Size: {size}x{size})...")A=torch.randn(size, size,device=device)B=torch.randn(size, size,device=device)# --- 关键步骤:GPU 预热 (Warm-up) ---print("正在进行 GPU 预热 (第一次运行通常很慢)...")# 跑几次空运算,触发库加载和初始化for_inrange(5): _=torch.mm(A, B)torch.cuda.synchronize()print("预热完成,开始正式计时!")# ------------------------------------# 3. 正式计时 GPUtorch.cuda.synchronize()start_time=time.time()# 循环多次取平均值更准确loop_times=10for_inrange(loop_times): C=torch.mm(A, B)torch.cuda.synchronize()# 等待所有计算完成end_time=time.time()avg_gpu_time=(end_time - start_time)/ loop_times print(f"GPU 平均运行时间: {avg_gpu_time:.5f} 秒")# 4. 对比 CPU (如果尺寸太大,CPU可能会非常慢,建议 CPU 测试时如果太慢就减少 loop)iftorch.cuda.is_available(): print("正在准备 CPU 数据 (这可能需要一点时间)...")A_cpu=A.cpu()B_cpu=B.cpu()start_time_cpu=time.time()# CPU 一般不需要像 GPU 那样严格预热,但跑一次也没坏处# 注意:如果 size 是 4000,CPU 跑这 10 次可能会很慢cpu_loops=2# 减少 CPU 循环次数以免等太久for_inrange(cpu_loops): C_cpu=torch.mm(A_cpu, B_cpu)end_time_cpu=time.time()avg_cpu_time=(end_time_cpu - start_time_cpu)/ cpu_loops print(f"CPU 平均运行时间: {avg_cpu_time:.5f} 秒")# 修正加速比公式:CPU时间 / GPU时间speedup=avg_cpu_time / avg_gpu_time print(f"---")print(f"真实性能对比: GPU 比 CPU 快 {speedup:.2f} 倍")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 0:22:19

深入探索µC/OS-III:从入门到精通的嵌入式实时操作系统指南

深入探索C/OS-III:从入门到精通的嵌入式实时操作系统指南 【免费下载链接】uC-OS3 项目地址: https://gitcode.com/gh_mirrors/uco/uC-OS3 C/OS-III是一个功能强大的开源实时操作系统,专为嵌入式系统设计。无论您是刚接触嵌入式开发的新手&#…

作者头像 李华
网站建设 2026/4/17 20:36:19

智能垃圾分类革命:40类AI识别模型如何改变城市环保生态

智能垃圾分类革命:40类AI识别模型如何改变城市环保生态 【免费下载链接】垃圾分类数据集 项目地址: https://ai.gitcode.com/ai53_19/garbage_datasets 当传统垃圾分类遭遇人工智能,一场城市环保的智能化变革正在悄然发生。在这个数字化时代&…

作者头像 李华
网站建设 2026/4/18 1:57:21

混元3D-1.0破局:AI技术如何重塑三维内容产业格局

当传统3D建模7天制作周期与专业技能门槛长期制约数字内容产业发展时,腾讯混元3D-1.0的出现正在重新定义从创意到实现的价值链条。这项技术突破标志着三维内容创作从手工时代迈入智能生成的新纪元。 【免费下载链接】Hunyuan3D-1 项目地址: https://ai.gitcode.co…

作者头像 李华
网站建设 2026/4/18 1:58:01

mbedtls之使用ecdh进行密钥协商代码示例

步骤: 双方生成各自的ECC密钥对(或一方已有固定密钥对)。 交换公钥。 执行ECDH计算,得到共享密钥。 使用共享密钥派生对称加密密钥(如通过哈希)。 使用对称加密算法(如AES-GCM)进行通信。 服务端生成共享密钥 #include "mbedtls/ecdh.h" #include &quo…

作者头像 李华
网站建设 2026/4/18 2:04:33

学生信息管理系统(11454)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告)远程调试控屏包运行 三、技术介绍 Java…

作者头像 李华
网站建设 2026/4/18 2:02:31

6000万买Oracle ERP软件值吗?越研究越心虚?底气反而在国内

6000万一套Oracle ERP,真相比你想象得更扎心前几天刷到一个关于SAP的科普视频,底下有条评论让我愣了好几秒,他大概意思是说:在2002年,他在国内某集团就用Oracle ERP,当时是6000万一套!图源网络&…

作者头像 李华