ExecuTorch 并入 PyTorch Core 之后，端侧大模型真正变的不是推理速度：我更建议先看导出、后端和分发这 3 层-程序员充电站

ExecuTorch 并入 PyTorch Core 之后，端侧大模型真正变的不是推理速度：我更建议先看导出、后端和分发这 3 层

很多人还把“端侧大模型”当成 runtime 选型题：谁更快、谁更省内存。可 2026 年 4 月真正变化的不是 benchmark，而是 PyTorch 和 Google 都开始把导出、运行、分发拧成一条完整交付链。
这篇文章不做 benchmark 排行，也不复述发布会。我更想回答一个对工程团队更值钱的问题：如果你今年准备做本地/端侧大模型，为什么现在最该看的不是 tok/s，而是导出链、硬件后端和应用分发？

1. 这波信号不是“又来一个边缘 runtime”，而是两家都在补整条栈

如果只看单个项目，ExecuTorch 或 LiteRT-LM 都可以被误读成“某家厂商的新 runtime”。但把时间线和落地方向拼起来看，这两条线的意图都比 runtime 更大。

先看 PyTorch 这边。

PyTorch 官方在 2026 年 4 月 7 日的博客里明确说，ExecuTorch 正在成为 PyTorch Core 的一部分，目标是扩展 on-device inference 能力。更关键的不是“项目升级了名分”，而是博客反复强调三件事：

ExecuTorch 想提供从 PyTorch 作者态到端侧部署的一致开发体验。
- 它希望成为 portable、hardware-agnostic 的共享

别再折腾OpenStack了！用Go写的Nano云平台，3分钟在CentOS 7上跑起来

轻量级云平台Nano实战：3分钟在CentOS 7搭建私有云的完整指南当你在个人服务器或小团队环境中需要快速搭建私有云时，OpenStack这类庞然大物往往让人望而却步。配置复杂、资源占用高、学习曲线陡峭，这些痛点让许多开发者转向更轻量级的解决方案…

李华

用友U8系统越用越卡？可能是UA_Message表在‘吃’性能！定期维护教程来了

用友U8系统性能优化：从UA_Message表切入的全面维护方案用友U8作为企业核心ERP系统，随着使用时间增长，不少管理员会发现系统响应速度逐渐下降。登录缓慢、操作卡顿成为高频投诉，而问题根源往往隐藏在数据库深处。其中&#xff0c…

李华

告别烧录器！用JTAG接口给CPLD在线升级的保姆级教程（以Lattice为例）

告别烧录器！用JTAG接口给CPLD在线升级的保姆级教程（以Lattice为例） 在硬件开发领域，CPLD（复杂可编程逻辑器件）的固件升级一直是个让人头疼的问题。传统方法依赖昂贵的专用烧录器，不仅成本高&…

李华

避坑指南：STM32 ADC采集光敏电阻数据的那些坑（从硬件连接到软件滤波）

STM32光敏电阻数据采集实战：从硬件设计到软件优化的避坑指南当你在昏暗的房间里打开手机闪光灯对准光敏电阻模块时，ADC读数却纹丝不动——这种令人抓狂的场景，每个嵌入式开发者都经历过。光敏电阻作为最基础的光强传感器，看似简…

李华

ExecuTorch 并入 PyTorch Core 之后，端侧大模型真正变的不是推理速度：我更建议先看导出、后端和分发这 3 层