项目分享|在家搭建AI集群：exo让普通设备也能跑大模型-程序员充电站

引言

随着大模型参数规模不断提升，单台设备的显存、算力瓶颈成为普通开发者部署大模型的核心障碍——要么模型因显存不足无法运行，要么推理速度极慢。而exo项目的出现解决了这一痛点：它能将日常设备（如Mac Studio、MacBook）连接成一个AI集群，不仅能运行远超单设备显存容量的大模型，还能通过RDMA等技术大幅提升推理速度，让个人用户也能低成本搭建专属AI集群。

项目核心定位与功能

exo是一款面向个人用户的AI集群管理工具，核心目标是让普通人用日常设备搭建分布式AI集群，轻松运行超大参数量的大模型。

它的核心功能覆盖集群全生命周期：设备层面支持自动发现，无需手动配置即可让多台设备组建集群；模型运行层面支持张量并行，能将大模型分片部署到多台设备上，实测在4台M3 Ultra Mac Studio组成的集群中，可流畅运行Qwen3-235B、DeepSeek v3.1 671B、Kimi K2 Thinking等超大模型；此外，exo还提供可视化仪表盘和OpenAI兼容的API，降低集群使用门槛。

核心创新点与优势

exo能突破单设备限制，核心源于四大关键创新与优势：

自动设备发现：集群内设备无需手动配置，启动exo后自动识别彼此，降低集群搭建门槛；
RDMA over Thunderbolt 5支持：原生支持RDMA（远程直接内存访问），可将设备间通信延迟降低99%，这也是exo相比传统分布式框架的核心优势；
拓扑感知自动并行：实时感知设备拓扑结构，结合设备资源、网络带宽/延迟动态规划模型分片策略，最大化集群效率；
张量并行提速：支持模型分片部署，实测2台设备可实现1.8倍提速，4台设备达3.2倍；
MLX生态适配：基于MLX（苹果生态高效推理框架）和MLX distributed做分布式通信，适配Apple Silicon硬件特性，性能更优。

部署与技术实践

1. 环境部署（分系统）

macOS部署（从源码运行）

先安装依赖：

# 安装brew/bin/bash -c"$(curl-fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"# 安装uv、macmon、nodebrewinstalluv macmonnode# 安装Rust（nightly版本）curl--proto'=https'--tlsv1.2 -sSf https://sh.rustup.rs|shrustup toolchaininstallnightly

再克隆代码并运行：

# 克隆仓库gitclone https://github.com/exo-explore/exo# 构建仪表盘cdexo/dashboard&&npminstall&&npmrun build&&cd..# 启动exouv run exo

启动后可访问http://localhost:52415查看仪表盘和API。

Linux部署（从源码运行）

以Ubuntu/Debian为例安装依赖：

# 安装Node.js和npmsudoaptupdatesudoaptinstallnodejsnpm# 安装uvcurl-LsSf https://astral.sh/uv/install.sh|sh# 安装Rust（nightly版本）curl--proto'=https'--tlsv1.2 -sSf https://sh.rustup.rs|shrustup toolchaininstallnightly

克隆代码并运行（步骤同macOS，无需安装macmon）：

gitclone https://github.com/exo-explore/exocdexo/dashboard&&npminstall&&npmrun build&&cd..uv run exo

2. 启用RDMA（macOS）

RDMA是exo高性能的核心，需在macOS 26.2+（Thunderbolt 5设备）中启用：

关闭Mac，长按电源键10秒进入启动菜单；
选择“Options”进入恢复模式，打开“实用工具”→“终端”；
执行命令启用RDMA：rdma_ctl enable；
重启Mac即可。

3. API使用示例

预览模型部署方案

curl"http://localhost:52415/instance/previews?model_id=llama-3.2-1b"

创建模型实例

curl-X POST http://localhost:52415/instance\-H'Content-Type: application/json'\-d'{ "instance": {...} # 替换为预览接口返回的instance内容 }'

发送聊天补全请求（兼容OpenAI API）

curl-N -X POST http://localhost:52415/v1/chat/completions\-H'Content-Type: application/json'\-d'{ "model": "mlx-community/Llama-3.2-1B-Instruct-4bit", "messages": [ {"role": "user", "content": "What is Llama 3.2 1B?"} ], "stream": true }'

删除模型实例

curl-X DELETE http://localhost:52415/instance/YOUR_INSTANCE_ID

该项目及相关内容已 AladdinEdu课题广场同步发布，欢迎前往了解更多技术实现与资源。

项目地址：AladdinEdu课题广场

好写作AI：弱势学科资源差距——AI写作工具是否会加剧学术不平等？

学术资源的“数字鸿沟”：一个新命题当我们在讨论AI如何赋能学术写作时，一个无法回避的伦理问题随之浮现：智能工具的普及，是否会进一步拉大资源丰富与资源匮乏学科及院校之间的差距，制造新的“数字学术鸿沟”&#xf…

李华

.net core项目里，如何实现前端选择文件夹上传大附件？

2023年XX月XX日外包项目攻坚日志 - 20G级文件传输系统开发实录 （关键词：信创环境兼容/海量文件存储/企业级断点续传/简历镀金项目） 凌晨3点：需求风暴会议复盘客户作为省级档案数字化服务商，提出的变态需求&#xff…

李华

元类魔法揭秘：那 99% 的优雅与 1% 的必需

元类魔法揭秘：那 99% 的优雅与 1% 的必需开篇：当我第一次遇见元类还记得五年前，我在重构一个复杂的 ORM 框架时，第一次真正理解了 Tim Peters 那句著名的话："元类就是深度的魔法，99% 的用户应该根本不必为此操心。"当时的我，盯着 SQLAlchemy 源码中那些令…

李华

生成式AI是助手还是威胁？GDC报告：过半游戏开发者担忧其负面影响

PC Gamer 今日报道，根据游戏开发者大会（GDC）最新发布的《2026 游戏行业现状》调查报告，超过半数的游戏开发者认为，生成式 AI 对游戏行业产生了负面影响，这一比例较两年前大幅上升。 IT之家援引博文介绍&…

李华

uniapp微信小程序php python的图书馆图书借阅管理系统_52v82

文章目录系统概述技术架构核心功能实现要点部署与扩展系统设计与实现的思路主要技术与实现手段源码lw获取/同行可拿货,招校园代理 ：文章底部获取博主联系方式！ 系统概述该图书馆图书借阅管理系统基于Uniapp框架开发，支持微信小程序端&…

李华

万字详解内网渗透该怎么学！黑客技术零基础入门到精通实战教程建议收藏！

前言： 本文主要记录了作者之前在内网渗透的一个全方面的学习过程，包括如何从外网找到入口点，之后如何提权，然后如何在内网中进行一个信息收集，当存在域的情况下又是怎么收集信息，然后通过代理来进一步横向…

李华