什么是 Codex
Codex 是 OpenAI 推出的 AI 编程助手,基于 GPT-5.x Codex 模型构建。2026 年 4 月的重大更新后,Codex 已从单纯的代码助手进化为全能型桌面 AI Agent,能够像真人一样操控你的电脑、完成各种任务。
核心能力:
- 读写代码、执行命令
- 通过 Computer Use 控制计算机
- 内置浏览器预览网页和前端开发
- 生成图片
- 连接 90+ 第三方插件
- 记忆用户偏好、自动执行定时任务
安装与使用方式
四种使用方式
方式 | 说明 | 推荐度 |
Desktop App | 桌面应用程序(推荐) | ⭐⭐⭐⭐⭐ |
VS Code 扩展 | 在 VS Code 中直接使用 | ⭐⭐⭐⭐ |
CLI 命令行 | 通过终端使用 | ⭐⭐⭐ |
下载安装
- 访问 openai.com/codex 下载应用
- 安装后使用 ChatGPT 账号登录
- 开始使用
会员等级说明:
- Plus/Pro 会员
界面与核心概念
文件夹与线程(Threads)
Codex 的核心组织方式:
层级 | 作用 |
文件夹(工作区) | 存放代码和资料,类似项目目录 |
线程(Thread) | 存放对话和任务过程,类似具体话题 |
最佳实践:同一文件夹内处理同一方向的任务,同一线程内只推进一件具体的事。
模型选择(已更新 GPT 5.5 )
模型 | 说明 | 适用场景 |
GPT 5.4 | 主推模型,平衡能力与速度 | 日常任务 |
GPT 5.4-mini | 轻量版,更快更便宜 | 简单任务 |
Spark | 极速模式 | 需要 Max 订阅 |
推理深度
档位 | 说明 |
低 | 快速响应,适合简单任务 |
中 | 平衡模式(推荐日常使用) |
高 | 深度思考,适合复杂任务 |
Extra High | 适合大活硬活 |
主要功能详解
1. Computer Use(计算机使用能力)
Codex 可以控制你的光标,像真人一样操作电脑上的所有应用程序。
可以完成:
- 打开应用程序
- 点击按钮、输入文字
- 浏览网页并填写表单
- 操作没有开放 API 的软件
适用场景:
- 前端效果调试和应用测试
- 自动发布内容到社交媒体
- 定时执行服务器巡检
- 操作未开放 API 的应用
注意:Computer Use 功能目前仅在 macOS 上推出
2. 内置浏览器
直接在 Codex 内渲染和预览网页,支持在页面上直接添加评论进行迭代。
优势:
- 无需切换窗口即可测试网页开发
- 可以直接在页面上标注要修改的位置
- 支持 HTML 游戏预览
3. 图片生成
集成 GPT Image 2.5 模型,可直接在 Codex 内生成图片。
使用场景:
- 产品概念图和 UI 设计
- 前端视觉素材
- 游戏开发素材
4. 插件生态(90+ 插件)
类别 | 插件示例 |
开发工具 | Jira、CircleCI、CodeRabbit、GitLab Issues |
办公套件 | Microsoft Suite |
数据库 | Neon by Databricks |
其他 | Raycast、Superpowers 等 |
安装方式:在设置中点击添加即可。
5. 记忆功能
Codex 可以跨对话记住:
- 用户偏好设置
- 过往的修正
- 费时获取的上下文
让 Codex 越用越懂你,产出质量更稳定。
6. 自动化任务
支持定时任务(类似 cron jobs):
- 每天早上自动检查代码质量
- 定时推送更新到 GitHub
- 定期备份重要文件
- 跨平台监控(Slack、Gmail、Notion)
7. 主动建议
Codex 会根据项目上下文、已连接的插件和记忆,主动建议下一步工作:
- 识别需要关注的待处理事项
- 提供按优先级排序的行动清单
- 从多个来源提取相关背景
提示词技巧
四要素法(4 Pillars)
编写有效提示词的四个关键要素:
要素 | 说明 | 示例 |
Goal | 目标是什么 | 创建一个用户登录页面 |
Context | 相关文件和文档 | 参考现有的 design-system |
Constraints | 架构和框架限制 | 使用 React + Tailwind |
Done When | 完成后验证条件 | 所有测试通过,无 console 错误 |
Plan Mode(计划模式)
对于大型项目,建议先使用 Plan Mode:
- 描述你的需求
- Codex 生成详细的实现计划
- 确认计划后开始开发
使用方式:在对话框中输入/计划模式启用。
AGENTS.md 使用指南
AGENTS.md 是定义项目规范和行为准则的文件,Codex 会自动加载并遵循这些指令。
加载层级
路径 | 说明 |
| 全局配置 |
| 项目规则 |
| 局部规则 |
良好 AGENTS.md 的要素
要素 | 说明 |
仓库布局 | 重要的目录和文件组织结构 |
运行方式 | 如何构建、运行和测试项目 |
命令说明 | 构建、测试、lint 等命令 |
工程约定 | 代码风格、命名规范、PR 期望 |
约束规则 | 禁止事项和必须遵守的规则 |
完成标准 | Done 的定义和验证方法 |
示例模板
# 项目规范 ## 代码风格 - 使用 Python 3.11+ - 所有函数必须写类型注解 ## 执行流程 - 写代码后必须运行 pytest - 失败必须自动修复 ## 工具使用 - 搜索文件用 rg,不用 grep - 不要修改 .env 文件 ## 完成标准 - 所有测试通过 - 无 lint 错误Skills 与 MCP
Skills(技能)
可重用的工作流模板,支持:
- 创建自己的 Skills
- 分享给团队使用
- 从社区获取现成的 Skills
Codex 提供可视化的 Skill Creator,可通过对话方式创建。
MCP(Model Context Protocol)
第三方集成协议,让 Codex 能够连接外部服务和工具,扩展能力边界。
高级功能
子代理(Sub-agents)
并行处理复杂任务,保护主线程上下文不被污染。
使用场景:
- 同时处理多个功能模块
- 需要并行运行测试
- 复杂的多步骤任务
Worktrees
分支隔离机制,支持并行开发:
- 不同分支之间互不干扰
- 可以同时运行多个实例
- 轻松切换工作上下文
对话管理命令(cli 命令)
命令 | 用途 |
| 压缩过长对话,节省上下文 |
| 创建分支对话,尝试不同方案 |
| 启用计划模式,先规划再执行 |
最佳实践总结
工作流优化
- 单实例单任务原则:每个实例专注于一个任务,避免上下文污染
- 合理分类:先规划好文件夹和线程的结构
- 使用 Plan Mode:大型项目先规划再执行
- 自动化前验证:确保流程稳定后再创建自动化任务
提示词优化
- 使用四要素法(Goal/Context/Constraints/Done When)
- 将重复规则放入 AGENTS.md
- 保持规则简洁明了
- 定期更新以适应项目变化
记忆管理
- 利用 AGENTS.md 建立长期记忆
- 及时使用
/compact压缩长对话(cli 版本) - 使用
/fork创建分支尝试不同方案(cli 版本)