OpenAI Codex深度测评：从安装到实战，终端AI编程Agent的标杆之作

延伸阅读：DeepSeek编程Agent选型指南：Reasonix…、手把手教你用HeyGen Hyperframes+AI编…、Claude Code 使用技巧系列（五）：扩展能力全解…

2025年4月，OpenAI在GitHub上开源了Codex CLI，从此AI编程工具正式从”浏览器插件”时代迈入”终端Agent”时代。一年后的今天，Codex CLI已积累超过67,000个GitHub星标，完成了从TypeScript到Rust的全面重写，成为终端AI编程Agent的标杆之作。

更重要的是，Codex已经不再只是一个命令行工具——它是一个完整的AI编程基础设施，拥有OS级沙箱隔离、原生多Agent并行、MCP协议集成等企业级特性。

今天我们就来全面测评这款工具，从安装配置到横向对比，从安全机制到常见问题，帮你判断它是否值得成为你的下一个编程搭档。

一、Codex是什么？一句话说清楚

Codex CLI是OpenAI推出的开源终端AI编程Agent。它不是IDE插件，不是代码补全工具，而是一个能读懂你整个代码仓库、自主规划任务、跨文件编辑代码、执行命令并验证结果的AI助手。

它的核心特性：

本地执行：代码不会离开你的机器（除非你允许网络访问）
全仓库上下文：Agent读取整个项目目录结构，不只是当前打开的文件
沙箱隔离：Shell命令在OS级别被隔离（macOS Seatbelt / Linux Landlock）
可配置信任级别：三种审批策略，在自动化和控制之间自由调节
Apache 2.0开源：完全免费，社区可审计、可贡献

二、安装与配置

第一步：安装Node.js 22+

# macOS（推荐Homebrew）
brew install node

# Ubuntu/Debian
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt install -y nodejs

# 验证
node -v  # 应显示v22.x.x

Windows用户建议通过WSL2使用，或直接使用网页版（chatgpt.com/codex）。

第二步：安装Codex CLI

# 方式一：npm安装（推荐）
npm install -g @openai/codex

# 方式二：Homebrew（macOS）
brew install --cask codex

# 方式三：免安装直接运行
npx @openai/codex "explain this project"

第三步：登录

cd /path/to/your/project
codex

首次启动会引导你用ChatGPT账号登录。Codex包含在ChatGPT Plus（$20/月）、Pro、Business、Edu和Enterprise订阅中，无需额外付费。

第四步：配置项目（推荐）

在项目根目录创建AGENTS.md文件，定义项目规则和权限：

# AGENTS.md

## 权限
- 工作目录：允许读写
- 网络：外部请求前需确认
- Shell：自动批准测试运行器（pytest, jest, cargo test）
- Shell：包安装前需确认

## 项目上下文
这是一个Python FastAPI服务，主入口是 app/main.py。
运行测试：pytest tests/ -v
禁止修改 migrations/ 目录

三、三种安全模式详解

这是Codex最重要的配置决策，决定了Agent何时自主行动、何时等待你的批准。

1. Suggest模式（默认，最安全）

codex  # 默认即Suggest模式

Codex提出每一个操作——文件编辑、Shell命令——都等待你明确批准后执行。相当于AI起草、你决定。

适用场景：学习使用工具、处理关键生产代码、需要完全掌控每一次变更。

2. Auto-Edit模式

codex --approval-policy on-failure

Codex自动应用文件编辑，但在执行Shell命令前暂停。代码改动立即生效，但影响环境的操作（运行测试、安装包、调用外部服务）仍需确认。

适用场景：快速迭代代码，同时保持对副作用的安全控制。

3. Full-Auto模式

codex --full-auto

Codex在工作目录内自主读取文件、编辑代码、运行命令，无需批准。但在编辑工作目录外的文件或访问网络时仍会询问。

适用场景：批量处理任务、夜间自动运行、CI/CD流水线。

重要提示：即使在Full-Auto模式下，沙箱仍在OS级别执行隔离。Agent无法悄悄读取你的SSH密钥或连接远程服务器。

四、沙箱架构：为什么Full-Auto也安全？

Codex的沙箱是它最技术性的特性之一，也是你敢于使用Full-Auto的底气。

macOS：Apple Seatbelt

每个命令通过/usr/bin/sandbox-exec执行，Seatbelt策略控制：

文件系统访问：允许读写哪些路径
网络访问：是否允许打开网络连接
进程生成：沙箱命令可以创建哪些子进程

调试命令：

codex debug seatbelt -- python3 my_script.py

Linux：Landlock + seccomp

使用Landlock（文件系统访问控制）和seccomp（系统调用过滤）的组合，外加bubblewrap提供额外的进程隔离。

codex debug landlock -- python3 my_script.py

实际效果：即使Codex运行了恶意代码试图读取你的SSH密钥或连接远程服务器，沙箱也会在OS级别阻止它。

五、多Agent并行工作

Codex支持在同一仓库上同时运行多个Agent，使用隔离的git worktree：

# 终端1：重构认证模块
codex --worktree feature/auth "Refactor auth module to use JWT"

# 终端2：同时写测试
codex --worktree feature/tests "Write integration tests for payment service"

每个子Agent在独立的worktree中工作，文件变更不会冲突。完成后你审查各自的diff，选择性合并。

这种模式特别适合：

一个Agent写功能，另一个同时写测试
同时探索多种实现方案
自动代码审查：一个写代码，另一个审查

六、MCP集成：连接外部世界

Codex支持MCP协议，可以访问本地文件系统之外的工具和数据源。在config.toml中配置：

[mcp_servers.github]
command = "npx"
args = ["-y", "@modelcontextprotocol/server-github"]

[mcp_servers.postgres]
command = "npx"
args = ["-y", "@modelcontextprotocol/server-postgres", "postgresql://localhost/mydb"]

配置后，Codex可以查询数据库Schema、读取GitHub Issues，并将这些上下文融入代码变更中。

七、横向对比：Codex vs Claude Code vs Cursor

维度	OpenAI Codex	Claude Code	Cursor
开源协议	Apache 2.0	CLI开源	闭源
核心语言	Rust（95.6%）	TypeScript	TypeScript
配置标准	AGENTS.md	CLAUDE.md	.cursor/rules
沙箱	Seatbelt + Landlock	Seatbelt	无
多Agent	原生worktree	原生并行	Composer
MCP支持	✅	✅	❌
默认模型	GPT-5.3-Codex	Claude Sonnet/Opus	多模型可选
入门价格	$20/月	$20/月	$20/月
Terminal-Bench	77.3%	65.4%	N/A
网页版	✅ chatgpt.com/codex	❌	❌
Windows原生	⚠️ WSL2	⚠️ WSL2	✅

各工具核心优势对比

Codex最强：

终端原生任务速度（Terminal-Bench 77.3%领先）
OS级沙箱安全（最完善的隔离机制）
指令遵循精准（不会”自作主张”改计划外代码）
入门门槛低（网页版零安装）
性价比高（$20/月Plus即可用）

Claude Code最强：

深度语义理解（复杂重构、架构分析）
主动优化（会发现问题并提出改进建议）
双层记忆系统（用户级+项目级）
支持接入国内模型（DeepSeek、GLM等）

Cursor最强：

IDE集成体验（Tab补全、Cmd+K行内编辑）
Windows原生支持
新手友好度

八、常见问题与解决方法

Q1：Codex会发送我的代码到OpenAI服务器吗？

是的，提示词和代码上下文会发送到OpenAI的API生成响应，与使用ChatGPT网页版相同。沙箱控制的是本地命令执行，不影响API数据传输。如果关注数据隐私，可考虑企业数据协议，或使用社区fork open-codex接入Ollama等本地模型。

Q2：Plus用户的使用限制是什么？

Plus用户（$20/月）在每个5小时窗口内可获得30-150次Agent交互，具体取决于模型和任务复杂度。Pro和更高套餐解锁更高使用上限。

Q3：如何切换模型？

在交互会话中输入/model，可切换到GPT-5.4、GPT-5.3-Codex等可用模型。

Q4：Codex和GitHub Copilot有什么区别？

Copilot是IDE自动补全层，在你打字时建议下一行代码。Codex是自主Agent，你给它一个任务，它推理、规划、编辑文件、运行命令来完成目标。Copilot加速单个按键；Codex替代整个任务执行流程。

Q5：如何防止Codex读取敏感文件？

Codex没有内置的.env或.gitignore过滤器。最佳实践是在AGENTS.md中添加上下文排除规则：

[context]
exclude = [".env", "*.key", "secrets/"]

Q6：Windows上如何使用？

CLI版本建议通过WSL2使用。如果不想折腾终端，直接访问chatgpt.com/codex使用网页版，功能完全相同，浏览器即开即用。

Q7：沙箱导致命令执行失败怎么办？

使用调试命令排查：

# macOS
codex debug seatbelt -- python3 my_script.py

# Linux
codex debug landlock -- python3 my_script.py

多数沙箱失败是配置问题，不是Bug。检查AGENTS.md中的权限设置是否正确。

Q8：Full-Auto模式真的安全吗？

在合理配置的前提下是安全的。Full-Auto设置sandbox_mode = "workspace-write"和approval_policy = "on-request"，沙箱在OS级别强制执行边界。Agent无法悄悄外泄代码或安装系统级包。但建议先在Suggest模式下熟悉Agent的行为模式，再逐步放开权限。

Q9：国内网络如何使用？

Codex CLI需要访问OpenAI的API，国内直连可能受限。解决方案：

配置代理：设置HTTPS_PROXY环境变量
使用网页版：通过浏览器代理访问chatgpt.com/codex
使用open-codex fork：支持Ollama等本地模型，完全离线运行

Q10：如何让Codex记住项目偏好？

在项目根目录维护AGENTS.md文件，定义：

项目技术栈和入口文件
测试运行命令
禁止修改的目录
代码风格偏好
常用框架和约定

Codex每次启动都会读取这个文件作为上下文。

九、适用人群与选购建议

选Codex，如果你：

需要精准执行，AI严格按照指令操作不越界
有大量并行任务需要处理
重视安全性，需要OS级沙箱隔离
预算有限，$20/月Plus即可使用
不想安装任何东西，网页版即开即用
是终端重度用户，追求原生体验

选Claude Code，如果你：

需要深度理解和重构大型代码库
希望AI主动发现问题，给出架构建议
有长期项目，需要持久记忆
想接入国内模型（DeepSeek/GLM）

选Cursor，如果你：

80%时间在IDE内工作
需要Windows原生支持
是新手，想要最低上手门槛

重度用户建议：Codex + Claude Code组合

两者并非零和竞争。你甚至可以在Claude Code中安装Codex MCP插件，遇到复杂Bug时自动调用Codex辅助解决。大多数认真对待AI编程的团队，最终都会两者都用。

十、总结

Codex CLI是2026年最成熟的终端AI编程Agent之一。它的Rust架构保证了性能，OS级沙箱保证了安全，原生多Agent支持保证了效率，Apache 2.0开源保证了透明。

如果你已经订阅了ChatGPT Plus，Codex等于免费附赠了一个强大的编程Agent——没有理由不试试。如果你还在犹豫选哪个AI编程工具，Codex的网页版零门槛体验，是最好的起点。

AI编程工具仍在快速迭代，但有一点已经明确：终端Agent正在取代IDE插件，成为AI辅助编程的主流形态。而Codex，正是这个趋势的引领者之一。

💜 火山引擎 · 专属邀请