外观
Codex Goal Mode 阅读笔记:先把边界说清楚,再让它持续推进
约 1834 字大约 6 分钟
OpenClawCodexGoal modeAI工具
2026-06-14
来源:Ce Sun 在 X 发布的文章《Codex Goal 正式上线了,但我建议你先别急着把它当自动驾驶》,发布于 2026-05-22。本文是站内阅读笔记和摘要,不是全文转载。完整语境请阅读 原文状态 或 X Article。
这篇文章值得收进 OpenClaw 这一栏,因为它讨论的不是某个单点命令,而是 AI 开发助手该如何被“约束着持续工作”。这和个人技术基建很相关:我不只是想让助手能干活,还要让它知道边界、验收标准和什么时候该停下来。
我摘到的核心观点
Goal mode 不应该被理解成“自动驾驶”。它更像一个持续执行合同:人先定义目标、边界、证据和暂停条件,Codex 再围绕这个目标一轮一轮推进。
作者最有用的一句提醒是:“Goal 最大的敌人就是模糊。”
这句话基本可以作为使用 Goal 的总原则。目标越像感觉,越容易跑偏;目标越像证据,越容易真的完成。
Goal 到底解决什么问题
普通对话适合做下一步明确的小任务,比如改一个文案、查一个配置、修一个小 bug。Goal 更适合那些路径不确定、但终点可验证的任务。
官方文档里也把它描述成一种面向长任务的持久目标:给 Codex 一个可验证的停止条件,让它围绕同一个目标持续工作,而不是每一轮都等你说“继续”。
我理解下来,它解决的是这类问题:
- 任务不是一步能做完,但有明确完成证据。
- 中间需要反复尝试、构建、测试、修正。
- 人不想一直盯着每一轮,但又不能完全放开边界。
- 需要一个进度线索,避免长任务跑到后面只剩“好像做了很多”。
什么时候适合开 Goal
我把文章里的判断标准概括成三点:任务够长、过程偏重复、结果能验收。
放到我自己的工作里,适合开 Goal 的场景大概是这些:
- 迁移一批页面或脚本,直到构建和关键页面验证通过。
- 修一组 flaky tests,直到能稳定复现、修复并通过验证。
- 做一次较大的 UI 调整,要求桌面端和手机端都截图验收。
- 优化发布流程,直到
build -> deploy -> verify全链路跑通。 - 处理一批文章导入,要求分类、脱敏、构建和线上链接都正确。
- 做一次安全巡检,要求输出明确的发现、风险等级和修复建议。
这些任务都有共同点:过程可能绕,但终点能检查。
什么时候不要开 Goal
不要把 Goal 当成“让 AI 替我想清楚一切”的按钮。下面这些任务不适合直接开:
- “把这个项目变好”。
- “帮我随便优化一下”。
- “你自由发挥”。
- 一堆互不相关的 backlog。
- 还没定方向的产品判断。
- 需要审美取舍、商业取舍或权限判断的事情。
这些应该先普通对话,必要时先进入 Plan:让 Codex 读项目、拆目标、列风险、写验收方式。等目标变成可以执行的合同时,再开 Goal。
一个好 Goal 至少包含什么
我会把它压成五个要素:
- 目标:最终要完成什么。
- 证据:用什么证明它完成了。
- 边界:能改哪里,不能碰哪里。
- 节奏:每个阶段怎么推进,是否要更新进度。
- 停止条件:什么时候不能继续硬跑。
如果缺少这些内容,Goal 会很容易变成“努力了很久,但不知道对不对”。
我会怎么写给 Codex
下面是一个适合这个博客项目的模板:
/goal 根据 docs/执行计划.md 完成这次 Sumjess 博客改造,直到构建通过、线上关键页面可访问、Git 工作区干净。
先读取:
- docs/执行计划.md
- package.json
- scripts/publish.sh
- 相关 VuePress 组件和文章目录
工作规则:
- 只允许修改 Sumjess 博客源码目录。
- 不要改 Nginx、LifeOS、媒体库、其他 Docker 项目或其他网站。
- 每完成一个阶段,运行对应验证命令,并把结果记录到进度文件。
- 发布前先构建,发布后检查 deploy-info 和关键页面。
- 不要输出任何密码、Token 或服务器敏感路径。
暂停条件:
- 同一个构建或发布错误连续失败 2 次。
- 需要生产密钥、第三方后台权限或未知外部配置。
- 发现任务范围会影响其他项目。
- 验收标准无法判断。
暂停时说明:
- 已完成什么。
- 跑过哪些验证。
- 当前阻塞点。
- 下一步建议。这个模板的重点不是字多,而是把“做完”变成可以检查的状态。
对 OpenClaw / 个人技术基建的启发
我现在更倾向于把 AI 助手分成两类工作模式:
- 对话模式:适合讨论、设计、判断、澄清需求。
- Goal 模式:适合已经定义清楚的执行循环。
OpenClaw 或 Codex 这类助手如果要长期参与我的系统维护,就不能只靠“聪明”。它必须被任务边界约束住。
比如维护这个博客时,比较合理的约束是:
- 只能改当前博客源码目录,不在公开文章里暴露服务器绝对路径。
- 只发布
www.sumjess.com。 - 只使用博客自己的
publish.sh。 - 生成内容要构建通过。
- 新文章要有来源、分类、脱敏检查和线上链接。
- 涉及其他项目时必须停下来说明。
这样 AI 才像一个可靠的工程助手,而不是一个到处乱试的自动化脚本。
我的使用原则
以后我会按这个顺序使用 Goal:
- 先普通对话,把任务讲清楚。
- 让 Codex 写计划和验收条件。
- 我确认边界,尤其是“不能动哪里”。
- 再开 Goal,让它持续执行。
- 完成后另开 review 或至少看 diff、构建结果、线上效果。
尤其是服务器、备份、发布、密钥、访问安全这些事情,Goal 不能直接拿到无限权限。它适合推进,不适合替我决定风险边界。
一句话总结
Goal mode 的价值不是让 Codex 变成无人驾驶,而是让一个已经定义好的任务可以持续推进、持续验证、持续收敛。
人的职责是选择方向、划清边界、做最终验收;Codex 的职责是在这些边界里推进、验证和修正。
