Skip to content

Harness Engineering

驾驭工程

OpenAI: Harness engineering: leveraging Codex in an agent-first worldOpenAI: Unlocking the Codex harness: how we built the App Server

不是只调模型、写 prompt,而是工程化地搭建一整套“让 agent 稳定完成任务”的运行系统。

OpenAI 在 2026 年 2 月 11 日 的文章里,把工程师的新角色描述成:不再主要是手写代码,而是“设计环境、明确意图、构建反馈回路,让 Codex agent 能可靠工作”。 另一篇 2026 年 2 月 4 日 的文章则把 harness 具体写成:agent loop、线程/状态持久化、配置与鉴权、工具执行与扩展这些底层运行机制。

更直白一点:

Prompt Engineering:怎么问模型 Context Engineering:怎么给模型喂对上下文 Harness Engineering:怎么把上下文、工具、工作流、约束、测试、评审、观测、恢复机制全都串起来,让 agent 真能在生产里稳定交付 它通常包括这些东西:

任务拆解和执行流程 repo 内可检索的文档、规范、AGENTS.md 工具接入,比如 shell、浏览器、MCP、CI 自动验证:tests、linters、evals、review loops 可观测性:日志、指标、trace、截图、DOM 快照 护栏和约束:权限、审批、架构规则、风格规则 失败后的重试、回滚、升级给人类