Harness工程化 - 古法信息流

这篇文章围绕 AI Agent 的 Harness Engineering 展开，核心观点是：大模型已经足够强，可以参与研发交付，但如果没有一套足够扎实的 Harness（约束与治理体系），它仍然只是高级玩具；只有把它纳入工程控制面，它才能成为真正参与交付的协作者。

文章先解释了 Harness 到底在管什么。作者把传统软件工程和 Harness Engineering 做了区分：传统软件工程主要处理确定性问题，而 Harness Engineering 处理的是大模型这种非确定性系统。大模型会受上下文、工具调用、幻觉和状态漂移影响，因此不能只靠 Prompt 约束，而要依赖外部的状态、沙盒、验证器、日志和审批节点。

接着文章用两个坐标轴来定义架构边界：一条轴是执行流路由，是静态预设还是动态自主；另一条轴是状态与上下文，是隐式内置还是显式外部。作者把这四种组合分别对应到无状态链、提示词驱动、传统管道和 Harness Engineering，认为真正适合企业环境的，是把模型意图和外部控制面结合起来的那一类。

文章还专门讲了“伪 Harness”和“劣质 Harness”的问题。前者看似在控制模型，实际上只是把大量约束塞进 Prompt 里；后者虽然有控制流，但可能是暴力重试、重型文档流或者机械的流程堆砌。真正有效的 Harness 应该具备前置验证、最小真相源、物理门禁和可回退的反馈闭环。

在企业场景下，文章强调 Harness 比 Prompt 更重要，因为企业工程环境链路更长、边界更严、试错成本更高。Agent 要面对的不是“能不能写出代码”，而是能否调到正确接口、能否读日志定位问题、能否被人类接手恢复。于是程序员的核心价值也在迁移：从亲手写代码，变成定义目标、卡住边界、掌控节奏、验收结果。

文章用 Aegis 项目举了一个真实实践案例，说明一个 AI Agent 是如何被 Harness 出来的：先收敛目标，不急着编码；再通过 Spec 和 Handoff 对抗上下文腐烂；把 Prompt 溶解进能力路由；把测试和回归前置化；通过日志、状态文档和外部验证，让 Agent 在可控轨道上持续交付。文章认为，真正重要的不是某段神奇 Prompt，而是整套工程控制面。

最后，文章给出了一套落地建议：先搭真相源，再约束执行边界；构建最小能力目录；前置验证闭环；完善恢复机制；逐步释放自由度。整体结论是，AI Agent 时代，最强的程序员不是写代码最快的人，而是最能定义目标、约束非确定性、抓住关键结构并把结果交付出来的人。

这篇文章更像是一篇面向工程实践者的架构方法论总结，重点不在某个具体工具，而在如何把“聪明但不稳定”的模型变成可控、可验证、可交接的生产力系统。