3A 架構

Anthropic 提出的 Harness Engineering 實作架構：將任務分為 Planner（規劃）→ Generator（生成）→ Evaluator（驗證） 三種分工角色，透過「生成與評估分離」確保輸出品質。

三個角色

核心問題：Self-Assessment Bias（自評估偏差）

模型評估自身工作時，傾向於過度自信地稱讚平庸的作品。

工程化一個獨立的外部評估器，比「教 Generator 自我批評」更容易、更有效。
→ 這是 Harness Engineering 的「生成與評估分離」原則的具體落地。

Anthropic 的 Evaluator 使用真實環境互動式驗證：

這區別於傳統「unit test」的靜態驗證——Evaluator 驗的是端到端的用戶體驗。

需求（模糊）
  ↓
Planner：需求拆解 → 具體功能清單
  ↓
Generator：逐項實作（可多輪）
  ↓
Evaluator：真實環境驗收 → 通過/退回
  ↓
通過 → 交付
退回 → 回到 Generator 修正

本 vault 的 wiki-lint（健康檢查）扮演的是 Evaluator 角色——不生成內容、只評估；wiki-ingest + wiki-repair 扮演 Generator 角色。這是 3A 架構在知識庫維護中的對應。