多模型分層調度架構 — 誰規劃、誰執行、誰驗收

2026-04-13

13 提出的架構:Opus 做任務檢驗/退件、Sonnet 管理任務、Gemini Flash 執行、MiniMax 做雜事。

Hevin 分享實際做法:讓下層 agent 先用 rules 做 harness,再用 handover.md 交付給 Opus 驗收。Bertram 補充:越聰明的模型自主性越高會多出提議,簡單明確任務用 Opus 反而浪費。

先 plan 好再分 subagent 執行,加上審核/測試/退件閉環,是目前多模型協作的最佳實踐。