返回博客
AI / 系统设计
阅读时长 13 min read

自进化 Multi-Agent AI-OS 架构:从 12-Agent 蓝图到可稳定进化的工程实现

summary: "从 12-Agent 蓝图出发,讨论多 Agent 系统如何通过控制层拆分、前移质量门、量化进化与分层记忆,演化成可验证、可回退、可长期维护的 AI-OS。"

自进化 Multi-Agent AI-OS 架构:从 12-Agent 蓝图到可稳定进化的工程实现

这篇文章讨论的不是“再多加几个 Agent”,而是:怎样把一个能工作的多 Agent 系统,改造成一个能持续进化、可验证、可回退、可长期维护的工程系统。

核心问题并不在 Agent 数量,而在于四件事:

  • 控制是否单点集中
  • 质量检查是否太晚
  • 优化是否有量化依据
  • 记忆是否会无限膨胀

如果这些问题不解决,Agent 越多,系统越容易变成一个复杂但脆弱的黑箱。


原始架构的六个结构性隐患

原始 12-Agent 方案方向没错,但落地时有几个非常典型的工程问题:

  1. Orchestrator 单点故障

    • 同时负责目标理解、任务拆解、调度、结果整合、状态维护
    • 一旦上下文爆炸或逻辑跑偏,整个系统一起偏
  2. 进化循环没有量化标准

    • Learning Agent 只能“凭感觉总结经验”
    • 优化方向不可验证,容易陷入随机漂移
  3. 质量控制纯后验

    • 任务全做完才检查
    • 如果方向错了,前面的成本全部白费
  4. 记忆无限膨胀

    • 所有经验都堆进一个长期记忆池
    • 上下文窗口迟早失控
  5. 同层 Agent 不能直接协作

    • 一切都要经由 Orchestrator 中转
    • 简单协作也变成重调度
  6. 零容错

    • 某个 Agent 一旦超时、答非所问、拒答,流程就断

一句话总结:

原始架构更像“演示级 Agent 编排”,不是“生产级 AI 操作系统”。


优化后的总体方向

优化目标不是单纯“多加两个 Agent”,而是把系统重构成四层:

  1. 控制层:把规划和调度分开
  2. 核心工作层:让专业 Agent 并行协作
  3. 质量门:让检查前移,而不是事后验尸
  4. 进化引擎:用量化评估驱动优化,并通过 Staging 验证后再生效

这个改法把原系统从“任务执行器”,提升成“能学习、能纠错、能稳定迭代的 AI-OS”。


第一层:控制层双核分离

原来的 Orchestrator 被拆成两个角色:

1)Planner

负责:

  • 理解用户目标
  • 拆任务
  • 建依赖图
  • 设置中间检查点

它的工作不是执行,而是生成结构化计划

2)Coordinator

负责:

  • 调度各 Agent
  • 收集中间结果
  • 处理失败、重试、降级
  • 输出最终整合结果

它的工作不是理解目标,而是执行和收口

为什么这很重要?

因为“理解目标”和“调度执行”是两种完全不同的负担。 把它们塞进一个单点角色里,迟早失稳。

拆开以后:

  • Planner 出问题,不会直接污染调度流
  • Coordinator 出问题,不会直接污染目标建模
  • 两者还能互相校验

控制分离,是让多 Agent 系统从单脑过载走向结构化协作的第一步。


第二层:核心工作层从“孤岛”变成“协作层”

核心工作层保留六类专业角色:

  • Researcher:资料搜集、技术背景、事实收集
  • Analyst:数据分析、推理、方案比较
  • Programmer:代码实现、脚本、调试
  • Architect:系统设计、边界划分、技术选型
  • Editor:文案结构、表达、报告整理
  • Designer:视觉、图示、界面概念

改进不在于角色名单,而在于协作方式:

原先的方式是:

  • 每个人都只和 Orchestrator 讲话

优化后:

  • 同层 Agent 允许直接通信
  • 但所有协作结果必须同步到统一记忆系统

这样一来:

  • Researcher 和 Analyst 可以直接对齐证据和推理
  • Architect 和 Programmer 可以快速协作
  • Editor 和 Designer 可以直接统一内容与视觉

不需要所有信息都回主协调一遍再转发。

同层直连让系统从“排队办事”升级成“真正并行工作”。


第三层:质量门必须前移(Shift-Left)

这是整套架构里我最认同的一刀。

传统多 Agent 系统的常见做法是:

  • 全部做完
  • 最后让 Critic/Verifier 看一眼

这个做法的问题是:

  • 错误发现太晚
  • 大任务返工成本巨大
  • 中间路径错误时根本没有刹车

优化后,质量检查变成三段:

1)计划审查

Planner 输出计划后,Critic 先检查:

  • 逻辑是否通
  • 是否漏关键步骤
  • 是否存在明显风险

2)中间验证

关键中间产物出来时,Verifier 就要介入:

  • 架构设计是否自洽
  • 代码初版是否能跑
  • 草稿引用是否准确

3)终态检查

最后才是完整交付前的收口验证。

这等于把“质量控制”从终点后置,变成过程内嵌。

真正成熟的系统,不是最后检查得多严格,而是中途就不让错误滚雪球。


第四层:进化引擎必须量化,不然就是玄学

原始设计里有:

  • Learning Agent
  • Optimizer

听起来很先进,但如果没有量化评估,这种“学习”和“优化”很容易退化成:

  • 总结一些模糊经验
  • 然后盲目调 prompt
  • 再用感觉判断是不是更好了

这不叫进化,这叫调参碰运气。

所以必须新增一个角色:Evaluator

Evaluator 的作用是:

  • 把每次任务表现量化
  • 输出标准化评分
  • 提供优化依据

可量化的指标包括:

  • 正确性:有没有通过 Critic / Verifier
  • 效率:步骤数、耗时、token 消耗
  • 稳定性:重试次数、降级次数、熔断次数
  • 质量:输出质量评分或用户反馈

有了 Evaluator,Learning Agent 才能真正回答:

  • 哪种 Agent 组合更稳
  • 哪套提示词更可靠
  • 哪种调度方式更省资源

更关键的是:优化不能直接生效

Optimizer 给出的方案,必须先进入 Staging

  • 先在低风险任务试跑
  • 对比旧策略与新策略
  • 用 Evaluator 量化结果
  • 通过后再正式合并

这一步特别重要。

没有 Staging 的自进化系统,本质上是在拿线上系统做随机实验。


记忆系统必须分层,不然最后一定爆

很多 Agent 系统都会掉进一个坑:

“把所有有用的信息都存起来。”

看起来聪明,实际上非常危险。

正确方式应该是三层:

1)Working Memory

  • 当前任务上下文
  • 任务结束就清理
  • 保持轻量

2)Project Memory

  • 项目级长期状态
  • 保留跨任务有用的信息
  • 项目结束后归档或清理

3)Knowledge Base

  • 从多个项目中提炼出的通用策略
  • 只收高置信度经验
  • 定期做去重和衰减

记忆流动规则应该是:

  • 当前任务里反复复用的东西 → 提升到 Project Memory
  • 多项目反复成立的规律 → 提升到 Knowledge Base
  • 长期不用的内容 → 降权或归档

记忆不是越多越强,关键在于分层、筛选和淘汰。


容错、降级、熔断:必须是内建机制

LLM 系统不稳定是常态,不是例外。

所以一个能上线的多 Agent 架构,至少要内建三种机制:

1)重试

第一次失败后自动重试,但不能原样重试,应该:

  • 简化 prompt
  • 增加约束
  • 缩小任务范围

2)降级

如果某 Agent 持续失败,要允许降级:

  • Analyst 不可用时,Researcher 先做粗分析
  • Designer 不可用时,Editor 给出结构替代方案

3)熔断

如果某 Agent 连续失败:

  • 暂时移出可用池
  • 进入冷却期
  • 避免系统反复把任务扔给一个坏掉的角色

容错不是锦上添花,而是让多 Agent 系统能长期运行的底盘。


原始架构 vs 优化架构

可以概括成下面这几组差异:

| 维度 | 原始架构 | 优化架构 | |---|---|---| | 控制中心 | 单点 Orchestrator | Planner + Coordinator 双核 | | 质量检查 | 纯后验 | 阶段性前移 | | 进化依据 | 模糊经验 | Evaluator 量化评分 | | 优化上线 | 直接覆盖 | Staging → 验证 → 合并 | | 记忆 | 单层 MEMORY.md | 三层分级记忆 | | 协作方式 | 全部经中转 | 同层直连 + 记录同步 | | 容错 | 几乎没有 | 重试 / 降级 / 熔断 |

一句话:

原始版是“能工作”,优化版是“能长期工作”。


推荐部署路线:别一步到位

如果真要把这套系统落地,我不建议一上来就 14 Agent 全开。

Phase 1:最小可用系统(7 Agents)

优先保留:

  • Planner
  • Coordinator
  • Researcher
  • Programmer
  • Editor
  • Critic
  • Evaluator

目的:

  • 先把控制分离、阶段检查、量化评估跑起来

Phase 2:完整工作系统(11 Agents)

再补:

  • Analyst
  • Architect
  • Designer
  • Verifier

目的:

  • 把执行层和质量门补完整

Phase 3:自进化完整体(14 Agents)

最后再补:

  • Memory Manager
  • Learning Agent
  • Optimizer

目的:

  • 让系统真正具备自我改进能力

这套顺序的好处是:

  • 每一阶段都能独立产生价值
  • 风险可控
  • 出问题时容易定位

复杂系统最怕一次性上满配置。渐进部署,才是工程理性。


最后总结:这套架构真正解决了什么?

它不是简单“让 Agent 更多”,而是把多 Agent 系统从以下状态:

  • 单点集中
  • 后验检查
  • 模糊进化
  • 记忆堆积
  • 零容错

升级成:

  • 控制分离
  • 过程质检
  • 量化驱动
  • 分层记忆
  • 可回退进化
  • 容错降级

如果要给这套架构一个核心原则,我会总结成五句:

  1. 控制分离优于单点集中
  2. 量化评估优于模糊直觉
  3. 阶段检查优于终态审查
  4. Staging 验证优于直接覆盖
  5. 渐进部署优于一步到位

这不是“理论上更优雅”的改造,而是让多 Agent 从 Demo 走向生产可用的关键步骤。

如果你真的想做一个能长期演化的 AI-OS,这些机制不是加分项,是地基。

分享这篇文章