Ensemble Team + Pipeline 技能体系完整指南
🚀 AI Agent 协作技能体系
完整的 AI 多代理协作系统 — 从团队组建到自动化构建的全流程指南
🏗️ 技能架构总览
10 个技能协同工作,构建完整的 AI 软件开发流水线
架构层次
🎯 ensemble-team v3.1.0
团队组建与协调入口
⬇️
├── 👤 Supervised Mode (Coordinator 手动管理)
└── 🏭 Factory Mode (Pipeline 自动编排)
⬇️
⚙️ pipeline v4.2.0
8 阶段自动化构建流水线
⬇️
├── 🧪 tdd
├── 🔍 code-review
├── 🧬 mutation-testing
├── 📋 task-management
├── 🚦 ci-integration
├── 🎯 domain-modeling
└── 🐛 debugging-protocol
⬇️
🤝 agent-coordination v2.1.0 — 全局协调协议
📚 技能详解
🎯 ensemble-team v3.1.0
核心职责
- 创建 AI 专家团队结构(
.team/目录) - 生成专家角色 profile(Kent Beck、Sandi Metz 等)
- 建立团队工作约定和架构决策
- 组织 Formation Session 形成会议
- 管理 Driver-Reviewer 轮换机制
产出文件
.team/<name>.md— 团队成员 profileAGENTS.md— 团队约定PROJECT.md— 项目约束docs/ARCHITECTURE.md— 架构决策docs/glossary.md— 领域术语
触发词: 创建团队 mob programming ensemble programming agent profiles
依赖: 无 | 可选: pipeline, agent-coordination
🏭 pipeline v4.2.0
核心职责
- 自动化构建阶段编排(Factory Mode)
- 管理垂直切片队列(walking skeleton 优先)
- 自动调度 TDD 配对(Driver + Reviewer)
- 执行 8 阶段质量门禁
- 维护审计追踪(
.factory/audit-trail/)
8 阶段流水线
- Decompose → 任务分解
- Slice Readiness → 就绪评审
- Implement → TDD 实现
- Code Review → 三轮评审
- Address Feedback → 修复反馈
- Mutation Testing → 变异测试
- Push/CI → 推送 + 等待
- Merge → 合并或标记
触发词: factory mode 自动构建 slice queue quality gates
依赖: 5 个技能 | 独立: 否
🧪 tdd v2.4.0
核心职责
- 执行 RED-DOMAIN-GREEN-DOMAIN-COMMIT 循环
- 编写失败测试 → 实现 → 重构
- 检测 harness 能力(自动/引导模式)
- 生成 TDD 循环证据
- 原子提交 + 推送
五步循环
- RED — 写一个失败测试
- DOMAIN — 审查领域类型
- GREEN — 让测试通过(最简实现)
- DOMAIN — 再次审查领域模型
- COMMIT — 原子提交
触发词: TDD 写测试 test-first red green refactor
依赖: 无 | 独立: 是
🔍 code-review v2.2.0
核心职责
- 三阶段评审(规范→质量→领域)
- PASS/FAIL 裁决 + 严重性评级
- 关键问题阻塞机制
- 生成结构化评审报告
- 写入
.reviews/文件(抗上下文压缩)
评审阶段
- Stage 1: Spec Compliance
- Stage 2: Code Quality
- Stage 3: Domain Integrity
触发词: 评审代码 PR review 代码质量 检查规范
依赖: domain-modeling | 独立: 否
🎯 domain-modeling v1.2.0
核心职责
- 检测原始类型痴迷(Primitive Obsession)
- 设计语义类型和值对象
- 让无效状态不可表示
- 执行"解析而非验证"原则
- 避免布尔参数和可交换参数
核心原则
- ❌
sendEmail(email: string) - ✅
sendEmail(email: EmailAddress) - ❌
transfer(amount: number) - ✅
transfer(amount: Money)
触发词: 领域建模 primitive obsession value object semantic type
依赖: 无 | 独立: 是
🧬 mutation-testing v2.2.1
核心职责
- 运行变异测试(cargo-mutants/Stryker/mutmut)
- 强制 100% 杀死率质量门禁
- 分析存活的变异体
- 生成变异测试结果证据包
- 场景覆盖率检查
变异类型
- Arithmetic(算术运算)
- Comparison(比较运算)
- Boolean(布尔逻辑)
- Return Value(返回值)
- Statement Removal(语句删除)
触发词: 变异测试 mutation score 测试质量 kill rate
依赖: tdd | 独立: 否
📋 task-management v1.3.0
核心职责
- 层次化任务分解(Feature → Story → Task)
- GWT 接受标准(Given-When-Then)
- 显式依赖声明
- Walking Skeleton 优先策略
- 任务生命周期管理
任务生命周期
- Open → 待处理
- Active → 进行中(仅一个)
- Closed → 已完成
触发词: 分解任务 walking skeleton 任务依赖
依赖: 无 | 独立: 是
🚦 ci-integration v1.2.1
核心职责
- CI 推送和等待纪律(一次一个 pending)
- 五类失败分类和修复策略
- 自愈能力(lint/format/infra 失败)
- 检测 flaky test
- 生成 CI 结果证据包
失败分类
- Test Failure → 修复测试或代码
- Lint Failure → 自动修复
- Build Failure → 修复构建
- Flaky Test → 检测并标记
- Infra Failure → 重试或修复
触发词: CI 失败 推送等待 build broke flaky test
依赖: debugging-protocol | 独立: 否
🐛 debugging-protocol v1.2.0
核心职责
- 四阶段调试流程
- 三击规则(3 次失败后升级)
- 铁律(无调查不修复)
- 假设驱动调试
- 系统性错误调查
四阶段流程
- Understand — 读取完整错误,复现
- Compare — 查找工作示例对比
- Hypothesize — 一次测试一个假设
- Fix & Verify — 修复根因并验证
触发词: 调试 为什么失败 bug investigate
依赖: 无 | 独立: 是
🤝 agent-coordination v2.1.0
核心职责
- 一消息一等待协议(One-Message-Then-Wait)
- 空闲通知即心跳(不主动打扰)
- 禁止轮询循环
- 正确的代理生命周期管理
- 不伪造其他 agent 响应
核心规则
- 📬 发送一条完整消息 → 等待回复
- 💓 Idle 通知 = 心跳(默认不处理)
- 🚫 不写 while 轮询循环
- 🛑 不提前关闭 agent
触发词: 协调 agent 多 agent agent handoff spawn agents
依赖: 无 | 独立: 是
🔄 Supervised Mode 工作流程
Coordinator 手动管理的完整开发流程:
🎯 用户请求
⬇️
👥 ensemble-team (创建团队 profile + Formation Session)
⬇️
📋 task-management (分解第一个垂直切片)
⬇️
🧪 tdd (RED-DOMAIN-GREEN) (Driver 执行 TDD 循环)
⬇️
🔍 code-review + domain-modeling (Reviewers 评审代码)
⬇️
🐛 debugging-protocol (修复反馈,如需要)
⬇️
🧬 mutation-testing (验证测试质量)
⬇️
🚦 ci-integration (推送 + 等待 CI 结果)
⬇️
✅ 合并 + 回顾会议 (记录经验教训)
🏭 Factory Mode 工作流程
Pipeline 自动编排的构建流程:
🎯 Phase 1: 规划 (coordinator 管理)
⬇️
⚙️ Phase 1.5: 工厂配置 (配置 autonomy level)
⬇️
🤖 Phase 2: 构建 (pipeline 接管,coordinator 休眠)
⬇️
1. Decompose → 2. Readiness → 3. TDD → 4. Review →
5. Fix → 6. Mutation → 7. CI → 8. Merge
⬇️
👤 Phase 3: 评审 (coordinator 恢复 + 人类审查)
⬇️
✅ 回顾会议 + 下一切片 (持续交付)
📦 数据流与文件产出
📁 .team/ 目录
<name>.md— 团队成员 profilecoordinator-instructions.md— 协调员指令pairing-history.json— 配对历史eval-results.md— 评估结果decision-log.json— 决策日志
📁 .reviews/ 目录
<reviewer>-<task>.md— 评审文件retro/<member>-<date>.md— 回顾观察ready-for-rereview-*.md— 重审信号archive/— 历史归档
📁 .factory/ 目录 (Factory Mode)
config.yaml— 工厂配置slice-queue.json— 切片队列audit-trail/— 审计追踪worktrees/— 并行工作树
📁 docs/ 目录
ARCHITECTURE.md— 架构决策glossary.md— 领域术语deferred-items.md— 延期事项future-ideas.md— 未来想法
📄 根目录文件
AGENTS.md— 团队约定PROJECT.md— 项目约束CLAUDE.md/.cursorrules— harness 配置.gitignore— 排除临时文件
📊 证据包格式
TDD_CYCLE_RESULT— TDD 循环证据REVIEW_RESULT— 评审结果MUTATION_RESULT— 变异测试CI_RESULT— CI 运行结果
⚖️ 模式对比
| 特性 | Supervised Mode | Factory Mode |
|---|---|---|
| 构建编排 | Coordinator 手动管理每个交接 | Pipeline 控制器自动管理 |
| 决策协议 | 所有决策使用 Robert's Rules | 仅规划阶段使用共识协议 |
| 合并审批 | 人类审批每次合并 | 质量门禁替代人类审批 |
| 配对管理 | Coordinator 选择和监控 | Pipeline 自动调度 TDD 配对 |
| 评审流程 | 每个 PR 协调 mob 评审 | 推送前拉取完整团队评审 |
| 错误处理 | Coordinator 路由所有失败 | Pipeline 处理机械性失败 |
| 适用场景 | ✓ 学习阶段 ✓ 透明度高 ✓ 大多数项目 |
✓ 大型项目 ✓ 高频提交 ✓ 自动化需求高 |
⚡ 快速参考
| 场景 | 命令示例 |
|---|---|
| 🚀 启动项目 | "帮我创建一个 AI 团队来开发 [项目描述]" |
| 👥 选择规模 | "用 Solo-plus/Lean/Full 团队规模" |
| 🏭 Factory Mode | "用 Factory Mode 运行,启用 pipeline" |
| 🧪 单独 TDD | "用 TDD 实现用户登录功能" |
| 🔍 代码评审 | "评审这个 PR 的领域建模" |
| 📋 任务分解 | "把这个功能分解成可执行任务" |
📚 Ensemble Team + Pipeline 技能体系指南
基于 jwilger/agent-skills 套件整理
文档生成时间:2026-03-23