知识库建设 Skill 测试用例

> 版本：v1.0 | 创建日期：2026-04-09 | 维护者：龙龟神将

---

测试用例总览

| 用例ID | 场景类型 | 测试目标 | 优先级 | |--------|---------|---------|--------| | TC-001 | 触发测试 | P0关键词触发 | P0 | | TC-002 | 触发测试 | P1场景触发 | P0 | | TC-003 | 触发测试 | P2信号触发 | P1 | | TC-004 | 功能测试 | 完整7步流程 | P0 | | TC-005 | 功能测试 | 现状诊断 | P0 | | TC-006 | 功能测试 | 分层定位 | P1 | | TC-007 | 边界测试 | 不触发场景 | P1 | | TC-008 | 集成测试 | 与LLM-Wiki协同 | P1 | | TC-009 | 性能测试 | 响应时间 | P2 | | TC-010 | 验收测试 | 端到端流程 | P0 |

---

触发测试用例

TC-001: P0关键词触发测试

测试目标：验证P0关键词能正确触发Skill 测试数据： | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "知识库建设" | 触发 | - | 待测试 | | "构建知识库" | 触发 | - | 待测试 | | "三库配合" | 触发 | - | 待测试 | | "Obsidian WorkBuddy IMA" | 触发 | - | 待测试 | | "LLM Wiki" | 触发 | - | 待测试 | | "知识库专业化" | 触发 | - | 待测试 | 通过标准：所有P0关键词都能触发Skill

---

TC-002: P1场景触发测试

测试目标：验证P1场景能正确触发Skill 测试数据： | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "如何整合多个知识库" | 触发 | - | 待测试 | | "知识库分散问题" | 触发 | - | 待测试 | | "AI系统专业化" | 触发 | - | 待测试 | | "知识管理优化" | 触发 | - | 待测试 | 通过标准：所有P1场景都能触发Skill

---

TC-003: P2信号触发测试

测试目标：验证P2信号组合能正确触发Skill 测试数据： | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "Obsidian、WorkBuddy和IMA怎么用" | 触发（提到三库） | - | 待测试 | | "Karpathy的知识库方法" | 触发（提到Karpathy） | - | 待测试 | | "知识库配合问题" | 触发（提到配合） | - | 待测试 | 通过标准：P2信号累积达到阈值时触发Skill

---

功能测试用例

TC-004: 完整7步流程测试

测试目标：验证7步流程能完整执行 测试步骤： 1. 输入："我要从零开始建设三库协同的知识库" 2. 期望执行： - Step 1: 现状诊断（10分钟） - Step 2: 分层定位（15分钟） - Step 3: 架构设计（20分钟） - Step 4: 流动管道设计（20分钟） - Step 5: 工具配置（15分钟） - Step 6: 自动化脚本（20分钟） - Step 7: 持续进化（持续） 期望输出：

完整架构方案

实施路线图

工具配置清单

自动化脚本模板

通过标准：7步流程完整执行，输出物齐全

---

TC-005: 现状诊断测试

测试目标：验证现状诊断功能 测试输入： ``` "我有Obsidian、WorkBuddy、IMA三个知识库， Obsidian里有L7理论基石和五行人格理论， WorkBuddy里有Skills包， IMA里有一些临时笔记。但是感觉知识很分散，不知道怎么配合。" ``` 期望输出：

Obsidian诊断：目录结构清晰，内容完整

WorkBuddy诊断：Skills包完整，触发规则待优化

IMA诊断：有临时笔记，缺乏定期整理机制

问题清单：

1. 三库之间缺乏同步机制 2. IMA内容未定期整理到Obsidian 3. WorkBuddy与Obsidian同步不够自动化 通过标准：诊断报告准确反映现状

---

TC-006: 分层定位测试

测试目标：验证三库分层定位准确 测试输入： ``` "我有理论文档、Skills配置、临时灵感三种类型的内容，应该分别放在哪个知识库？" ``` 期望输出：

理论文档 → Obsidian（知识资产层）

Skills配置 → WorkBuddy（工作记忆层）

临时灵感 → IMA（快速捕获层）

通过标准：分层定位符合设计原则

---

边界测试用例

TC-007: 不触发场景测试

测试目标：验证不相关输入不会误触发 测试数据： | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "今天天气怎么样？" | 不触发 | - | 待测试 | | "帮我写一段代码" | 不触发 | - | 待测试 | | "什么是机器学习？" | 不触发 | - | 待测试 | | "Obsidian怎么用？" | 不触发（单独提Obsidian） | - | 待测试 | 通过标准：不相关输入不触发Skill

---

集成测试用例

TC-008: 与LLM-Wiki协同测试

测试目标：验证与LLM-Wiki Skill的协同关系 测试场景1：

输入："如何具体执行知识编译？"

期望：触发LLM-Wiki（执行工具）

不触发：知识库建设（架构设计）

测试场景2：

输入："如何设计知识库架构？"

期望：触发知识库建设

可能协同：LLM-Wiki（执行细节）

通过标准：两个Skill能正确分工，避免冲突

---

性能测试用例

TC-009: 响应时间测试

测试目标：验证Skill响应时间在可接受范围内 测试数据： | 操作 | 期望时间 | 实际时间 | 状态 | |------|---------|---------|------| | 触发识别 | <1秒 | - | 待测试 | | 现状诊断 | <10秒 | - | 待测试 | | 完整7步流程 | <5分钟 | - | 待测试 | 通过标准：响应时间符合期望

---

验收测试用例

TC-010: 端到端流程测试

测试目标：验证完整端到端流程 测试场景： ``` 用户："我有Obsidian、WorkBuddy、IMA三个知识库，想支撑AI OS和五行人格OS的专业化，应该如何配合？" ``` 期望流程： 1. 自动触发知识库建设Skill 2. 执行现状诊断 3. 输出三库分层定位方案 4. 设计LLM Wiki三层架构 5. 提供知识流动管道设计 6. 给出工具配置清单 7. 提供自动化脚本模板 8. 建立持续进化机制 期望输出物：

✅ 现状诊断报告

✅ 三库分工定义

✅ LLM Wiki架构设计

✅ 知识流动管道图

✅ 工具配置指南

✅ 自动化脚本

✅ 持续进化方案

通过标准：用户能根据输出物实施知识库建设

---

测试执行记录

第一轮测试（2026-04-09）

| 用例ID | 执行人 | 执行时间 | 结果 | 备注 | |--------|--------|---------|------|------| | TC-001 | - | - | 待执行 | - | | TC-002 | - | - | 待执行 | - | | TC-003 | - | - | 待执行 | - | | TC-004 | - | - | 待执行 | - | | TC-005 | - | - | 待执行 | - | | TC-006 | - | - | 待执行 | - | | TC-007 | - | - | 待执行 | - | | TC-008 | - | - | 待执行 | - | | TC-009 | - | - | 待执行 | - | | TC-010 | - | - | 待执行 | - |

---

质量评估

六大及格标准检查

| 标准 | 检查项 | 状态 | 备注 | |------|--------|------|------| | ① 核心定义清晰 | What/Why/How一句话可说清 | ✅ | "基于LLM Wiki的三层知识库架构设计" | | ② 操作流程完整 | 7步详细SOP + 案例 | ✅ | 完整7步流程 | | ③ 触发机制准确 | P0/P1/P2触发词命中率≥85% | ⏳ | 待测试验证 | | ④ 文件结构规范 | 符合标准目录结构 | ✅ | 标准Skill结构 | | ⑤ 测试用例完整 | 至少3个真实场景 | ✅ | 10个测试用例 | | ⑥ 与其他Skills无冲突 | 与LLM-Wiki协同关系明确 | ✅ | 互补关系 |

质量评分：待测试完成后评估

---

测试完成标准：

✅ 所有P0测试用例通过

✅ 核心功能测试通过

✅ 无重大缺陷

✅ 质量评分≥8/10