知识库建设 Skill 测试用例
> 版本:v1.0 | 创建日期:2026-04-09 | 维护者:龙龟神将
---
测试用例总览
| 用例ID | 场景类型 | 测试目标 | 优先级 | |--------|---------|---------|--------| | TC-001 | 触发测试 | P0关键词触发 | P0 | | TC-002 | 触发测试 | P1场景触发 | P0 | | TC-003 | 触发测试 | P2信号触发 | P1 | | TC-004 | 功能测试 | 完整7步流程 | P0 | | TC-005 | 功能测试 | 现状诊断 | P0 | | TC-006 | 功能测试 | 分层定位 | P1 | | TC-007 | 边界测试 | 不触发场景 | P1 | | TC-008 | 集成测试 | 与LLM-Wiki协同 | P1 | | TC-009 | 性能测试 | 响应时间 | P2 | | TC-010 | 验收测试 | 端到端流程 | P0 |
---
触发测试用例
TC-001: P0关键词触发测试
测试目标:验证P0关键词能正确触发Skill 测试数据: | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "知识库建设" | 触发 | - | 待测试 | | "构建知识库" | 触发 | - | 待测试 | | "三库配合" | 触发 | - | 待测试 | | "Obsidian WorkBuddy IMA" | 触发 | - | 待测试 | | "LLM Wiki" | 触发 | - | 待测试 | | "知识库专业化" | 触发 | - | 待测试 | 通过标准:所有P0关键词都能触发Skill---
TC-002: P1场景触发测试
测试目标:验证P1场景能正确触发Skill 测试数据: | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "如何整合多个知识库" | 触发 | - | 待测试 | | "知识库分散问题" | 触发 | - | 待测试 | | "AI系统专业化" | 触发 | - | 待测试 | | "知识管理优化" | 触发 | - | 待测试 | 通过标准:所有P1场景都能触发Skill---
TC-003: P2信号触发测试
测试目标:验证P2信号组合能正确触发Skill 测试数据: | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "Obsidian、WorkBuddy和IMA怎么用" | 触发(提到三库) | - | 待测试 | | "Karpathy的知识库方法" | 触发(提到Karpathy) | - | 待测试 | | "知识库配合问题" | 触发(提到配合) | - | 待测试 | 通过标准:P2信号累积达到阈值时触发Skill---
功能测试用例
TC-004: 完整7步流程测试
测试目标:验证7步流程能完整执行 测试步骤: 1. 输入:"我要从零开始建设三库协同的知识库" 2. 期望执行: - Step 1: 现状诊断(10分钟) - Step 2: 分层定位(15分钟) - Step 3: 架构设计(20分钟) - Step 4: 流动管道设计(20分钟) - Step 5: 工具配置(15分钟) - Step 6: 自动化脚本(20分钟) - Step 7: 持续进化(持续) 期望输出:---
TC-005: 现状诊断测试
测试目标:验证现状诊断功能 测试输入: ``` "我有Obsidian、WorkBuddy、IMA三个知识库, Obsidian里有L7理论基石和五行人格理论, WorkBuddy里有Skills包, IMA里有一些临时笔记。 但是感觉知识很分散,不知道怎么配合。" ``` 期望输出:---
TC-006: 分层定位测试
测试目标:验证三库分层定位准确 测试输入: ``` "我有理论文档、Skills配置、临时灵感三种类型的内容, 应该分别放在哪个知识库?" ``` 期望输出:---
边界测试用例
TC-007: 不触发场景测试
测试目标:验证不相关输入不会误触发 测试数据: | 输入 | 期望结果 | 实际结果 | 状态 | |------|---------|---------|------| | "今天天气怎么样?" | 不触发 | - | 待测试 | | "帮我写一段代码" | 不触发 | - | 待测试 | | "什么是机器学习?" | 不触发 | - | 待测试 | | "Obsidian怎么用?" | 不触发(单独提Obsidian) | - | 待测试 | 通过标准:不相关输入不触发Skill---
集成测试用例
TC-008: 与LLM-Wiki协同测试
测试目标:验证与LLM-Wiki Skill的协同关系 测试场景1:---
性能测试用例
TC-009: 响应时间测试
测试目标:验证Skill响应时间在可接受范围内 测试数据: | 操作 | 期望时间 | 实际时间 | 状态 | |------|---------|---------|------| | 触发识别 | <1秒 | - | 待测试 | | 现状诊断 | <10秒 | - | 待测试 | | 完整7步流程 | <5分钟 | - | 待测试 | 通过标准:响应时间符合期望---
验收测试用例
TC-010: 端到端流程测试
测试目标:验证完整端到端流程 测试场景: ``` 用户:"我有Obsidian、WorkBuddy、IMA三个知识库, 想支撑AI OS和五行人格OS的专业化, 应该如何配合?" ``` 期望流程: 1. 自动触发知识库建设Skill 2. 执行现状诊断 3. 输出三库分层定位方案 4. 设计LLM Wiki三层架构 5. 提供知识流动管道设计 6. 给出工具配置清单 7. 提供自动化脚本模板 8. 建立持续进化机制 期望输出物:---
测试执行记录
第一轮测试(2026-04-09)
| 用例ID | 执行人 | 执行时间 | 结果 | 备注 | |--------|--------|---------|------|------| | TC-001 | - | - | 待执行 | - | | TC-002 | - | - | 待执行 | - | | TC-003 | - | - | 待执行 | - | | TC-004 | - | - | 待执行 | - | | TC-005 | - | - | 待执行 | - | | TC-006 | - | - | 待执行 | - | | TC-007 | - | - | 待执行 | - | | TC-008 | - | - | 待执行 | - | | TC-009 | - | - | 待执行 | - | | TC-010 | - | - | 待执行 | - |
---
质量评估
六大及格标准检查
| 标准 | 检查项 | 状态 | 备注 | |------|--------|------|------| | ① 核心定义清晰 | What/Why/How一句话可说清 | ✅ | "基于LLM Wiki的三层知识库架构设计" | | ② 操作流程完整 | 7步详细SOP + 案例 | ✅ | 完整7步流程 | | ③ 触发机制准确 | P0/P1/P2触发词命中率≥85% | ⏳ | 待测试验证 | | ④ 文件结构规范 | 符合标准目录结构 | ✅ | 标准Skill结构 | | ⑤ 测试用例完整 | 至少3个真实场景 | ✅ | 10个测试用例 | | ⑥ 与其他Skills无冲突 | 与LLM-Wiki协同关系明确 | ✅ | 互补关系 |
质量评分:待测试完成后评估---
测试完成标准: