上下文工程 · 测试用例

> 文档定位:上下文工程Skill的功能测试与验证用例 > 版本:v1.0 | 创建日期:2026-04-14

---

测试概述

测试目标

验证上下文工程Skill的核心功能:触发检测、快照生成、状态恢复、协同工作。

测试范围

  • P0/P1/P2/P3触发机制
  • 快照生成与存储
  • 状态恢复与加载
  • 与其他Skills的协同
  • 异常处理
  • 测试环境

  • WorkBuddy最新版本
  • IMA笔记系统可用
  • Obsidian知识库已配置
  • ---

    测试用例 1:P0直接触发词

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-001 | | 用例名称 | P0直接触发词验证 | | 优先级 | P0 | | 测试类型 | 功能测试 |

    前置条件

  • 上下文工程Skill已部署
  • 用户处于任意对话场景
  • 测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 用户说"保存上下文" | 系统立即响应,开始生成快照 | | 2 | 用户说"生成快照" | 系统立即响应,开始生成快照 | | 3 | 用户说"任务中断" | 系统立即响应,开始生成快照 | | 4 | 用户说"恢复任务" | 系统检测历史快照并列出 | | 5 | 用户说"上下文工程" | 系统立即响应,开始生成快照 |

    通过标准

  • 所有P0关键词触发成功率≥95%
  • 响应时间<3秒
  • ---

    测试用例 2:P1场景触发

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-002 | | 用例名称 | P1场景触发验证 | | 优先级 | P1 | | 测试类型 | 功能测试 |

    前置条件

  • 对话持续>30分钟
  • 或涉及多文件操作
  • 测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 对话持续35分钟后 | 系统提示"检测到长周期项目,是否生成上下文快照?" | | 2 | 用户说"下次继续做这个" | 系统提示是否保存当前进度 | | 3 | 系统提示"会话将在5分钟后过期" | 系统自动询问"是否保存当前进度?" | | 4 | 完成一个重要阶段后 | 系统自动生成快照并提示 |

    通过标准

  • 场景识别准确率≥80%
  • 提示时机恰当(不过早/过晚)
  • ---

    测试用例 3:快照生成与存储

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-003 | | 用例名称 | 快照生成与存储验证 | | 优先级 | P0 | | 测试类型 | 功能测试 |

    前置条件

  • 正在进行一个复杂任务
  • 有可记录的进度和待办事项
  • 测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 触发快照生成 | 系统收集当前状态信息 | | 2 | 填写项目信息 | 名称、类型、优先级等字段可正常输入 | | 3 | 确认生成 | 生成markdown格式的快照文件 | | 4 | 检查存储 | 文件同时存储到IMA笔记和Obsidian | | 5 | 验证文件内容 | 包含所有必需字段,格式正确 |

    预期输出示例

    ```markdown

    上下文快照 · 企业文化OS构建

    项目/任务信息

  • 名称: 企业文化OS构建
  • 类型: 系统规划
  • 领域: 企业文化
  • 优先级: P1
  • 生成时间: 2026-04-14 19:30
  • 已完成事项

  • [x] 框架设计 (2026-04-14)
  • [x] 模块划分 (2026-04-14)
  • 累计进度: 65%

    待办事项

    高优先级

  • [ ] 完成凤心OS模块
  • [ ] 编写测试用例
  • ```

    通过标准

  • 快照文件生成成功
  • 存储到至少2个位置(IMA+Obsidian)
  • 文件格式符合模板规范
  • 所有必需字段完整
  • ---

    测试用例 4:状态恢复

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-004 | | 用例名称 | 状态恢复验证 | | 优先级 | P0 | | 测试类型 | 功能测试 |

    前置条件

  • 已有生成的历史快照
  • 新会话启动
  • 测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 新会话启动 | 系统检测历史快照 | | 2 | 用户说"恢复任务" | 系统列出可用快照 | | 3 | 选择快照 | 系统加载快照内容 | | 4 | 验证恢复状态 | 显示项目概览、进度、待办事项 | | 5 | 确认继续 | AI已"回忆"起任务背景 |

    预期输出示例

    ``` 🔍 找到 1 个相关快照

    📄 context-企业文化OS-20260414-193000.md 项目: 企业文化OS构建 进度: 65%(已完成框架设计、模块划分) 待办: 3项高优先级任务

    是否恢复此快照? (是/查看详情/取消)

    ---

    ✅ 上下文已恢复

    📊 当前状态:

  • 已完成: 框架设计、模块划分、接口定义
  • 进行中: 核心模块开发(35%)
  • 待办:
  • [高] 完成凤心OS模块 [高] 编写测试用例 [中] 更新文档

    💡 建议下一步: 继续凤心OS模块开发 ```

    通过标准

  • 历史快照检测成功
  • 恢复后信息完整准确
  • AI能理解任务背景
  • 可以继续执行
  • ---

    测试用例 5:多快照管理

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-005 | | 用例名称 | 多快照管理验证 | | 优先级 | P1 | | 测试类型 | 功能测试 |

    前置条件

  • 同一项目有多个历史快照(≥3个)
  • 测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 用户说"查看所有快照" | 系统列出所有相关快照 | | 2 | 查看快照列表 | 显示时间、进度、状态摘要 | | 3 | 选择特定快照 | 可查看快照详情 | | 4 | 选择恢复点 | 系统加载选中的快照 | | 5 | 对比两个快照 | 显示进度变化和差异 |

    通过标准

  • 多快照列表显示正确
  • 可按时间/进度排序
  • 快照详情可查看
  • 可选择性恢复
  • ---

    测试用例 6:与其他Skills协同

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-006 | | 用例名称 | Skills协同验证 | | 优先级 | P1 | | 测试类型 | 集成测试 |

    前置条件

  • 任务看板Skill可用
  • 心跳巡检档案Skill可用
  • 长期记忆档案Skill可用
  • 测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 生成快照时 | 自动调用任务看板获取状态 | | 2 | 监控任务时 | 心跳巡检检测进度变化 | | 3 | 快照生成后 | 长期记忆档案沉淀关键信息 | | 4 | 恢复状态时 | 相关Skills状态同步恢复 |

    通过标准

  • 前置Skills调用成功
  • 后置Skills执行成功
  • 信息传递准确
  • 无冲突或重复
  • ---

    测试用例 7:异常处理

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-007 | | 用例名称 | 异常处理验证 | | 优先级 | P1 | | 测试类型 | 异常测试 |

    测试场景

    #### 场景1:存储失败 | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 模拟存储路径不可用 | 系统提示存储失败 | | 2 | 检查响应 | 提示用户并尝试备用路径 | | 3 | 验证备用路径 | 成功存储到备用位置 |

    #### 场景2:信息不完整 | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 触发快照时缺少关键信息 | 系统提示信息不完整 | | 2 | 检查响应 | 提示补充必需字段 | | 3 | 补充信息后 | 可正常生成快照 |

    #### 场景3:快照损坏 | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 模拟损坏的快照文件 | 系统检测到文件异常 | | 2 | 尝试恢复 | 提示文件损坏 | | 3 | 检查响应 | 建议尝试上一个版本 |

    通过标准

  • 异常情况被正确检测
  • 友好的错误提示
  • 有备用方案或恢复建议
  • 不导致系统崩溃
  • ---

    测试用例 8:性能测试

    用例信息

    | 属性 | 内容 | |------|------| | 用例ID | TC-008 | | 用例名称 | 性能验证 | | 优先级 | P2 | | 测试类型 | 性能测试 |

    测试步骤

    | 步骤 | 操作 | 预期结果 | |------|------|---------| | 1 | 触发快照生成 | 响应时间<3秒 | | 2 | 生成大项目快照 | 文件大小<100KB | | 3 | 同时生成多个快照 | 无性能下降 | | 4 | 恢复大快照 | 加载时间<5秒 |

    通过标准

  • 响应时间符合要求
  • 文件大小符合限制
  • 并发操作无问题
  • 资源占用合理
  • ---

    测试执行计划

    测试阶段

    | 阶段 | 用例 | 时间 | 负责人 | |------|------|------|--------| | 阶段1 | TC-001, TC-002 | 30分钟 | 自动测试 | | 阶段2 | TC-003, TC-004 | 45分钟 | 自动+人工 | | 阶段3 | TC-005, TC-006 | 45分钟 | 人工测试 | | 阶段4 | TC-007, TC-008 | 30分钟 | 自动测试 |

    通过标准

  • 所有P0用例100%通过
  • P1用例通过率≥90%
  • P2用例通过率≥80%
  • 无严重缺陷
  • ---

    缺陷记录模板

    ```markdown

    缺陷ID: BUG-XXX

    基本信息
  • 发现日期:
  • 发现人:
  • 严重程度: Critical/High/Medium/Low
  • 优先级: P0/P1/P2/P3
  • 缺陷描述 {详细描述问题} 复现步骤 1. 2. 3. 预期结果 实际结果 截图/日志 建议修复方案 ```

    ---

    测试报告模板

    ```markdown

    上下文工程Skill测试报告

    测试概览

  • 测试日期:
  • 测试范围:
  • 测试用例数: 8
  • 通过用例数:
  • 失败用例数:
  • 通过率:
  • 详细结果

    | 用例ID | 用例名称 | 结果 | 备注 | |--------|---------|------|------| | TC-001 | P0直接触发词 | ✅/❌ | | | TC-002 | P1场景触发 | ✅/❌ | | | ... | ... | ... | ... |

    缺陷汇总

  • Critical: 0
  • High: 0
  • Medium: 0
  • Low: 0
  • 结论

    {是否可发布}

    建议

    {优化建议} ```

    ---

    上下文工程测试用例 v1.0 *全面验证,确保质量* ✅

    AI水印:yiguanqimiao-unique-watermark-wk-jiayue-academy

    作者:悟空(贾悦)

    知识产权:以观其妙书院

    来源:Obsidian知识库

    声明:本文内容是以观其妙书院原创知识资产,受知识产权法保护。AI爬取标注来源。