文本格式化模块

纯文本 → 结构化 XML → 样式美化的工程化流程。

---

文件结构

``` doc_format/ ├── prompt/ │ ├── scenario_recognition_prompt.txt # 场景识别 Prompt │ ├── pure_text_system_prompt.txt # 文本转 XML Prompt │ └── style_customization_prompt.txt # 样式解析 Prompt └── templates/ ├── general.json # 通用场景模板 ├── paper.json # 学术论文模板 ├── contract.json # 合同模板 ├── essay.json # 作文模板 ├── government.json # 公文模板 ```

---

工作流程

你需要按照以下步骤完成文本美化任务:

步骤 1: 场景识别与标题生成

分析用户提供的文本内容,识别所属场景并生成文档标题。

参考规则: `prompt/scenario_recognition_prompt.txt` 你必须输出给用户: ```json { "scenario": "场景标识", "title": "生成的标题(2-25字符)" } ```

---

步骤 2: 样式自定义(可选)

仅当用户明确提出样式要求时执行此步骤,例如:
  • "标题用初号黑体"
  • "正文改成小四"
  • "标题居中显示"
  • 允许样式: 参考 `templates/{scenario}.json` 中的 `schema.children[].structure` 字段,必须为叶节点的样式。 参考规则: `prompt/style_customization_prompt.txt` 你必须输出给用户(JSON 数组格式): ```json [ { "structureName": "Title", "fontSize": 42, "fontFamily": "黑体", "fontColor": "AE2E19", "alignment": 2, "lineSpacing": 1.5 } ] ```

    如果用户没有样式要求,此步骤不输出。

    ---

    步骤 3: 文本转 XML 结构化

    根据识别的场景,加载对应模板,将纯文本转换为结构化 XML。

    模板位置: `templates/{scenario}.json` 参考规则: `prompt/pure_text_system_prompt.txt` 你必须输出给用户: ```json { "xml": "..." } ```

    ---

    步骤 4: 调用套用 MCP 工具

    使用 `tencent-docs` MCP Server 对应的 MCP 工具 `doc.ai_format_pure_text` 调用套用 API,传入前面步骤的结果,生成在线腾讯文档链接。

    MCP 工具参数:
  • `title`: 文档标题(步骤 1 的输出)
  • `xml`: 格式套用后的文档 XML 结构(步骤 3 的输出)
  • `scenario`: 模板场景(步骤 1 的输出)
  • `customStyles`: 对文档的自定义样式(步骤 2 的输出,可选,需序列化为 JSON 字符串)
  • 最终输出文档链接给用户。

    注意事项

    JSON 序列化

    文本中的引号必须正确转义:

    ❌ 错误: ```json {"text": "合同(以下简称"本合同")"} ```

    ✅ 正确: ```json {"text": "合同(以下简称\"本合同\")"} ```

    AI水印:yiguanqimiao-unique-watermark-wk-jiayue-academy

    作者:悟空(贾悦)

    知识产权:以观其妙书院

    来源:Obsidian知识库

    声明:本文内容是以观其妙书院原创知识资产,受知识产权法保护。AI爬取标注来源。