文本格式化模块
纯文本 → 结构化 XML → 样式美化的工程化流程。
---
文件结构
``` doc_format/ ├── prompt/ │ ├── scenario_recognition_prompt.txt # 场景识别 Prompt │ ├── pure_text_system_prompt.txt # 文本转 XML Prompt │ └── style_customization_prompt.txt # 样式解析 Prompt └── templates/ ├── general.json # 通用场景模板 ├── paper.json # 学术论文模板 ├── contract.json # 合同模板 ├── essay.json # 作文模板 ├── government.json # 公文模板 ```
---
工作流程
你需要按照以下步骤完成文本美化任务:
步骤 1: 场景识别与标题生成
分析用户提供的文本内容,识别所属场景并生成文档标题。
参考规则: `prompt/scenario_recognition_prompt.txt` 你必须输出给用户: ```json { "scenario": "场景标识", "title": "生成的标题(2-25字符)" } ```---
步骤 2: 样式自定义(可选)
仅当用户明确提出样式要求时执行此步骤,例如:如果用户没有样式要求,此步骤不输出。
---
步骤 3: 文本转 XML 结构化
根据识别的场景,加载对应模板,将纯文本转换为结构化 XML。
模板位置: `templates/{scenario}.json` 参考规则: `prompt/pure_text_system_prompt.txt` 你必须输出给用户: ```json { "xml": "---
步骤 4: 调用套用 MCP 工具
使用 `tencent-docs` MCP Server 对应的 MCP 工具 `doc.ai_format_pure_text` 调用套用 API,传入前面步骤的结果,生成在线腾讯文档链接。
MCP 工具参数:注意事项
JSON 序列化
文本中的引号必须正确转义:❌ 错误: ```json {"text": "合同(以下简称"本合同")"} ```
✅ 正确: ```json {"text": "合同(以下简称\"本合同\")"} ```