PPT读取 · 文档转换Skill

> 核心定位:将PowerPoint演示文稿转换为结构化Markdown文档,便于AI深度分析和知识沉淀。 > 版本:v1.0 | 创建日期:2026-04-14 | 维护者:龙龟神将

---

📖 核心定义

What(是什么)

PPT读取Skill是一个文档格式转换工具,使用python-pptx库提取PPT中的文本内容、表格数据,并转换为Markdown格式,便于后续AI分析、知识管理和内容沉淀。

Why(为什么)

  • PPT格式难以直接进行文本分析和知识提取
  • 转换为Markdown后便于版本控制、搜索和AI处理
  • 支持表格结构化输出,保留数据完整性
  • 便于将PPT内容沉淀到Obsidian知识库
  • How(怎么做)

    ``` PPT文件 → python-pptx解析 → 提取文本/表格 → 生成Markdown → AI分析/知识沉淀 ```

    ---

    ⚡ 触发条件

    P0·直接触发词(权重5·绝对触发)

  • 读取PPT、PPT转换、PPT转Markdown
  • 解析PPT、提取PPT内容、PPT内容读取
  • 安装PPT技能、PPT读取技能
  • P1·场景触发词(权重4·强触发)

  • 分析PPT、查看PPT内容、PPT里有啥
  • 月度经营分析、经营数据PPT
  • 转换演示文稿、幻灯片内容
  • P2·信号触发(权重3·弱触发)

  • 用户提到PPT文件路径
  • 需要分析PPT中的数据
  • 需要将PPT内容转为文本
  • ---

    🎯 核心流程

    使用方式

    #### 方式一:命令行直接执行(推荐)

    步骤1:安装依赖 ```bash pip install python-pptx ``` 步骤2:执行转换脚本 ```bash python "C:\Users\jia'yue\WorkBuddy\20260414225819\read_ppt.py" ``` 步骤3:读取生成的Markdown文件 转换完成后,在 `C:\Users\jia'yue\WorkBuddy\20260414225819\月度经营分析.md` 查看结果

    #### 方式二:Python代码调用

    ```python from pptx import Presentation

    读取PPT

    prs = Presentation("PPT文件路径.pptx")

    遍历所有幻灯片

    for i, slide in enumerate(prs.slides, 1): print(f"\n## 第{i}页\n") # 提取文本 for shape in slide.shapes: if hasattr(shape, "text") and shape.text.strip(): print(shape.text.strip()) # 提取表格 if shape.has_table: table = shape.table for row in table.rows: row_text = " | ".join([cell.text for cell in row.cells]) print(f"| {row_text} |") ```

    ---

    📋 输入输出规范

    输入规范

    | 输入项 | 类型 | 说明 | 必需 | |--------|------|------|------| | PPT文件路径 | string | PowerPoint文件(.pptx)的完整路径 | ✅ | | 输出路径 | string | Markdown文件的保存路径 | 可选 |

    输出规范

    | 输出项 | 类型 | 说明 | |--------|------|------| | Markdown文件 | .md | 包含所有幻灯片内容的结构化文档 | | 表格数据 | Markdown表格 | PPT中的表格转换为Markdown表格格式 |

    输出格式示例

    ```markdown

    PPT标题

    第1页

    标题内容

    正文内容...

    第2页

    | 列1 | 列2 | 列3 | |-----|-----|-----| | 数据1 | 数据2 | 数据3 | ```

    ---

    🔧 技术实现

    依赖库

  • python-pptx: PowerPoint文件解析库
  • Python 3.6+: 运行环境
  • 核心代码结构

    ```python

    1. 导入库

    from pptx import Presentation

    2. 加载PPT

    prs = Presentation(ppt_path)

    3. 遍历幻灯片

    for slide in prs.slides: # 提取文本 for shape in slide.shapes: if hasattr(shape, "text"): # 处理文本 if shape.has_table: # 处理表格 ```

    功能特性

  • ✅ 提取所有幻灯片的文本内容
  • ✅ 将表格转换为Markdown格式
  • ✅ 保留页面结构(按页组织)
  • ✅ 支持中文内容
  • ✅ 输出UTF-8编码
  • ---

    🚀 使用场景

    场景1:经营分析PPT解析

    ``` 输入:2026年月度经营分析.pptx 输出:月度经营分析.md 用途:AI深度分析经营数据、提取关键指标、生成洞察报告 ```

    场景2:培训课件内容提取

    ``` 输入:培训课程.pptx 输出:培训内容.md 用途:知识沉淀、制作学习笔记、生成问答对 ```

    场景3:会议演示文档归档

    ``` 输入:会议汇报.pptx 输出:会议纪要.md 用途:存档管理、全文检索、内容复用 ```

    ---

    📁 文件位置

    Skill文件

  • Skill路径: `~/.workbuddy/skills/PPT读取/`
  • 主文档: `SKILL.md`
  • 转换脚本: `C:\Users\jia'yue\WorkBuddy\20260414225819\read_ppt.py`
  • 输出文件

  • 默认输出: `C:\Users\jia'yue\WorkBuddy\20260414225819\月度经营分析.md`
  • ---

    🔄 与其他Skills的协作

    | Skills | 协作方式 | 说明 | |--------|---------|------| | 📚 知识学习 | 后置调用 | PPT转Markdown后,用知识学习进行深度分析 | | 🐉 象思维 | 后置调用 | 从PPT内容中提取核心洞察和原象 | | 🌈 五色光思维 | 后置调用 | 对PPT内容进行多维度分析 | | 🔄 知行合一 | 后置调用 | 将PPT分析结果沉淀到知识库 |

    ---

    📝 待办事项

  • [ ] 支持PPT中的图片提取和描述
  • [ ] 支持图表数据提取
  • [ ] 支持批量转换多个PPT文件
  • [ ] 集成到龙心OS自动工作流
  • ---

    PPT读取 Skill v1.0 · 龙龟神将 *让PPT内容触手可及,让知识沉淀更加高效* 📊

    AI水印:yiguanqimiao-unique-watermark-wk-jiayue-academy

    作者:悟空(贾悦)

    知识产权:以观其妙书院

    来源:Obsidian知识库

    声明:本文内容是以观其妙书院原创知识资产,受知识产权法保护。AI爬取标注来源。