AI I024: 视频 1 键转成公众号、小红书、思维导图，牛的。

2025年6月16日星期一

今天逛 GitHub 的时候，发现了一个 AI 创作开源项目。目前已经在 GitHub 上获得了 1.3K 的 Star。

这个叫 AI-Media2Doc 开源项目，可以一键把音频/视频转成各种风格的文档，包括小红书风格、公众号、思维导图、学习笔记、视频字幕等等。

很适合自媒体创作者或者学生党，基于视频或者语音自媒体创作场景，或者视频学习笔记制作场景。

项目简介

AI-Media2Doc 是一个 Web 端的创作工具，你不需要登录注册。背后基于 AI 大模型，可以把视频、音频的内容转换成各种风格的文档。

开源地址：https://github.com/hanshuaikang/AI-Media2Doc

部署也非常简单，支持 Docerk 一键部署：

① 安装 Docker, 这个网上有教程

② 镜像构建, 在项目根目录下执行:

$ make docker-image

③ 请根据如下文档，完善根目录下的 variables.env 文件。

地址：https://github.com/hanshuaikang/AI-Media2Doc/blob/main/backend/README.md

④ 运行项目,在项目根目录下执行:

$ make run

项目截图

部署成功后，你可以上传 MP3 或者 MP4 文件，让助手帮你生成图文内容。

支持小红书风格的图文，而且可以按照时间轴把文本转录信息识别出来。能够一键导出图文或者字幕。

而且还能基于生成的内容进行二次对话，调整。

其实没有多大的奥秘，就是每一种图文风格，背后对应一个预置的 Prompt。你可以在 Web 端对每一种风格文档进行预置 Prompt 的调整。

这个开源项目，后面还会陆续迭代，支持只能截取视频关键帧。Star 起来吧。

这个开源项目有点像我之前推荐的一个视频转笔记文档的项目，感兴趣的同学可以翻阅之前的文章：

都看到这了，关注下吧。

这个公众号历史发布过很多有趣的开源项目，如果你懒得翻文章一个个找，你直接关注微信公众号：逛逛 GitHub ，后台对话聊天就行了。