2025年6月16日星期一

视频 1 键转成公众号、小红书、思维导图,牛的。

今天逛 GitHub 的时候,发现了一个 AI 创作开源项目。目前已经在 GitHub 上获得了 1.3K 的 Star

图片

这个叫 AI-Media2Doc 开源项目,可以一键把音频/视频转成各种风格的文档,包括小红书风格、公众号、思维导图、学习笔记、视频字幕等等。

很适合自媒体创作者或者学生党,基于视频或者语音自媒体创作场景,或者视频学习笔记制作场景。

01

项目简介

图片

AI-Media2Doc 是一个 Web 端的创作工具,你不需要登录注册。背后基于 AI 大模型,可以把视频、音频的内容转换成各种风格的文档。

开源地址:https://github.com/hanshuaikang/AI-Media2Doc
图片

部署也非常简单,支持 Docerk 一键部署:

① 安装 Docker, 这个网上有教程

② 镜像构建, 在项目根目录下执行:

$ make docker-image
③ 请根据如下文档,完善根目录下的 variables.env 文件。
地址:https://github.com/hanshuaikang/AI-Media2Doc/blob/main/backend/README.md

④ 运行项目,在项目根目录下执行:

$ make run

02

项目截图

部署成功后,你可以上传 MP3 或者 MP4 文件,让助手帮你生成图文内容。

图片
图片
支持小红书风格的图文,而且可以按照时间轴把文本转录信息识别出来。能够一键导出图文或者字幕。
图片
而且还能基于生成的内容进行二次对话,调整。
图片

其实没有多大的奥秘,就是每一种图文风格,背后对应一个预置的 Prompt。你可以在 Web 端对每一种风格文档进行预置 Prompt 的调整。

图片

这个开源项目,后面还会陆续迭代,支持只能截取视频关键帧。Star 起来吧。

图片
这个开源项目有点像我之前推荐的一个视频转笔记文档的项目,感兴趣的同学可以翻阅之前的文章:
4 个 AI 视频转笔记神器,开源了!

03

都看到这了,关注下吧。

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

没有评论:

发表评论

国内如何强制开启Gemini in Chrome?教程来了

内容:本文详细讲解国内用户使用Gemini in Chrome的方法,从官方要求、实验功能开关、修改配置文件到调整账号地区,手把手教你绕过限制,实现免费用。 话接上文。 前情提要看这里: 反击 OpenAI!谷歌史诗级更新:Gemini in Chrome 正式上线,免费用 ...