AI I024: 一键包：视频内容转录，直出语音文本内容和摘要，帮您总结长视频内容，提升学习效率

2025年10月18日星期六

一键包：视频内容转录，直出语音文本内容和摘要，帮您总结长视频内容，提升学习效率

很多网上的视频干货满满，但是时间太长，没有时间一帧一帧的去读，最近发现一个不错的项目，可以输入视频链接，直接总结识别视频的对话内容，同时给出总结摘要，学习真的是事半功倍，支持多种语言和多个视频站，比如b站，小红书、油管等等，真的很实用，现在分享给大家，也给大家准备了一键包，文末获取，废话不多说，直接上干货。

项目简介

AI视频转录器一款开源的AI视频转录和摘要工具，支持YouTube、Bilibili、抖音等30+平台。

功能特性

🎥 多平台支持: 支持YouTube、Bilibili、抖音等30+平台

🗣️ 智能转录: 使用Faster-Whisper模型进行高精度语音转文字

🤖 AI文本优化: 自动错别字修正、句子完整化和智能分段

🌍 多语言摘要: 支持多种语言的智能摘要生成

⚡ 实时进度: 实时进度跟踪和状态更新

⚙️ 条件式翻译: 当所选摘要语言与检测到的转录语言不一致时，自动调用GPT‑4o生成翻译

📱 移动适配: 完美支持移动设备

目前国内有些朋友有些朋友可能用不了chatgpt，我做一键包时，改成了ollama的，你也可以改成在线api的，

环境安装

安装方法

方法一：自动安装


# 克隆项目git clone https://github.com/wendy7756/AI-Video-Transcriber.gitcd AI-Video-Transcriber
# 运行安装脚本chmod +x install.sh./install.sh

方法二：Docker部署

# 克隆项目git clone https://github.com/wendy7756/AI-Video-Transcriber.gitcd AI-Video-Transcriber# 使用Docker Compose（最简单）cp .env.example .env# 编辑.env文件，设置你的OPENAI_API_KEYdocker-compose up -d# 或者直接使用Dockerdocker build -t ai-video-transcriber .docker run -p 8000:8000 -e OPENAI_API_KEY="你的API密钥" ai-video-transcriber

方法三：手动安装

# 创建并启用虚拟环境（macOS推荐，避免 PEP 668 系统限制）python3 -m venv venvsource venv/bin/activatepython -m pip install --upgrade pippip install -r requirements.txt

安装FFmpeg

# macOSbrew install ffmpeg
# Ubuntu/Debiansudo apt update && sudo apt install ffmpeg
# CentOS/RHELsudo yum install ffmpeg

（摘要/翻译功能需要）

# 必需：启用智能摘要/翻译export OPENAI_API_KEY="your_api_key_here"
# 可选：如使用自建/代理的OpenAI兼容网关，按需设置export OPENAI_BASE_URL="https://oneapi.basevec.com/v1"

启动服务

python3 start.py

http://localhost:8000

生产模式（推荐用于长视频）

为了避免在处理长视频时SSE连接断开，建议使用生产模式启动（禁用热重载）：

python3 start.py --prod

这样可以在长时间任务（30-60+分钟）中保持SSE连接稳定。

项目实测

下载一键包后，启动会弹出webui页面

在b站找了一个视频链接如下，一个讲解混元3d的：

https://www.bilibili.com/video/BV1DexYzbEY1/?spm_id_from=333.337.search-card.all.click&vd_source=8315d4fcdd7c4ba40c4d65a8321ecb9e

在页面中输入链接，语言根据你视频的语言来，我这个视频时中文的，我就选择中文，点击处理

等待一会，就有结果了

你可以在线浏览结果，也可以下载下来，项目刚开源不就，还在持续优化中，大家也可以根据源码自己优化

欢迎大家关注，持续分享AI项目，关注后回复私信【av1】可获取一键包

大模型感兴趣的可以进群交流，已在群的就不要进了，我会定时清理

#多模态大模型 #大语言模型 #图像高清化 #图片放大

历史优秀文章

开源图片一键高清项目，本地部署免费使用

替换视频人物：阿里开源wan2.2-vace-fun，可实现图片人物替换视频人物，文末一键包

AI+3D打印：从一张图片到真实的手办，保姆教程实现手办自由！文末一键包

图片数字人：对话唱歌都很自然，文末一键包，还有comfyui一键包

qwen-image-edit保持一致性真不错，图片编辑很灵活，文末一键包

基于claude code 接入国产模型，可调用agent，可控制操作系统，无需梯子使用本地大模型

AI I024

2025年10月18日星期六

一键包：视频内容转录，直出语音文本内容和摘要，帮您总结长视频内容，提升学习效率

没有评论:

发表评论

离线翻译神器Argos Translate：40+语种，无网也能精准翻译