2025年10月18日星期六

一键包:视频内容转录,直出语音文本内容和摘要,帮您总结长视频内容,提升学习效率

      很多网上的视频干货满满,但是时间太长,没有时间一帧一帧的去读,最近发现一个不错的项目,可以输入视频链接,直接总结识别视频的对话内容,同时给出总结摘要,学习真的是事半功倍,支持多种语言和多个视频站,比如b站,小红书、油管等等,真的很实用,现在分享给大家,也给大家准备了一键包,文末获取,废话不多说,直接上干货。

1

项目简介
AI视频转录器一款开源的AI视频转录和摘要工具,支持YouTube、Bilibili、抖音等30+平台。
图片

2

功能特性
  • 🎥 多平台支持: 支持YouTube、Bilibili、抖音等30+平台
  • 🗣️ 智能转录: 使用Faster-Whisper模型进行高精度语音转文字
  • 🤖 AI文本优化: 自动错别字修正、句子完整化和智能分段
  • 🌍 多语言摘要: 支持多种语言的智能摘要生成
  • ⚡ 实时进度: 实时进度跟踪和状态更新
  • ⚙️ 条件式翻译: 当所选摘要语言与检测到的转录语言不一致时,自动调用GPT‑4o生成翻译
  • 📱 移动适配: 完美支持移动设备
目前国内有些朋友有些朋友可能用不了chatgpt,我做一键包时,改成了ollama的,你也可以改成在线api的,

3

环境安装
安装方法
  • 方法一:自动安装

# 克隆项目git clone https://github.com/wendy7756/AI-Video-Transcriber.gitcd AI-Video-Transcriber
# 运行安装脚本chmod +x install.sh./install.sh
  • 方法二:Docker部署
# 克隆项目git clone https://github.com/wendy7756/AI-Video-Transcriber.gitcd AI-Video-Transcriber# 使用Docker Compose(最简单)cp .env.example .env# 编辑.env文件,设置你的OPENAI_API_KEYdocker-compose up -d# 或者直接使用Dockerdocker build -t ai-video-transcriber .docker run -p 8000:8000 -e OPENAI_API_KEY="你的API密钥" ai-video-transcriber

  • 方法三:手动安装
# 创建并启用虚拟环境(macOS推荐,避免 PEP 668 系统限制)python3 -m venv venvsource venv/bin/activatepython -m pip install --upgrade pippip install -r requirements.txt
安装FFmpeg
# macOSbrew install ffmpeg
# Ubuntu/Debiansudo apt update && sudo apt install ffmpeg
# CentOS/RHELsudo yum install ffmpeg
(摘要/翻译功能需要)
# 必需:启用智能摘要/翻译export OPENAI_API_KEY="your_api_key_here"
# 可选:如使用自建/代理的OpenAI兼容网关,按需设置export OPENAI_BASE_URL="https://oneapi.basevec.com/v1"

4

启动服务
python3 start.py

http://localhost:8000
生产模式(推荐用于长视频)
为了避免在处理长视频时SSE连接断开,建议使用生产模式启动(禁用热重载):
python3 start.py --prod
这样可以在长时间任务(30-60+分钟)中保持SSE连接稳定。
项目实测
下载一键包后,启动会弹出webui页面
在b站找了一个视频链接如下,一个讲解混元3d的:
https://www.bilibili.com/video/BV1DexYzbEY1/?spm_id_from=333.337.search-card.all.click&vd_source=8315d4fcdd7c4ba40c4d65a8321ecb9e
图片
在页面中输入链接,语言根据你视频的语言来,我这个视频时中文的,我就选择中文,点击处理
图片
等待一会,就有结果了
图片
你可以在线浏览结果,也可以下载下来,项目刚开源不就,还在持续优化中,大家也可以根据源码自己优化
欢迎大家关注,持续分享AI项目,关注后回复私信【av1】可获取一键包
大模型感兴趣的可以进群交流,已在群的就不要进了,我会定时清理
图片

#多模态大模型#大语言模型#图像高清化#图片放大

历史优秀文章
开源图片一键高清项目,本地部署免费使用
替换视频人物:阿里开源wan2.2-vace-fun,可实现图片人物替换视频人物,文末一键包
AI+3D打印:从一张图片到真实的手办,保姆教程实现手办自由!文末一键包
图片数字人:对话唱歌都很自然,文末一键包,还有comfyui一键包
qwen-image-edit保持一致性真不错,图片编辑很灵活,文末一键包
基于claude code 接入国产模型,可调用agent,可控制操作系统,无需梯子使用本地大模型

没有评论:

发表评论

视频生成实时拖拽一切!南洋理工DragStream实现拖一下就能改大片,告别从头渲染!

AI生成未来知识星球免费开放! 点击下方 卡片 ,关注" AI生成未来 " 👇扫码 免费加入 AI知识星球 ,如您有工作需要分享,欢迎联系: aigc_to_future 作者:Junbao Zhou 等 解读:AI生成未来 论文链接:https://a...