01
视频翻译神器
pyvideotrans 在 GitHub 上有 14K+ 的 Star。
它能够将视频从一种语言翻译成另一种语言,并自动生成配音与字幕,用它搞跨语言视频制作爽飞了。
别看他界面很朴素,功能却非常丰富,不仅支持视频翻译与配音,还又语音识别、字幕提取、格式转换、人声与背景音乐分离等多种实用功能。
还有一系列周边工具,例如字幕编辑、视频音频合并、格式转换、水印添加等,可以说是一个功能全面的多媒体处理助手。
在语音识别方面,该项目集成了多种引擎,包括 faster-whisper、OpenAI Whisper、Deepgram、Gemini,也支持阿里Funasr、字节火山等国内服务,用户还可以自定义识别接口。
翻译服务同样选择丰富,包括微软、谷歌、百度、腾讯、ChatGPT、DeepL等多个平台,也支持离线翻译及自定义API。
开源地址:https://github.com/jianchang512/pyvideotrans
02
提升视频分辨率
Video2X 是一个视频处理开源工具,能够提升视频的分辨率和流畅度。让视频模糊的视频变清晰,也能让原本卡顿的视频变得更流畅。
GitHub 上获得了 14.5K 的 Star,还挺受欢迎的。
Video2X 主要有两大功能:
🖼️
视频超分辨率:也就是放大视频尺寸并增强画质,让细节更清晰;
🎬 帧率 interpolation:通过在视频帧之间智能生成中间帧,让运动画面更加顺滑。
它支持多种先进的AI模型,例如 Anime4K、Real-ESRGAN、Real-CUGAN 和 RIFE,你可以根据自己的需求选择不同的算法。
值得一提的是,它在处理过程中几乎不占用额外磁盘空间,只需预留输出文件所需的容量。
开源地址:https://github.com/k4yt3x/video2x
03
PDF 补丁丁
经常要处理 PDF 文件的朋友,这个开源项目很适合你。
比如想调整 PDF 页面顺序、提取特定图片、解除文档限制,或是为文件添加书签,这些需求虽然常见,PDF 补丁丁就能办了。
不需要开会员,PDF补丁丁完全免费、无广告,也不收集用户信息。
这个界面是不是看起来有点,emmmmmm 因为它是基于.NET Framework 编写的,好在功能丰富。
它不仅可以用来编辑PDF书签、调整页面尺寸、旋转页面,还能解除文档的打印和复制限制,甚至能拆分、合并PDF,或者把图片合并成PDF文件。
反正那些开会员的 PDF 编辑功能大部分都有用。
开源地址:https://github.com/wmjordan/PDFPatcher
更新日志:https://www.cnblogs.com/pdfpatcher
04
开源文件传输工具
用 Go 语言和 React 开发的文件传输工具。基于 WebRTC 技术实现点对点直连传输。
文件、文字或屏幕共享内容直接在发送方和接收方之间传输,不会经过中间服务器,更好地保障数据隐私与安全。
三大主要功能:
文件传输,支持同时发送多个文件;文字内容即时分享;桌面屏幕实时共享。它使用六位取件码进行匹配连接,无需注册,打开即用。
这个工具适合需要快速、安全分享内容的场景,尤其是对隐私较为敏感的用户。
它的界面支持响应式设计,可在电脑、手机和平板上正常使用,并提供了Linux、macOS和Windows系统的单文件部署方式,安装简单。
开源地址:https://github.com/MatrixSeven/file-transfer-go
05
视频翻译
AI-Video-Transcriber 借助 AI 技术,帮你自动转录视频内容并生成文字摘要。
它支持包括 YouTube、Bilibili、TikTok 等超过三十种视频平台,适用于多种使用场景。
有点类似我之前推荐的开源项目 BiliNote。
这个开源项目使用 Faster-Whisper 实现语音识别,并能够自动修正错别字、优化语句不通顺的地方。
而且还能对文本进行智能分段,使内容更易读。
此外,它还支持生成多语言摘要。如果你选择的摘要语言与视频原语言不同,系统还会借助 GPT-4o 自动翻译内容。
开源地址:https://github.com/wendy7756/AI-Video-Transcriber
06
点击下方卡片,关注我
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:
没有评论:
发表评论