01
宝藏开源下载工具
平时下载文件、Torrent 种子,还有从视频平台扒音频/视频,总要用三四个工具来回切换,进度也不好统一管理。
开源项目 Varia 居然能把这些需求打包搞定,用下来还特别轻量。
这个下载工具能在 Linux 和 Windows 上使用,底层基于 aria2 经典下载工具和 yt-dlp 开源视频抓取工具。
相当于给这两个硬核工具套了个直观的图形界面。
不管是下常规文件、Torrent 种子,还是抓取音视频流,都能在一个界面里统一管理,操作门槛低,新手也能快速上手。
开源地址:https://github.com/giantpinkrobots/varia02
安卓自定义屏幕点击应用
这个开源项目的 logo 有点抽象啊,但是不妨碍它在 GitHub 上获得 3 万多星。
GKD 是一款专为 Android 设计的自定义屏幕点击应用,它基于无障碍服务、高级选择器和订阅规则三大技术。
简单说就是:你可以给它设定规则,让它在指定 APP 的指定界面里,自动执行点击、跳过、确认等操作。
看这个开源工具可能搞不明白能干啥。
GKD 的用法很灵活,日常用手机的很多场景都能覆盖,举几个常见的例子:
说白了就是帮你简化重复操作的,而且开源免费。
开源地址:https://github.com/gkd-kit/gkd03
论文直接转换成 PPT
新加坡国立大学 Show Lab 开源的 Paper2Video,直接把论文转 PPT 视频。
只需输入一篇论文文章、作者照片和 10 秒左右的参考音频,就能自动生成带 PPT、字幕、语音和虚拟演讲人的完整视频。
而且它配套了 Paper2Video 基准体系,用 4 个专属评估指标,比如 Meta Similarity、PresentQuiz。
从是否准确传达论文核心、是否符合学术受众理解习惯等维度打分,避免做出来的视频好看但没用。
开源地址:https://github.com/showlab/Paper2Video 04
腾讯开源的知识库神器
先来看看腾讯开源的 WeKnora 的功能界面,是不是很像 IMA?
WeKnora 是腾讯推出的基于 AI 大模型的文档理解与语义检索框架,专门针对结构复杂、内容零散的文档场景设计。
它的核心逻辑是先找再答:通过 RAG 机制,先从文档里精准定位相关内容片段,再结合大模型生成易懂的回答,避免了纯 LLM 一本正经胡说八道的问题。
大模型联动能对话兼容 Qwen、DeepSeek 等模型,支持多轮问答和上下文理解。
而且整体是模块化设计,从文档解析到检索、再到生成回答,每个环节都能灵活调整,不管是开发者定制还是普通用户用,都很方便。
而且这个开源项目还支持通过 MCP Server 集成。
开源地址:https://github.com/Tencent/WeKnora05
点击下方卡片,关注逛逛 GitHub
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:
没有评论:
发表评论