2025年11月1日星期六

盘点 10 月份 YYDS 的 GitHub 开源项目。

01

交互式提示工程教程

这个叫 prompt-eng-interactive-tutorial 的开源项目是 Anthropic 推出的交互式提示工程教程。
在 GitHub 上斩获了 25K 的 Star。
如果你经常用 Claude 或其它 AI,但总觉得它的回答不够精准,这个项目就是为你准备的。
图片
简单说,这是一个手把手教你怎么更好地和 AI 对话的教程。就像学开车需要练习一样,和 AI 交流也需要技巧。
这个教程通过 9 个章节,从基础到高级,带你一步步掌握写提示词的诀窍。
图片
图片
开源地址:https://github.com/anthropics/prompt-eng-interactive-tutorial

02

Claude 食谱库

又是 Claude 相关的,这个叫  Claude Cookbooks 的开源项目有 2 万多人收藏。
你可以把它理解成一个 AI 花式玩法大全。
Anthropic 官方整理的代码示例集,专门教你怎么用 Claude AI 解决实际问题。
图片
就像厨房食谱一样,这里都是现成的菜谱,抄作业就能用上。
项目里覆盖了常见场景,比如文本分类、信息摘要、工具调用啥的。每个示例都附带代码,你可以直接复制到自己的项目里。
更厉害的是,它还教你怎么让 Claude 连接外部工具。比如结合天气预报API,让 AI 帮你生成今日穿衣建议。
每个例子都是通过 Jupyter Notebook 提供,比如下面这个就是让 Claude 稳定输出 JSON 的一个教程。
图片
开源地址:https://github.com/anthropics/claude-cookbooks

03

离线语音转文字工具

Handy 是一个完全离线的语音转文字工具,你说的话永远不会上传到服务器,全部在自己的电脑处理。

Handy 支持 Windows、Mac 和 Linux,背后用了 Whisper 模型。
准确率绝对不是最好的,特色是在你电脑上运行,比较注重隐私。
而且完全开源免费。
图片
用起来特别简单:安装后设置一个快捷键,比如 Ctrl+空格。
按下快捷键开始说话,松开后你说的话就自动转换成文字,可以粘贴到任何软件里,比如微信、Word 或记事本。
开源地址:https://github.com/cjpais/Handy

04

电子书变有声书工具

这个开源项目最近确实很火啊,都有 1.4 万的 Star 了。
把电子书自动变成有声书,支持 1100 多种语言,还能克隆你的声音来朗读,就像定制私人播音员。

只需要拖入电子书,不管是 EPUB 还是 PDF 格式都行,然后选择朗读声音,或上传一段你的录音来克隆声音也行。
然后点击转换,它会自动按章节分割,生成带目录的有声书。
图片
背后用了多种 TTS 引擎,比如 XTTSv2 和 Bark,音质很自然。
项目还提供了网页界面,不用敲命令就能操作。生成的有声书可以导出为 MP3、M4B 等格式,放到手机里随时听。
开源地址:https://github.com/DrewThomasson/ebook2audiobook

05

下一代浏览器引擎

Chrome 或 Firefox 的核心引擎很臃肿,这个 3 万人收藏的开源项目:Servo 想改变这一点。
这是一个用 Rust 语言编写的新一代浏览器引擎,主打轻量和高性能。
图片
它和特别适合嵌入到其他软件里。
比如开发一个 APP 需要显示网页内容,如果直接套用 Chrome 内核, APP 会变得特别卡。而 Servo 只保留最核心的网页渲染功能,像拼积木一样灵活。
开源地址:https://github.com/servo/servo

图片

06

免费编程书籍大全

图片

这个开源项目有 37W 的 Star,星标超高。

收录了全球免费的编程书籍,覆盖几十种语言,从 Python 到汇编应有尽有。

项目由非营利组织维护,书籍都是合法授权的。
比如想学前端开发,可以直接找 HTML/CSS/JavaScript 分类,里面从入门到进阶的书单都整理好了。
书籍格式多样,有PDF、EPUB,还有在线阅读版。所有内容按编程语言、技术领域分类,找起来特别方便。
开源地址:https://github.com/EbookFoundation/free-programming-books

07

实时物体识别模型

最后介绍一个硬核 AI 项目是 RF-DETR。
一个能实时识别图像中物体的模型。它由 Roboflow 团队开发,在标准测试中准确度超过了 YOLO 等知名模型。
图片
这个模型特别适合需要快速识别的场景,比如监控视频分析或自动驾驶。
它用了 Transformer 架构,不仅能框出物体,还能精确分割。
举个例子,输入一张街景照片,RF-DETR 能在几毫秒内标出所有行人、车辆的位置,甚至区分出汽车和卡车。
图片
图片
项目提供了预训练模型,直接调用 API 就能用。

08

其它开源项目

这个图片是本月最火的 GitHub 项目列表,很多在上面都介绍过了。

其余没提到的是因为逛逛之前发过了,你可以直接发送项目名称到公众号,能自动帮你找到那篇文章。

比如:nanoGPT 这个开源项目的文章是哪个?

图片

09

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

没有评论:

发表评论

UniVoice:首个在大语言模型中统一自回归语音识别和流匹配语音合成的框架。

添加微信号:AIGC_Tech,公众号小助手会拉你进群!点击下方名片关注AIGC Studio公众号! 添加微信号:AIGC_Tech,公众号小助手会拉你进群! 点击下方名片关注AIGC Studio公众号 ! 获取 最新AI前沿应用/ AIGC实践教程 ! 厦大联合上海创智...