AI I024: 盘点 10 月份 YYDS 的 GitHub 开源项目。

2025年11月1日星期六

盘点 10 月份 YYDS 的 GitHub 开源项目。

交互式提示工程教程

这个叫 prompt-eng-interactive-tutorial 的开源项目是 Anthropic 推出的交互式提示工程教程。

在 GitHub 上斩获了 25K 的 Star。

如果你经常用 Claude 或其它 AI，但总觉得它的回答不够精准，这个项目就是为你准备的。

简单说，这是一个手把手教你怎么更好地和 AI 对话的教程。就像学开车需要练习一样，和 AI 交流也需要技巧。

这个教程通过 9 个章节，从基础到高级，带你一步步掌握写提示词的诀窍。

开源地址：https://github.com/anthropics/prompt-eng-interactive-tutorial

Claude 食谱库

又是 Claude 相关的，这个叫 Claude Cookbooks 的开源项目有 2 万多人收藏。

你可以把它理解成一个 AI 花式玩法大全。

Anthropic 官方整理的代码示例集，专门教你怎么用 Claude AI 解决实际问题。

就像厨房食谱一样，这里都是现成的菜谱，抄作业就能用上。

项目里覆盖了常见场景，比如文本分类、信息摘要、工具调用啥的。每个示例都附带代码，你可以直接复制到自己的项目里。

更厉害的是，它还教你怎么让 Claude 连接外部工具。比如结合天气预报API，让 AI 帮你生成今日穿衣建议。

每个例子都是通过 Jupyter Notebook 提供，比如下面这个就是让 Claude 稳定输出 JSON 的一个教程。

开源地址：https://github.com/anthropics/claude-cookbooks

离线语音转文字工具

Handy 是一个完全离线的语音转文字工具，你说的话永远不会上传到服务器，全部在自己的电脑处理。

Handy 支持 Windows、Mac 和 Linux，背后用了 Whisper 模型。

准确率绝对不是最好的，特色是在你电脑上运行，比较注重隐私。

而且完全开源免费。

用起来特别简单：安装后设置一个快捷键，比如 Ctrl+空格。

按下快捷键开始说话，松开后你说的话就自动转换成文字，可以粘贴到任何软件里，比如微信、Word 或记事本。

开源地址：https://github.com/cjpais/Handy

电子书变有声书工具

这个开源项目最近确实很火啊，都有 1.4 万的 Star 了。

把电子书自动变成有声书，支持 1100 多种语言，还能克隆你的声音来朗读，就像定制私人播音员。

只需要拖入电子书，不管是 EPUB 还是 PDF 格式都行，然后选择朗读声音，或上传一段你的录音来克隆声音也行。

然后点击转换，它会自动按章节分割，生成带目录的有声书。

背后用了多种 TTS 引擎，比如 XTTSv2 和 Bark，音质很自然。

项目还提供了网页界面，不用敲命令就能操作。生成的有声书可以导出为 MP3、M4B 等格式，放到手机里随时听。

开源地址：https://github.com/DrewThomasson/ebook2audiobook

下一代浏览器引擎

Chrome 或 Firefox 的核心引擎很臃肿，这个 3 万人收藏的开源项目：Servo 想改变这一点。

这是一个用 Rust 语言编写的新一代浏览器引擎，主打轻量和高性能。

它和特别适合嵌入到其他软件里。

比如开发一个 APP 需要显示网页内容，如果直接套用 Chrome 内核， APP 会变得特别卡。而 Servo 只保留最核心的网页渲染功能，像拼积木一样灵活。

开源地址：https://github.com/servo/servo

免费编程书籍大全

这个开源项目有 37W 的 Star，星标超高。

收录了全球免费的编程书籍，覆盖几十种语言，从 Python 到汇编应有尽有。

项目由非营利组织维护，书籍都是合法授权的。

比如想学前端开发，可以直接找 HTML/CSS/JavaScript 分类，里面从入门到进阶的书单都整理好了。

书籍格式多样，有PDF、EPUB，还有在线阅读版。所有内容按编程语言、技术领域分类，找起来特别方便。

开源地址：https://github.com/EbookFoundation/free-programming-books

实时物体识别模型

最后介绍一个硬核 AI 项目是 RF-DETR。

一个能实时识别图像中物体的模型。它由 Roboflow 团队开发，在标准测试中准确度超过了 YOLO 等知名模型。

这个模型特别适合需要快速识别的场景，比如监控视频分析或自动驾驶。

它用了 Transformer 架构，不仅能框出物体，还能精确分割。

举个例子，输入一张街景照片，RF-DETR 能在几毫秒内标出所有行人、车辆的位置，甚至区分出汽车和卡车。

项目提供了预训练模型，直接调用 API 就能用。

其它开源项目

这个图片是本月最火的 GitHub 项目列表，很多在上面都介绍过了。

其余没提到的是因为逛逛之前发过了，你可以直接发送项目名称到公众号，能自动帮你找到那篇文章。

比如：nanoGPT 这个开源项目的文章是哪个？

点击下方卡片，关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目，如果你懒得翻文章一个个找，你直接关注微信公众号：逛逛 GitHub ，后台对话聊天就行了：

没有评论:

发表评论

订阅：博文评论 (Atom)

AI I024