2025年12月7日星期日

逛逛发现了 5 个 AI 开源 GitHub 项目,快来瞧瞧。

01

AI 大神新开源玩具

之前介绍过 AI 大神 Karpathy 的一个开源项目 nanoChat,现在他又开源了一个新的玩具:llm-council 

图片

这是一个多智能体协作的 Demo。

它的理念很简单,既然一个诸葛亮(AI 大模型)可能会犯错,那三个臭皮匠能不能顶个诸葛亮?

它搞了一个委员会,在这个委员会里,你可以邀请不同的 AI,例如 GPT-4、Claude 3.5、Gemini 坐在圆桌前。

当你提出一个问题时,它们不仅会分别回答,甚至可能互相通过讨论来达成共识或展示不同观点。

图片
开源地址:https://github.com/karpathy/llm-council

02

云端浏览器自动化 MCP

这个叫 Browserbase 的 MCP 是一个浏览器自动化神器,通过 Browserbase 云浏览器和 Stagehand 工具,让 AI 大模型具备了直接操控网页的能力。

图片

很多开源的 Browser Use 工具需要你在本地跑一个无头浏览器。这不仅吃内存,而且你的本地 IP 很容易被目标网站封禁。

Browserbase MCP 的后端是云浏览器。

自带指纹混淆、自动解决 CAPTCHA 验证码,轻松绕过反爬机制。而且不需要你在本地安装 Chrome,所有繁重的渲染都在云端完成,你的电脑风扇不会起飞。

支持 Context ID,这意味着 Agent 可以记住你的登录状态。这一轮对话登录了,下一轮对话还能接着操作,不用每次都重新登录。

图片
开源地址:https://github.com/browserbase/mcp-server-browserbase

03

FLUX.2 正式发布

图片

还记得几个月前横空出世、拳打 Midjourney、脚踢 Stable Diffusion 的 FLUX.1 吗?Black Forest Labs 当时以一己之力拉高了开源生图模型的上限。

现在 FLUX.2 正式发布,不仅升级了模型,更是直接改变了玩儿法。

FLUX.2 引入了视觉语言模型架构,支持多图参考,在保持角色一致性、文字渲染和画面细节上实现了质的飞跃。

图片
图片
图片

图片
图片
开源地址:https://github.com/black-forest-labs/flux2

04

Soul 推出的 AI 博客功能

Google 的 NotebookLM 推出的 Audio Overview 功能火遍全网,两只 AI 互相调侃解读论文的场景让人印象深刻。

国内的 Soul AILab 团队推出了 SoulX-Podcast,让你也能一键生成高质量的 AI 播客。

图片

是一个全流程的音频内容生成工具,现在有 2500+ 的 Star。

你只需要投喂文章、论文、小说等文本,它就能自动生成剧本,并利用高质量的语音合成技术,生成一段双人或多人对谈的播客音频。

生成的语音不是冷冰冰的机器音,而是带有语气、停顿和情感的拟人化声音。

而且还在朝着支持四川话、河南话和粤语多种中国方言努力让播客风格语音生成更个性化。

河南话:

四川话:

粤语:

相比 NotebookLM 的黑盒,你可以自定义提示词、选择不同的声音模型,甚至调整对话风格,比如幽默、严肃、教学啥的。

而且他在 Hugging Face 上搞了一个 Demo,可以去玩一玩。
图片
开源地址:https://github.com/Soul-AILab/SoulX-Podcast地址:https://huggingface.co/spaces/Soul-AILab/SoulX-Podcast-1.7B

05

让 Claude Code 与 NotebookLM 对话

Google 的 NotebookLM 是目前最强的 RAG 工具之一,但它通常被限制在浏览器里。

如果你想通过 AI 控制它,可以瞧瞧这个 notebooklm-skill 开源项目。

图片
开源地址:https://github.com/PleasePrompto/notebooklm-skill

部署这个开源项目非常简单,只需要下面几行命令。

# 1. 创建 skills 文件夹mkdir -p ~/.claude/skills # 2.克隆项目cd ~/.claude/skills git clone https://github.com/PleasePrompto/notebooklm-skill notebooklm # 3. 打开 Claude Code 输入: "What are my skills?"

当你发出指令,就能让 Claude Code 通过浏览器自动化的方式查询你的 Google NotebookLM 的内容。

它实际上是模拟了一个人打开网页、点击 notebook、输入问题、抓取答案的过程。

06

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

没有评论:

发表评论

智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了

"智能体化"已经成为应用进化的必经之路 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 现在,手机都可以帮你自动给智能体"建群"来解决问题了。 比如当你准备跨城出行时,只需要对着手机说出想法,订票软件、攻略社区和打车智能体就能立...