2025年12月14日星期日

搜罗了 4 个超炫酷的 AI 开源项目,速速收藏。

01

Claude Code 的开源外挂

图片

开源项目 agents 是一个专门为 Claude Code 设计的智能自动化和多智能体编排系统。

使用这个开源项目, CC 不再是独自面对一个 AI 助手,而是可以根据需要,随时聘请不同的专家团队。

比如 63 个插件、85 个智能体、47 个 Skills 啥的:

图片
图片

而且开发者也考虑到了 Token 消耗,这个项目的核心优势就是极致的 Token 效率和混合模型编排策略。

上下文加载方式不臃肿,只需要安装所需的插件,利用渐进式披露技术在任务需要时才加载相关技能知识。

而且系统智能地分配任务,让擅长推理的 Claude 3.5 Sonnet 负责规划与架构,让速度更快的 Haiku 模型负责具体执行,从而在保证高质量输出的同时降低成本并提升响应速度。

开源地址:https://github.com/wshobson/agents

02

微软开源播客神器

VibeVoice 是微软开源的一款前沿语音 AI 框架,专门用来生成富有表现力、超长时长、多说话人对话音频的框架。

图片

VibeVoice 最炸裂的功能是支持 90 分钟超长生成 & 4 人群聊。

支持长达 90 分钟的对话生成,而且,它能让 4 个不同的说话人在同一个音频里聊天,非常适合用来制作 AI 播客、广播剧或者长篇有声读物。

除了录播,直播也能行,最新发布的 VibeVoice-Realtime-0.5B 模型,专为低延迟设计。

它能做到 ~300 毫秒 的首字响应速度,支持流式文本输入。你可以用它来搭建几乎无延迟的 AI 语音助手,体验丝滑的实时对话。

开源地址:https://github.com/microsoft/VibeVoice

03

AI 浏览器自动化冲浪助手

图片

VibeSurf 是一个 AI Agent 驱动的智能浏览器助手,专为 Vibe Surfing(沉浸式冲浪)而生。

你只需要告诉它你的目标,它就能通过 AI 智能规划任务,自动执行深度搜索、内容爬取、总结归纳等操作。

项目采用 Chrome DevTools Protocol  替代 Playwright,显著提升了抗检测能力。而且支持在不同标签页中同时运行多个 AI Agent 进行并行处理,大幅提高效率。

此外,VibeSurf 坚持隐私优先,支持 Ollama 等本地大模型及自定义 LLM API,确保用户浏览数据的安全。 

在生态与扩展性方面,VibeSurf 计划集成包括 Gmail、Notion 在内的数百种第三方工具,并支持针对小红书、抖音等平台 API 操作。

其路线图还包含了拖拽式工作流创建、浏览器内代码执行代理以及具备记忆功能的个性化伴侣系统,旨在成为全能的 AI 浏览器伴侣。

开源地址:https://github.com/vibesurf-ai/VibeSurf

04

浏览器控制和爬虫合二为一

DrissionPage 是一个基于 Python 的网页自动化工具。它的名字其实就暴露了野心:Drission = Driver + Session

简单来说,它创造性地将浏览器自动化(Driver 模式)和数据包发送(Session 模式)合二为一。

图片

你可以在同一个脚本中,先用浏览器模式登录复杂的网站,拿到 Cookies 后瞬间切换到发包模式抓取数据。

或者在发包模式搞不定时,一键切换回浏览器模式继续操作。它不仅是为了替代 Selenium,更是为了解决自动化与高效率难以兼得的痛点

开源地址:https://github.com/g1879/DrissionPage

05

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

没有评论:

发表评论

建议收藏!全网最强 AI 资源包:GPT-5。2、Claude 4。5、科研绘图神器,通通国内直连!

🚀 建议收藏!全网最强 AI 资源包:GPT-5.2、Claude 4.5、科研绘图神器,通通国内直连! 🚀 建议收藏!全网最强 AI 资源包:GPT-5.2、Claude 4.5、科研绘图神器,通通国内直连! 在这个 AI 迭代以"小时"计的时代,掌...