本文介绍四个GitHub开源项目,帮助AI Agent实现浏览器自动化、绕过付费API等。Web Access让Claude Code复用现有浏览器登录态;Lightpanda轻量无头浏览器性能提升11倍;OpenClaw Zero Token免费调用12家AI平台,但存在合规与安全风险;bb-browser将浏览器作为API接口。适合开发者与AI爱好者使用。
Tags:
最近用 Claude Code 的朋友应该会发现让它上网查东西就经常翻车。
要么死磕搜索工具不去看网页,要么遇到需要登录的网站直接罢工。
有个开发者,6 天前开源了一个叫 Web Access 的 Skill,现在已经快 1000 Star 了。
它做的事情很直接:给 Claude Code 装上完整的浏览器能力。
Web Access 的几个设计挺有意思。
它通过 CDP 协议直连你日常使用的 Chrome 浏览器,你在各个网站上已经登录的账号,AI 可以直接用,不需要重新走登录流程。
它还设计了一套浏览哲学,让 AI 像人一样思考上网过程:
先明确要做什么,再选最合适的方式,过程中不断校验方向对不对,最后判断是不是做完了。
另外它支持子 Agent 并行分治,比如你让它同时调研 5 个产品的官网,它会开多个子 Agent 并行处理,每个都独立开 tab,效率比串行高不少。
安装也很简单,一句命令就搞定。
装完之后你就可以直接跟 Claude Code 说帮我搜索 xxx 或者去小红书看看,它会自动判断用什么方式去执行。
开源地址:https://github.com/eze-is/web-access如果说 AI Agent 是下一代应用的主流形态,那浏览器就是 Agent 接触真实世界最重要的入口。
问题是 Chrome 实在太重了。
Lightpanda 是一个完全从零构建的开源无头浏览器,用 Zig 语言写的,现在已经 24000 多 Star。
注意,它不是 Chromium 的分支,也不是 WebKit 的补丁,而是从空白页开始写的全新浏览器,专门给机器用的。
性能数据很夸张。
100 个并行页面抓取,Chrome 需要 25.2 秒,Lightpanda 只需要 2.3 秒,快了 11 倍。
内存差距更大,100 个并行任务 Chrome 要 4.2GB,Lightpanda 只要 696MB。原因很简单,它从架构层面就砍掉了所有图形渲染的代码。
给机器用的浏览器本来就不需要画画。
它内置了 V8 引擎,兼容 Chrome DevTools Protocol,所以你用 Playwright 或 Puppeteer 写的代码一行都不用改就能跑。
更关键的是它原生内置了 MCP Server,AI Agent 可以直接通过 MCP 协议控制浏览器,不用额外搭桥。
目前还在 Beta 阶段,Web API 覆盖还在持续完善中,但页面抓取和简单自动化已经可以投入使用了。
开源地址:https://github.com/lightpanda-io/browser用 AI 的成本一直是个痛点。
ChatGPT、Claude、Gemini、DeepSeek,哪个不花钱?
OpenClaw Zero Token 是基于 OpenClaw 的一个分支版本,一个月不到就拿了 2800 多 Star。
它通过浏览器自动化技术,模拟你在网页端的登录状态,直接调用各平台的 Web 接口,完全绕过了付费 API 机制。
目前支持 ChatGPT、Claude、Gemini 等 12 个 AI 平台。
最有意思的是 AskOnce 功能,一次提问同时发给多个模型,然后你可以对比各家回复,选最好的那个用。
项目还提供了一个 OpenAI 兼容的 Gateway API,所以你可以把它接到 ChatGPT-Next-Web、LobeChat 这些第三方客户端上,体验和正常调 API 基本没区别。
不过得提醒一下,这个方案本质上是绕过平台付费机制,合规性存疑,使用前需要自己评估风险。
另外有安全研究者披露了上游 OpenClaw 存在 8 个 CVE 漏洞,最严重的评分 8.8,部署的话一定要注意安全。
开源地址:https://github.com/linuxhsj/openclaw-zero-token写爬虫最烦的就是反爬检测和登录态问题。
有个开发者换了个思路:既然绕不过去,那就直接用你自己的浏览器。
bb-browser 的核心理念就一句话:你的浏览器就是 API。
它通过 Chrome 扩展加 CLI 加 MCP Server 的组合,让你已登录的真实浏览器直接变成 AI Agent 的操作接口。
它预置了 36 个平台、103 个社区命令,涵盖搜索、社交媒体、新闻、视频、金融等各个领域。
比如你想让 AI 去知乎看热榜、去 B 站搜视频、去 GitHub 看项目,都有现成的适配器。
更厉害的是它的 Site Adapter 系统,每个命令就是一个 JS 文件,你常用的网站不在列表里的话,自己写一个适配器也就几分钟的事。
三种接入方式都支持:独立 CLI、MCP Server 接入 Claude Code 或 Cursor、以及通过 OpenClaw 无扩展模式直接运行。
如果你觉得给 Agent 接入互联网太麻烦,bb-browser 的开箱即用体验可能会让你眼前一亮。
开源地址:https://github.com/epiral/bb-browser05
点击下方卡片,关注逛逛 GitHub
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:
没有评论:
发表评论