2026年5月31日星期日

开源claude-tap:扒清AI编程助手每次请求Token消耗

claude-tap是开源本地代理工具,可拦截AI编程助手的API请求,完整展示system prompt、对话历史、工具调用和token用量。支持Claude Code、Cursor CLI等9种客户端。适合想分析token成本、调试Agent行为的开发者。所有数据存本地,自动生成离线HTML报告。免费使用。

Tags:

每天用 Claude Code 写代码,一个月下来账单好几百刀。

但你真的知道这些钱都花在哪了吗?

每次请求到底发了多少 token?system prompt 里藏了什么内容?多轮对话的上下文是怎么一步步膨胀的?工具调用又消耗了多少?

这些问题的答案,Agent 工具自己不会告诉你。

最近逛 GitHub 发现一个叫 claude-tap 的项目,帮你偷看 AI Coding Agent 的每一次 API 请求。

图片

用它能了解 Agent 内部工作机制,也能看看你的 Token 都花在哪里了。

01

开源项目简介

claude-tap 是一个本地代理和 Trace 查看器。

说得直白一点,它像一个套在你 AI Agent 外面的中间人,拦截所有 API 流量,然后把每一次请求的细节都记录下来。

图片

system prompt、对话历史、工具定义、流式响应、token 用量,全部可查。

重点是:一行命令就能启动,完全不改你现有的使用习惯。

而且它不挑食。目前支持 9 个主流 AI Coding 客户端:

Claude Code、Codex CLI、Gemini CLI、Kimi CLI、OpenCode、Pi、Hermes Agent、Cursor CLI、Qoder CLI。

图片

市面上叫得上名字的 AI 编程 CLI 基本都覆盖了。

图片

02

它能干什么

看见真实上下文

你发给 AI 的每一句话,AI 看到的 system prompt,工具的参数 schema,流式响应的每一个 chunk:全部都能查看。

是原始的 API 请求和响应,不是 Agent Loop 的那个信息哦

图片

相邻请求 Diff 对比

这个功能很实用。

多轮对话的时候,你可以直接对比两次请求之间到底变了什么,哪些消息被加进去了,哪些被删掉了,system prompt 哪里改了。

字符级的 diff 高亮,一目了然。

图片

Token 用量分析

输入多少 token,输出多少 token,缓存命中多少,缓存创建多少。

按请求拆开给你看,每一笔账都算得清清楚楚。月底看账单的时候你就知道钱到底花在哪了。

实时查看器

加一个 --tap-live 参数,会自动打开浏览器。

Agent 一边跑,你在浏览器里一边看,实时的。每个 API 调用进来,页面就刷新一条记录。

离线归档

每次运行结束,自动生成一个自包含的 HTML 文件。

这个文件可以离线打开,可以发给同事,丢到团队群里让大家一起 review。不需要装任何东西。

数据全在本地

所有 trace 数据都存在你本机。不需要注册账号,不需要连云端 dashboard。认证 header 在记录之前会自动脱敏,不会把你的 API Key 泄露出去。

03

怎么用

安装就一行命令:

uv tool install claude-tap

用 pip 也行:

pip install claude-tap

装完直接用。比如你想观察 Claude Code 的 API 请求:

claude-tap

就这么简单。后面该干嘛干嘛,用完退出的时候会自动生成一个 HTML 查看器。

想边跑边看?加个参数就行:

claude-tap --tap-live

切换到其他客户端也是一行命令的事:

# Codex CLIclaude-tap --tap-client codex# Gemini CLIclaude-tap --tap-client gemini -- -p "hello"# Kimi CLIclaude-tap --tap-client kimiCursor CLIclaude-tap --tap-client cursor -- -p --trust --model auto "hello"

不启动客户端,只开代理也行:

claude-tap --tap-no-launch --tap-port 8080

想看历史 trace:

claude-tap dashboard

上手成本基本为零。装了就能用,用了就能看。

04

原理很简单

图片

claude-tap 的核心思路就两条路:

对于支持自定义 base URL 的工具,比如 Claude Code、Codex CLI,它用反向代理模式:把客户端的请求地址指向本地代理,代理再转发到真实 API。对客户端来说完全透明。

对于不支持改地址的客户端,比如 Gemini CLI、OpenCode、Pi,它用正向代理模式:通过 HTTPS_PROXY 环境变量把流量导到本地,配合自签名的 CA 证书完成 TLS 解密。装好证书之后也是透明的。

所有流量经过代理的时候,会被实时记录成 JSONL 格式的 trace 文件。

实时模式则通过 SSE 把记录推送到浏览器。退出的时候把 trace 打包成自包含 HTML。

就这么简单。没有花里胡哨的东西,就是把流量拦下来、记下来、展示出来。

05

谁适合用

如果你每天都在用 AI Coding Agent 写代码,尤其是 Claude Code 重度用户,这个工具几乎是必装的。

token 烧了多少、花在哪了,心里有数。

如果你在做 prompt 工程,想看完整的 system prompt 和上下文传递链路,用它比自己去翻日志方便一万倍。

如果你在带团队用 AI 写代码,想审计 Agent 的行为、做成本分析、看看 Agent 到底在干什么,这个工具生成的 HTML 文件直接丢群里就行。

如果你自己在做 Agent 相关的开发,想调试 API 调用、排查问题,claude-tap 就相当于 AI Agent 领域的 Wireshark。

开源地址:https://github.com/liaohch3/claude-tap

06

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

企业级OA工作流管理系统开源 Spring Boot+Vue私有化部署

基于Spring Boot 3.5.0和Vue 3构建的企业级OA工作流管理系统,集成GccFlow工作流引擎,提供可视化流程设计、表单设计、任务审批、流程监控等核心功能。系统支持私有化部署,保障数据自主与安全,源码可控便于深度定制和二次开发,帮助企业快速构建符合自身业务需求的审批流程系统。

Tags:

企业级OA管理系统开源,企业级工作流管理系统
源代码

https://www.gitcc.com/kankanyuji/gitvv-oa-flow

功能完善的企业级工作流管理系统,基于 Spring Boot 3.5.0 和 Vue 3 构建,集成了 GccFlow 工作流引擎。系统提供了可视化的流程设计、表单设计、任务审批、流程监控等核心功能,帮助企业快速构建符合自身业务需求的OA审批流程系统

图片

基于Spring Boot和Vue的企业级OA工作流管理系统开源项目。它集成了GccFlow工作流引擎,提供了可视化的流程设计、表单设计、任务审批、流程监控等功能,旨在帮助企业快速构建符合自身业务需求的审批流程系统。

项目技术栈


  • 后端框架:Spring Boot 3.5.0
  • 前端框架:Vue 3
  • 工作流引擎:GccFlow


核心功能


  • 可视化流程设计:支持通过图形化界面设计业务流程。
  • 可视化表单设计:支持通过拖拽等方式设计业务表单。
  • 任务审批:提供完整的任务审批功能。
  • 流程监控:支持对流程实例进行监控和管理。


图片
图片


该项目旨在为企业提供一个功能完善、易于扩展的工作流管理解决方案,帮助开发者快速构建OA审批流程系统

1. 🔒 数据自主与极高的安全性


中大型企业往往涉及大量合同、财务、人事及核心业务机密。自建OA采用私有化部署,所有数据库、文件、日志和审计记录都完全保存在企业自有的服务器或受控环境中。这不仅避免了云端数据泄露或被第三方访问的风险,也更容易满足特定行业(如金融、军工、政企)的数据合规与信创要求。

2. 🛠️ 深度定制与源码可控


SaaS平台通常提供标准化的功能模块,难以满足中大型企业复杂且个性化的业务流程。自建OA拥有源码控制权,企业可以根据自身的组织架构、审批制度和业务规则,对字段、流程、权限、页面进行深度的二次开发和修改。无论是复杂的条件分支、会签,还是特殊的打印套红、编号规则,都能灵活实现。

3. 🔗 强大的系统集成能力,打破信息孤岛


大型组织内部通常已有ERP、CRM、HRM、财务等多套异构系统。自建OA可以作为企业的“数字化中枢”,通过标准接口与企业现有的IT基础设施无缝对接。例如,审批通过后自动更新业务单据状态、自动生成财务凭证、实时同步组织架构与人员信息等,真正实现跨系统的业务闭环和数据互通。

4. 💰 长期成本更优且具备演进主动权


虽然自建OA在初期需要投入服务器资源和专业技术团队进行部署维护,但从长远来看,它无需支付按人头、按年限的持续订阅费用,长期总拥有成本(TCO)往往更低。此外,系统的功能迭代和AI能力接入(如结合企业内部知识库)完全掌握在企业自己手中,不需要被动等待SaaS厂商的产品排期。

5. ⚙️ 支撑复杂业务建模与精细化管理


当企业的业务从简单的“填表审批”走向“业务闭环”时,SaaS平台的轻量配置往往会显得力不从心。自建OA支持专业的BPMN标准工作流引擎(如Flowable等),能够将流程与业务单据深度绑定,实现主表+明细表、复杂权限过滤、跨模块联动等高级需求,从而支撑起中大型企业精细化的内控合规与风险管理

图片


企业级OA管理系统开源,企业级工作流管理系统
源代码

https://www.gitcc.com/kankanyuji/gitvv-oa-flow

功能完善的企业级工作流管理系统,基于 Spring Boot 3.5.0 和 Vue 3 构建,集成了 GccFlow 工作流引擎。系统提供了可视化的流程设计、表单设计、任务审批、流程监控等核心功能,帮助企业快速构建符合自身业务需求的OA审批流程系统


机器人原生世界动作模型问世:时空一体架构,复旦系团队破解落地难题

复旦系科创企业眸深智能推出STI-WM时空一体世界动作模型,首创时空一体化建模与物理一致性约束,解决机器人空间感知差、长时序规划弱等痛点。团队源自复旦深度学习实验室,核心成员来自英特尔、英伟达,已获3亿元Pre-A轮融资,与宇树科技等企业合作,技术覆盖工业、康养等场景。

Tags:

允中 发自 凹非寺
量子位 | 公众号 QbitAI

通用人工智能的战火,已经彻底从虚拟的数字空间,一路烧到了真实的物理世界。

毫无疑问,具身智能、机器人大脑,已经成为当下整个AGI赛道最卷、也最核心的决胜高地。

当前行业主流的VLA视觉语言动作模型、通用世界模型、视频推演方案,普遍存在空间感知精度不足、物理逻辑约束缺失、长时序规划能力薄弱、真机落地鲁棒性差等一系列痛点,无法支撑机器人实现真正的自主感知、自主推理、自主决策与稳定交互。

在物理AI产业快速迭代的关键节点,深耕世界动作模型底层技术五年的复旦系科创企业眸深智能,正式推出STI-WM时空一体世界动作模型(Spatiotemporally Integrated World Model)

作为专为机器人原生打造的通用具身大脑,该模型以时空一体化建模、物理一致性约束、端到端原生融合为核心,彻底打破传统模型的技术桎梏,开辟了物理世界AGI落地的最优技术路径。

复旦+英特尔+英伟达,硬核学术成果稳居全球第一梯队

眸深智能的技术突破,源于长期深耕的学术积淀与全栈工程能力。

公司核心团队源自复旦大学深度学习实验室,构建了学术科研、工程落地、产业商业化三位一体的顶级团队架构:

由复旦大学未来信息创新学院教授、深度学习实验室主任陈涛坐镇科研底层,原英特尔中国首席科学家张益民博士和来自英伟达的技术负责人掌舵工程化落地,95后复旦连续创业者穆泽林主导商业化布局,形成实力强劲的“复旦铁三角”核心阵容。

团队超九成核心研发人员来自复旦大学,汇聚百余名校硕博人才,自2021年行业风口未至之时,便前瞻性布局世界模型、三维感知、时序动作生成三大底层核心技术,持续深耕技术攻坚。

多年来,团队斩获多项全球顶尖赛事冠军与顶级学术荣誉

推出全球首个人形动作生成大模型MotionGPT、三维世界模型HL3DWM;

拿下ICCV2023全球三维目标识别冠军、CVPR2024三维密集语义推理冠军,斩获IJCAI2025杰出论文奖,是近五年国内唯一斩获该奖项的具身智能团队,团队技术负责人斩获2025年中国具身智能新秀EAI榜单20强。

其原创技术成果被英伟达DAIR等国际顶尖实验室引用,学术创新与工程落地能力稳居全球第一梯队。

img

重构行业技术范式:5年沉淀,开创并引领世界动作模型路线

当前行业多数方案仍采用通用世界模型+VLA拼接的改良模式,模态割裂、信息损耗严重,缺乏真实物理世界约束,只能实现“视觉合理”,无法适配机器人真机落地的真实需求。

眸深智能从AGI本质出发,率先确立世界动作模型原生融合路线

机器人与物理世界的一切交互,最终都落地为动作,唯有精准理解时空演化规律、遵守物理逻辑、实现端到端原生映射,才能真正解决机器人泛化性差、落地难的行业顽疾。

早在2022年,团队便创新性提出全球首个影空间语言-动作端到端映射MLD模型,成果发表于CVPR 2023,该核心思路在2025年5月被英伟达DAIR实验室核心工作引用验证。

历经五年迭代,团队已完成7代动作模型技术更新,在多模态端到端融合、高精度动作生成、时序逻辑推演领域积累深厚,动作精度、推理速度、任务泛化性持续领跑行业。

眸深大脑全自主抓取与自主修正

机器人原生架构四维统一,破解真机落地核心痛点

不同于行业依托大语言模型二次改造的适配性方案,STI-WM时空一体世界动作模型是完全面向机器人长时序规划、在线闭环控制、真实物理交互打造的原生具身智能框架,实现空间结构、时间演化、物理一致性、执行鲁棒性四维一体化统一。

模型可兼容RGB图像、深度点云、机器人本体多模态感知输入,将复杂环境信息统一编码为紧凑高效的时空潜在世界状态,上层支撑百秒级长时程任务推演与全局轨迹规划,下层输出精准可控的精细化动作片段。

同时依托实时环境观测动态纠偏、在线重规划,构建出“理解世界—推演未来—规划动作—执行纠错”的完整物理智能闭环。

相较于Dreamer系列偏重环境预测、忽视真机控制的通用世界模型,LWM、PWM等时空割裂的抽象动作模型,以及仅追求视觉逼真、无视物理可行性的视频生成模型,STI‑WM跳出纯视觉推演误区,以三维几何约束、动力学校验、真机闭环执行为核心,彻底解决传统模型信息失真、泛化薄弱、落地困难的核心痛点,让机器人真正做到看懂三维空间、遵守物理规则、自主规划任务、稳定闭环执行

img
眸深STI-WM1.0时空一体世界动作模型架构

六大核心技术壁垒,支撑机器人规模化落地

依托五年全链路自研积淀,STI‑WM构建起行业难以复刻的技术优势:

  1. 时空一体化原生建模:空间结构与时间动态实时耦合,消除多模块拼接的信息损耗,大幅提升推理效率与决策精准度;

  2. 原生三维感知能力:基于点云直接还原真实物理空间,彻底规避2D视觉深度缺失、空间误判的固有缺陷;

  3. 内置物理一致性引擎:融合碰撞检测、动力学约束,从底层杜绝不合理动作与环境崩坏,保障真机执行安全稳定;

  4. 长时程高阶规划:突破传统短片段动作局限,支持百秒级连续复杂任务自主推演,适配真实场景复杂作业需求;

  5. 端侧轻量化部署:自研模型压缩、量化蒸馏技术,实现百亿级大模型低成本落地机器人端侧芯片,大幅降低产业化算力门槛;

  6. 小样本强泛化能力:依托虚拟世界大规模预训练+少量真机微调,高效适配陌生场景与长尾任务,大幅降低数据依赖。

img
眸深“一脑多形”跨本体通用大脑

资本与商业双爆发,产业化进程突飞猛进

凭借底层架构原创创新、全栈自研技术壁垒、可落地的商业化能力,眸深智能迎来高速发展期,半年内完成5轮融资,3亿元Pre-A轮融资获5倍超额认购,获得国家级投资平台、头部产业资本、券商机构的高度认可。

商业化落地同步驶入快车道,公司已与宇树科技、禾川科技、颐家养老等行业头部企业达成深度合作,技术落地覆盖工业制造、居家康养、商业服务等多元真实场景。

目前,眸深智能已与近十家上市公司达成战略合作,其中包含五家以上千亿级产业龙头,未来三年预计可锁定10亿元订单支撑,技术产业化速度远超行业平均水平。

img
眸深智能与居家养老头部企业颐家战略合作

当下,AGI竞争正式进入物理智能新时代,以世界动作模型为核心的原生具身大脑,已然成为通用机器人的核心底座。

未来,眸深智能将持续迭代STI‑WM模型体系,全面赋能人形机器人、四足机器人、工业机械臂、服务机器人等全品类硬件,加速通用具身智能的规模化落地,推动中国原生物理AI技术领跑全球,开启物理世界AGI全新纪元。

*本文系量子位获授权刊载,观点仅为原作者所有。


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见

首发免费AI视频生成器 自动分镜配音30秒高清 支持Seedance2。0

介绍easyvid工具,提供导演模式15秒和剧情模式30秒,支持自动分镜配音及对口型,可制作AI短剧广告解说视频。注册送350积分,偶有额外积分奖励。导出视频带水印,可配合第三方工具每日两次免费去除。配音仅限英文发音但可输入中文。 Tags: AI视频生成 自动分镜配音 ...