2026年5月30日星期六

Claude Code Skill 最佳实践:把重复工作打包成知识体检工具

本文介绍如何基于一个灵感,使用Claude Code创建自定义Skill——知识体检工具。适合Obsidian用户和AI工具实践者。核心亮点:通过Obsidian CLI快速扫描笔记库,检测幽灵概念、孤岛笔记等四类问题,并引导用户通过对话深入理解而非自动填补。附skill-creator快速搭建骨架方法,帮助你将日常重复工作打包成高效Skill。

Tags:

  见字如面,我是艾康。
点击关注👆防止迷路。







 

本文字数 2632,阅读大约需 5 分钟

前几天,有朋友丢给我一篇文章。

内容是关于 Obsidian 怎么跟 LLM 结合,搭一套自己的内容工厂。

我大致翻了一下,发现里面提到的用法,我大部分都了解过,也实践过。本来准备关掉了。

但有一小段内容,让我停了下来。

是关于「知识库自动补全空白」的一个Idea 💡。

我觉得不错,于是结合 Claude Code 做出了一个 Skill,叫做 knowledge-health-check,知识体检。

跑出来的报告,大概长这样:

img

它扫了我整个 vault,发现我有 9 个被频繁引用、但从未沉淀过的「幽灵概念」

比如 Anthropic 被引用了 9 次,OpenAI 7 次,批判性思维 4 次。

这些都是我嘴上一直在用、平时写笔记一直在 [[]] 链接、但从来没有专门写一篇笔记好好梳理过的笔记。

这篇文章就来聊一聊,如何根据一个 Idea 💡 创建好一个 Skill?

(多说一句,这一段讨论的对话过程,我本来想截图给大家看的。但 Claude Code 的上下文用到一定长度,会自动 compact 压缩一次。导致原始细节就找不回来了,所以文章里面缺少了一些对应会话的截图)

img

好的 Skill 是在实践中生长出来的

首先在那篇文章里,其实分享了好几个 Skill。

Deep Research 风格的知识库自动补全、Obsidian Bases 做内容生命周期管理、文章里推荐的一堆现成 Skill,还有几个零碎的玩法。

三个月前的我,大概率会都试一遍。

现在的我,只挑了一个:知识体检。

为什么?

因为我之前踩过这个坑。

每次在 X 或者 Youtube 看到别人晒酷炫的 Skill,我都会立刻装上试一下,GitHub 上有 marketplace 的,也会去淘。

结果呢?

装了一堆,真正一直稳定在用的并不多。

不是工具不行,是它们解决的问题,根本不是我当下在面对的问题。

因为别人的 SOP 不是我的 SOP

img

真正能跑得起来的 Skill,一定是从自己每天重复劳动的地方长出来的。

是那些你每次干一件事,都得花几分钟解释一遍上下文的地方。是那些你做着做着,发现自己已经做过类似的事,还得回去翻沟通记录的地方。

好的 Skill 是慢慢长出来的,不是直接复制别人的,更不是一次性创建出来的。

所以这一次,我只挑了那个最契合我当下工作流的方向:我每周确实想盘一次自己的知识库,但每次都得手动跑一堆查询。

Skill 的最佳实践

挑定方向之后,我让 Claude Code 先出一套方案。

它的方案我一看,挺完整:

扫描我的原子笔记,找出四类问题:幽灵概念、孤岛笔记、过时笔记、支柱失衡(这类笔记是知识库设计所特有的)。然后针对每一类,自动补全或者修复。

听上去都对。

但我看完之后,第一反应是:不行。

问题出在「自动补」这三个字上。

什么意思?

也就是「检测出空白」是一件事,「填补空白」是另一件事,「加深理解」是完全不同的第三件事。

检测出空白,AI 跑个脚本就能干。

填补空白,AI 用语义搜索 + 生成,也能搞个七七八八。

但加深理解,这是只有我自己才能做的事

img

是我在某个概念面前,停下来想几分钟。是我把它跟我之前的某段经历串起来。是我在试图解释给别人听的时候,发现自己原来根本没想清楚。

这些过程,AI 是替不了我的。

所以这个 Skill 的核心,不能是「自动补」。

它应该是:找到那些值得我深入的点,引导我自己通过对话把它们一点一点想清楚。

所以我把这个判断丢给了 Claude Code,让它把方案重新设计一遍。

每一类问题,都配上一条对话路径:

  • • 幽灵概念:先问我对这个概念的理解,再帮我厘清盲区
  • • 孤岛笔记:先列出潜在邻居,再让我自己决定要连还是要拆
  • • 过时笔记:读一遍原文,问我「你现在还这么想吗」
  • • 支柱平衡:不做判断,只问「这是有意的选择吗」
img

整个 Skill 才算真正有了灵魂。

写到这里,我想说的其实是:

AI 给你的第一版方案,并不一定就是完全符合你的预期的。

它能帮你完成执行,但它不会替你判断「这件事到底值不值得做」、「该用什么方式做」。

这部分,永远只能是你自己。

Obsidian CLI 的价值被低估了

方案定了,开始落地。

如果你之前没怎么用过 Obsidian CLI(Obsidian 官方推出的命令行工具),可能完全意识不到它的价值。

假设你也要做这件事:在自己的 vault 里,找出「被双链 [[]] 引用了 ≥2 次,但实际上根本没有这篇笔记」的所有概念。

你可能会怎么做?

方案一:让 AI 跑语义搜索。

慢、不准、还烧 token。一次扫几百篇笔记得跑好几分钟,最后还经常漏。

方案二:写一段 grep + 正则,去匹配所有的 [[xxx]]

听上去可行。但你很快会发现,链接里的别名([[原链接|显示别名]])、锚点([[笔记#章节]])、subpath,全都得自己写规则去处理。

写到一半,你就放弃了。

这两条路,其实都走不通。

但有了 Obsidian CLI 之后,这件事变成了一行命令。

img

它里面有一个叫 obsidian eval 的功能。

简单说,就是 Obsidian 官方在 CLI 里开了一个口子,让外部工具可以直接调用 Obsidian 内部的 API。

也就是 Obsidian 自己运行的时候,有维护了一个 metadataCache(可以理解成 Obsidian 在内存里给你整个 vault 做的一个索引)。

所有的链接、反向链接、frontmatter、tags,它都知道。

但这些信息以前是关在 Obsidian 里面的,外部工具拿不到。

现在通过 obsidian eval,我可以写一段 JavaScript,直接在 Obsidian 内部跑,拿到任何我想要的信息。

img

747 篇笔记的扫描结果,秒回。

之前我专门写过一篇文章(当 Obsidian 有了命令行,AI 终于能真正操作你的笔记了),介绍过这个工具,感兴趣的可以去看看完整文章。

怎么动手:用 skill-creator 起一个骨架

讲到这里,可能有朋友会问:知道思路了,那具体怎么动手写一个 Skill?

新手最容易卡在最初的几个问题上:目录该怎么组织?SKILL.md 里的元数据该怎么写?触发词怎么定?

Anthropic 官方早就想到了这件事。他们专门出了一个用来「创建 Skill」的 Skill,叫 skill-creator

img

它的作用很单纯:按官方规范,帮你把一个标准的 Skill 骨架快速搭起来。

安装也很简单。

从 Anthropic 官方的 skills 仓库里把 skill-creator 文件夹下载下来,放到 ~/.claude/skills/ 目录就行。

Codex、Gemini CLI 用户类似,放到对应工具的 skills 路径下即可。

或者直接把 Github 地址发给你的 Agent,让它自己安装。

Github 地址:https://github.com/anthropics/skills/tree/main/skill-creator

装好之后不用记任何命令,直接跟 Claude Code 说一句:「帮我根据上面的讨论结果创建一个用来检测知识库健康度的 Skill」。

它会自动调用 skill-creator,跑一个 init_skill.py,生成一份标准的目录结构:

knowledge-health-check/
├── SKILL.md       # Skill 的元信息 + 使用说明
├── scripts/       # 可执行脚本
└── references/    # 参考文档(可选)

剩下的事情,就是把核心逻辑写进 scripts/,再把 SKILL.md 的 description 打磨清楚(这一步很关键,AI 之后能不能正确触发这个 Skill,全看 description 写得准不准)。

最后再跑一次官方提供的 package_skill.py,可以把整个目录打包成 .skill 文件,方便分享给别人,也方便自己跨设备同步。

我做知识体检这个 Skill,Skill 本身的部分都交给 skill-creator 了,几分钟就完成了,真正花时间的,是前面提到的核心设计逻辑那部分。

写在最后

目前这个 Skill 现在已经塞进我每周的复盘流程里了,跑一次大概一分多钟,就能知道目前知识库里需要补充的具体笔记。

但我想说的重点不是这个 Skill 本身。

而是你每天在重复做的那些事情里,一定藏着属于你自己的 Skill。

每次写完文章都要手动检查格式、调整 frontmatter?每次整理周报都要从五六个地方汇总信息?每次跟 AI 对话都要先花三分钟交代一遍背景?

这些重复,就是信号。

所以,如果你也遇到过这样的信号,那可以去试试。

 

图片

以上,就是本文全部内容,如果觉得这篇文章对你有启发,点赞、比心、分享三连就是对我最大的支持,谢谢~

往期推荐阅读
•  Obsidian 从入门到进阶合集

• AI把我推成“知名”博主后,我发现了一条产业链

• 用 Gemini 解锁 YouTube 新用法,信息获取效率提升 10 倍

• 有了 NotebookLM 后,还需要 Obsidian 吗?

• 我试了 NotebookLM 学习法后,彻底抛弃传统学习方式

• NotebookLM 再次升级,来自谷歌的年终礼物

• 我用 NotebookLM 解锁 PPT 的 5 种玩法,实现了 PPT 自由

• AI 时代,你的上下文才是最值钱的资产

• 2026 年如何用好 AI,我发现这些能力更重要

• Openclaw 这么火,可你真的需要它吗?

• 全网都在抄 Karpathy 的知识库,但大多数人只学到了皮毛

• CodexBar × CodeBurn,我找到了追踪 Token 消耗的最佳组合

• 如何用 Claude Code 开启10 倍学习法?

微软开源SkillOpt:AI Agent Skill自动优化工具(附GitHub)

微软开源SkillOpt,通过双模型协同自动优化AI Agent的Skill文件。执行模型按当前Skill完成任务并记录成败,优化模型复盘并小步修改Skill,通过新任务验证效果,失败则回退并记录经验。实测在7个模型6类任务(查资料、做表格、读文档、解数学题等)中全部第一,GPT-5.5平均提升23.5分,表格类任务提升近39分。支持OpenAI、Anthropic、Qwen等API,需自行准备训练与验证数据,提供命令行和WebUI界面。

Tags:

做 AI Agent 的朋友,在遇到 Agent 跑偏的时候,是不是像下面这样:

给 Skill 文件里加一句「别这么做」。但格式错了,又补一句「输出长什么样」。

不断地频繁改动,Skill 文件内容越来越多。但 Agent 并没有变得听话,反而变得更差。

Agent 的表现不靠谱,大家有没有想过,可能并不是模型不够聪明,而是 Skill 写得不够好。

最近微软开源的 SkillOpt,给了我们解决这个痛点一条新的思路。

image-20260529180619408

它的核心是,把我们写的 Skill,本身变成一个能反复训练、自动优化的东西。

为此,它请了两个模型搭班子。一个专心干活,另一个在旁边盯着,琢磨 Skill 该怎么改。

干活那个模型会先按照当前 Skill 做一批任务,哪些做成了、哪些搞砸了,全程记下来。

接着,负责优化的模型来复盘。成功的吸取经验,而失败的则去找规律,看看是不是老在同一个地方出错。

当复盘完成后,就开始动手优化 Skill 文件,加删内容,或者更改其中的描述。

也会有限制,每次只准小改几处。防止步子迈大了,容易把原本好用的规矩也一起修改了。

论文里给出的测试结果是,每次的改动数量控制在 4 处左右,效果是比较好的。

改到最后,真正被留下、起决定作用的核心规矩,往往就那么一两条或者三四条。

bettershot_1780049344140

但改归改,能不能留下来,还得通过测试。

SkillOpt 会安排一批没做过的新任务,用改动后的 Skill 去完成。

结果变好,保留这次改动,如果没变好,则会立刻退回到上一个版本。

当然被反驳回去的改动也是没白费的。系统会把它存进一个「失败记录」的档案里。

在往后的优化里,它就知道哪些方法已经试过、走不通,不会反复地在原地打转。

而且每跑完一整轮,框架还会做一次大复盘,把整份 Skill 重新捋一遍,免得越跑越偏。

bettershot_1780049413593

那优化后的 Skill 实际效果怎么样,论文里给了一份详细的测试得分。

从表格来看,覆盖了日常大部分的场景,从查资料答题、做表格,到读文档、解数学题等。

在这 6 类任务,7 个不同模型上,通过 52 次测试,全部拿到第一或并列第一。

换上优化后的 Skill,GPT-5.5 平均涨了 23.5 分,其中表格类任务的提升接近 39 分。

bettershot_1780049458271

这里我们有必要知道,这些得分的提升,是在没动模型本身的前提下拿到的。

从得分来看,通过 SkillOpt 优化过后的 Skill 的确是有了很大的提升。

至于如何上手使用这个工具,目前没有提供开箱即用安装包,具体执行下面几条命令:

git clone https://github.com/microsoft/SkillOpt.gitcd SkillOptpip install -e .

并且需要配置模型 API,支持 OpenAI、Anthropic、Qwen 等主流模型。

bettershot_1780049295187

安装配置完成后,我们需准备两份带有答案的测试题目,一份用于训练,一份用于验证。

然后执行一条命令启动,我们就只需喝杯咖啡,坐等一份优化后的 Skill 文件输出。

另外工具也提供 WebUI,可以直观看到训练的过程,安装和启动的命令如下:

pip install -e ".[webui]"python -m skillopt_webui.app

想了解更多关于参数的配置,以及使用步骤,可以查看 README 文件里的教程。

写在最后

过去调整优化 Skill,全凭经验让 AI 去改,就算改好了,也说不出个原因来。

而 SkillOpt 把它变成一件能验证、能回退、能自我迭代的事。每次失败,都成了让 Skill 变得更稳的经验。

类似的思路,在我们上个月分享过的 Hermes Agent 工具身上也见过。

它把每次完成重复性复杂的任务,撰写成一份  Skill,后面使用时,还会不断的迭代优化。

两个工具所走的路子虽然不同,但都是想让 Skill 不断地变得更加好用。

以后或许再也不用我们自己,一遍又一遍地去打磨优化 Skill 了。

GitHub 项目地址:https://github.com/microsoft/SkillOpt

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

PDF文档离线翻译V1。1:支持在线API调用,几秒翻译一页并保持排版,支持批量解压即用

PDF文档离线翻译工具V1.1版本,支持本地离线与在线API两种模式,调用在线API后翻译速度提升几十倍,单页仅需几秒。可保持原文档的排版、公式和图表不变,支持批量翻译多份PDF,解压后无需安装即可使用。适合需要快速、高保真翻译技术文档、论文或报告的用户。

Tags:

图片
图片

、下载

进入小程序里有。

、更新记录

V1.1版本:2026-5-29

1、新增API在线支持,在线的效果好,速度提升几十倍。

V1.0版本:2026-5-24

1、基于腾讯混元MT-2模型,支持批量翻译PDF文档,保持排版、图表、公式不变;

2、兼容50系列显卡。



自2016年起,我的公众号已经陪伴大家走过了八个春秋。在这个平台上,我始终坚持分享与互助的精神,免费为大家提供了众多实用的工具。
在最初的两年里,我几乎每天都会发布一篇推文,全年仅在春节暂停一次,这是我对分享知识的执着和承诺。

图片

每当看到你们因为这些工具而提高工作效率,或是解决了棘手的问题,我的内心便充满了无比的喜悦和满足。我深知,这些工具不仅仅是冰冷的程序,它们承载着解决实际问题的力量。
随着AI技术的蓬勃发展,我意识到,掌握AI的使用和开发AI工具将是未来不可或缺的技能。
过去一年,我的公众号主要分享了我原创的AI工具,它们功能多样,许多已经达到了解决问题乃至商业化的水平。
我坚信,不仅要给予大家实用的工具(鱼),更要教会大家如何使用和创造这些工具(渔)。为了持续为大家提供更高质量的工具和服务,我决定建立一个更加稳定和专业的平台。
因此,我创建了一个付费圈子。在这里,我将不仅分享我制作的所有工具,还会提供工具使用方面的答疑服务。
除此之外,我还将开设一系列面向初学者的软件开发课程,帮助大家提升技能,掌握知识。
如下目前圈子的一些内容截图:
图片

图片
我相信,知识的力量是无穷的。通过这些课程,我希望能够“授人以鱼”,更能够“授人以渔”,帮助各位在AI的世界里保持强大的竞争力。

如下识别二维码,立即加入我的付费圈子,

让我们共同成长,定不负各位!

图片

Claude Code Skill 最佳实践:把重复工作打包成知识体检工具

本文介绍如何基于一个灵感,使用Claude Code创建自定义Skill——知识体检工具。适合Obsidian用户和AI工具实践者。核心亮点:通过Obsidian CLI快速扫描笔记库,检测幽灵概念、孤岛笔记等四类问题,并引导用户通过对话深入理解而非自动填补。附skill-cre...