2026年6月5日星期五

Anthropic被指双标:高喊暂停AI开发 却帮NSA搞网络攻击

Anthropic近日发文呼吁全球暂停AI开发,理由是AI已能自主进化。但《金融时报》6月4日报道,该公司正协助NSA部署Mythos模型用于进攻性网络行动,针对中国或伊朗等国。一边主张减速,一边将最强模型用于军事攻击,本文揭露这一矛盾操作及背后细节。

Tags:

Anthropic 发布呼吁暂停 AI 开发的文章,给我看得满头问号。

文章比较长,很多干货,最后的结论却让我有点让措手不及:

不少内部工程师认为,Claude 写的代码质量已经跟人类打平,预计一年内,会比人类写得更好....

因此,Anthropic 决定暂缓 AI 开发,并呼吁大家一同减速。

图片

不知道大家看到这里什么感觉,我反正是懵了。

图片

文章还在持续发酵中,马上 Anthropic 被爆出来了另一件事。

《金融时报》6 月 4 日报道,Anthropic 正在协助 NSA 部署 Mythos,用于进攻性网络行动

两名知情人士称,公司约有 6 名工程师进驻 NSA,负责指导使用并按具体用途定制模型。其中一人表示,Mythos 对中国或伊朗等国的网络非常有用。

图片

一边喊着给 AI 踩刹车,一边亲手帮情报机构把油门焊死,这操作,我怎么有点看不懂了。

一、都别开发AI了

Anthropic 发布的文章,围绕着一件事展开:AI 可以自主进化了

这件事,学名叫递归自我改进(recursive self-improvement),意思是 AI 自己设计系统、自己训练出更强的下一代,整个过程不再需要人插手。

Anthropic 说,虽然现在还没走到那一步,但趋势已经很明显,而且来得可能比大多数人预想的快。

图片

截至今年 5 月,合并进 Anthropic 自家代码库的代码,超过 80% 是 Claude 写的。而在 2025 年 2 月 Claude Code 上线之前,这个数字还是个位数。短短一年多,AI 从打杂的,变成了主力军。

2026 年第二季度,一个普通工程师每天产出的代码量,是 2024 年的 8 倍。

2025 年底, Claude 写的代码质量还比人类工程师差一点,现在能大致与人类齐平,预计一年内会比人写得更好。

图片

接着,Anthropic 展示了一条叫「任务时长」的曲线。

通过 METR 的测量,Anthropic 发现 AI 能独立干完比以前更长的任务,而且速度还提升了。

图片

2024 年 3 月,模型还只能干 4 分钟量级的软件任务,今年已经能干 12 小时的活。

干活速度从原来每 7 个月翻一倍,到现在每 4 个月翻一倍。

目前,AI 的执行力已经超神。

图片

Anthropic 每出一个新模型,都会跑同一个测试,丢给它一段训练小模型的代码,让它在保证结果正确的前提下,把运行速度优化到最快。

2025 年 5 月,Opus 4 平均能提速 3 倍,到 2026 年 4 月,Mythos 干到了 52 倍。而一个熟练的人类研究员,花 4 到 8 小时也就摸到 4 倍。

但 AI 始终学不会自己定研究方向,这件事上它还比较稚嫩,这是现今人类唯一的壁垒。

图片

Anthropic 在文章中十分担忧,因为这一关一旦被攻破,递归自我改进就真的成立了。

文章最后,Anthropic 提出了三种可能的未来。

图片

第一种,AI 自己跑不动了。

也许「研究判断力」这道坎,压根不是靠堆算力、堆数据能迈过去的,得等一次全新的架构革命。又或者,卡住它的根本不是智商,是电、是芯片、是算力背后那条物理供应链。

但 Anthropic 自己也说,哪怕能力就冻结在今天,世界照样会被搅个天翻地覆。

图片

第二种,AI 接着狂飙,但方向盘还攥在人手里。

Anthropic 认为第二种,是我们正走进那个未来。

组织效率大概率会指数级炸开,一家一百人的公司,能干出一万人、甚至十万人的活。

听着很爽,但他们也发现一件耐人寻味的事。就算 Claude 把写代码这一环提速到飞起,但该来的生产力解放还是不会很快来。

图片

这个道理叫阿姆达尔定律,你把一个环节修得再快,整条流水线的速度,还是被最慢的那一环。因为和人类磨合还需要时间。

第三种,也是最让人头皮发麻的一种,AI 真的开始自己造自己了。

人类彻底退到一边,只剩下监督、验证、盖章的活。往好了说,这种能力会外溢到别的领域,医学、材料、能源,可能集体起飞。往坏了说,机器一代代自我迭代,那点最初看不见的错误,被一轮轮放大、累积,直到某一天,谁也拉不住 AI 了。

图片

为此,Anthropic 主张,前沿实验室之间应建立一套可验证的协同减速机制,唯有大家都真正停下,才能应对AI 发展带来的巨大影响。

二、驰名双标

虽然呼吁很动人,差点就把我说服了,但 Anthropic 的驰名双标,还是瞬间把我拉回了现实。

回到最近 Anthropic 协助 NSA 部署 Mythos 的爆料,会发现 Anthropic 的迷惑操作,并不是突如其来的

Mythos 是 Anthropic 今年四月刚研发的新模型,主要用途是网络安全。

图片

刚上线一个月,它就在全球 50 家顶尖机构的系统里翻出了上万个高危漏洞,这 50 家机构包括:亚马逊(AWS)、苹果、谷歌、微软、英伟达。

据官方博客的说法,Mythos 的能力强到 Anthropic 自己都有点发怵。

为了模型不被滥用,Anthropic 曾放话说「不会轻易将它公开」,只肯给少数机构使用。

图片

结果不到一个月,就变脸了。Anthropic 在 5 月底发布了一篇官方博客,一边透露 Mythos 要往「通用开放」的方向走,一边把试点从约 50 家机构,一口气扩到了 15 个国家、150 家。

耐人寻味的是,它自己在同一篇博客里也承认,防止这种能力被滥用的安全措施,它和所有同行都还没做出来。

而这些拿到 Mythos 的机构,公开点名的只有十来家。剩下约 40 家一直没披露。

早在 4 月,Axiox 就已报道过,NSA 也在这份未公开的名单之列。

图片

但 NSA 究竟如何使用 Mythos,当时并不清楚。直到最近《金融时报》公开爆料,才明确提出是用于进攻性网络行动

前脚呼吁世界和平,后脚就把自己最猛的模型送进五角大楼的办公室,Anthropic,我还能再相信你吗?

图片

其实今年三月,Anthropic 还在跟美国国防部打官司。军方想要 Claude 的「一切合法用途」授权,Anthropic 偏不给,死守自己的红线。

军方被惹毛了,直接给 Anthropic 扣了顶叫「供应链风险」帽子。这个罪名以前只往跟外国敌对势力有关联的公司头上扣,Anthropic 是头一个被这么对待的美国公司。

图片

这件事闹得有多大呢?甚至特朗普亲自下令,所有联邦机构停用 Claude。

Anthropic 反手一纸诉状告了国防部,说这是非法报复。三月底,法官还真站到了它那边,不仅冻结该「供应链风险」认定,判决书还里用了「奥威尔式」这种相当重的词。

图片

结果没几个月,Anthropic 号称最猛的那个模型,就出现在国防部下属的 NSA 手里。

封杀 Anthropic 的是国防部,用 Mythos 的也是国防部。

再回头看 Anthropic 发布的文章,怎么看都有点拧巴。

不过,个人以为,这两件事同时发生,未必就是「打脸」。

图片

呼吁归呼吁,生意归生意,一家即将上市的公司,本来就要在理想和现实之间找平衡,这没什么好苛责的。

也许恰恰因为它最懂这技术有多猛,才比谁都更清楚,当这种能力终归要摆上台面时,问题往往不再是「该不该造」,而是「先落到谁手里」。

从这个角度看,它的「呼吁」和它的「部署」,说不定本就是同一套思路的两面。

哪种解释更接近真相,我没有答案。

更有可能的是,它就是清醒地走在一条自己都未必看得清的路上,一边真心担忧着失控,一边又不愿意在这场竞赛里掉队。这两种心情,未必非得二选一,很可能在它身上,是同时存在的。

当然,这一切也可能不过是一种“口嫌体正”的营销手段。

技术狂奔的年代里,这样的拧巴,恐怕也不只属于 Anthropic 一家。

图片·················END·················

AI生成网页没品味?Taste Skill反模板化前端框架效果实测

Taste Skill是GitHub上3万Star的开源项目,专门解决AI生成前端页面千篇一律的问题。通过Brief Inference、三个刻度盘和反模板禁令,让Cursor等工具生成的界面告别模板味。免费安装使用,适合追求独特设计的AI Coding开发者。

Tags:

最近 GitHub Trending 上有个项目挺火的,叫 Taste Skill,专门给 AI 生成有品味的前端页面。
图片

确实,用 Cursor、Claude Code 这些工具做前端页面,做出来的东西千篇一律,一眼就能看出来是 AI 生成的。

因为 LLM 是概率机器,它没有审美偏好,只会复制训练数据里最常见的模式。

之前换过不少 Skill,比如 Frontend Design、各种设计类 Skill,效果都不太理想。

今天就来试一试 Taste Skill,看看啥情况。

01

源项目简介

Taste Skill 是一个专门给 AI Coding Agent 用的反模板化前端框架。

它干的事情很简单:让 AI 生成的界面不再千篇一律,告别模板味。

项目的口号就一句话:gives your AI good taste,给你的 AI 好品味。

图片

目前在 GitHub 上已经拿了 3 万多 Star,最近冲上了 GitHub Trending。

作者是 Leon Lin,平时活跃在 X 上,同时还在做一个 prompt 管理的桌面工具。

支持的 AI Coding 工具覆盖了三大主流:Cursor、Claude Code、Codex。

基本上你现在在用的 AI Coding 工具,它都能配合。

图片
开源地址:https://github.com/leonxlnx/taste-skill

图片

图片

02

我之前的痛点

用 AI Coding 做前端页面的人应该都有感触:做出来的东西,风格基本都是一个模子刻出来的。

居中大标题、渐变背景、圆角卡片三件套,AI 每次都给你整这几样。

em-dash 破折号到处乱飞,假的截图用 div 硬拼,底部有莫名其妙的装饰文字。

我之前试过好几个设计类 Skill,问题差不多:规则写得太宽泛,AI 还是按默认套路来。

或者只管某一个方面,比如只管配色,整体布局还是模板感很强。有些 Skill 的规则 AI 直接就跳过了,等于白装。

比如我让 AI 不用任何 Skill,生成一个网站,这个网站作为我开源项目 Lumi 的官网。

它大概是这样的,没任何 skill ,效果很平。

如果我让 AI 使用 taste skill,再来一遍,看看情况。

确实还不错,比 AI 直出的效果好一些。

还有很多动画设计挺不错的。

Taste Skill 解决问题的思路和其他 Skill 不太一样,它是从底层逻辑上改变 AI 输出前端的方式。

① Brief Inference

这是 Taste Skill 最核心的机制。

其他 Skill 大多是直接给一套规则让 AI 照着做。Taste Skill 不一样,它让 AI 在动手写代码之前,先读懂你的需求。

具体来说,AI 会先分析这几个信号:

页面类型,你给的参考链接或截图、目标受众、已有的品牌资产。

分析完之后,AI 会推断出一条设计方向,然后才动手。

相当于让 AI 先理解你的意图,再决定用什么风格,而不是上来就套默认模板。

② 三个刻度盘

Taste Skill 提供了三个 1-10 的可调参数:

包括布局灵活性、动画深度、信息密度。你可以自己调整刻度。

③ Anti-Slop 硬性禁令

Taste Skill 把 AI 最常见的偷懒套路给限制住了:

比如整个页面不允许出现一个破折号、禁止用 div 硬拼假的截图、假的仪表盘。

还有很多,都是 AI 偷懒的一些特征,都进行了限制。

④ 交付前检查清单

AI 写完之后,还要过一遍强制检查清单,每个条目必须通过才能输出。

相当于质检环节,确保 AI 没有偷懒跳过规则。

03

安装和使用

安装很简单,一行命令搞定:

npx skills add https://github.com/Leonxlnx/taste-skill

如果只想装某一个 Skill:

npx skills add https://github.com/Leonxlnx/taste-skill --skill "design-taste-frontend"
因为这个项目包括很多 skill,比如:
图片

04

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

Anthropic被指双标:高喊暂停AI开发 却帮NSA搞网络攻击

Anthropic近日发文呼吁全球暂停AI开发,理由是AI已能自主进化。但《金融时报》6月4日报道,该公司正协助NSA部署Mythos模型用于进攻性网络行动,针对中国或伊朗等国。一边主张减速,一边将最强模型用于军事攻击,本文揭露这一矛盾操作及背后细节。 Tags: Anthro...