2025年2月24日星期一

Claude3。7 发布, Cursor 要完蛋?


Claude 放了深水炸弹,发布全新 Claude3.7 版本。
首先是一个深度思考的功能:
其实我也没懂一直吹是首个混合推理模型,Claude3.7 还是把普通和推理放在了【normal】和【Extended】里面,这和其他 llm 有什么不同?
不过牛也是确实牛,速度快了,准确度高,同时 API 可以设定多少个思考的 token。
这里我用 AK大神的方法简单测试下模型能力:

这里有个彩蛋哈哈哈哈:
strawberry 这个单词里有几个 'r'?9.11 和 9.9 哪个数值更大?
可能问的人太多了,Claude 直接给你整活,直接写代码在预览框给彩蛋:


生成一个 SVG 图片,画一只骑自行车的鹈鹕,顺序是Grok 3、o1、ds、Claud3.7,Grok 3 还是挺强的:

棋盘游戏:

笑话和脱口秀:

第二个点,
代码能力继续保持在T0 级别,(其实没法 3.7 的时候 3.5 还是所有热门 IDE 的首选)
重点是和 3.7模型一起发布的还有 Claude Code,
它是一个代理编码的命令行工具,,但是要了解下它的能力,很强。

它能够搜索和读取代码、编辑文件、编写和运行测试、提交和推送至 GitHub 以及使用命令行工具,采用直接 API 连接,可以直接在项目目录中使用 Claude Code,与现有的 CLI 工具无缝集成。


这难道是要回收所有Cursor类似物的市场吗??但好像目前还没有代码补全能力,但也足够暴露 Claude 的野心。
目前内测,但我觉得不是程序员可以先不管,用好 Cursor 或者 Windsurf 就行。
Claude3.7 的复制能力很强,几乎像素级别复制原图,想想以后 copycode 用它的API 之后会有多强:顺序原图、claude3.7、grok 3、 o1



但是比较遗憾的是,
我等了那么久,还是等不到Claude 3.7的实时联网功能,它其知识库的截止日期为2024年10月。
还有一个坑的点,我测试下来 3.7的Extend think 功能好像不能思考很久,有时候思考之后 token 就不够输出了。

这次的更新我明显感觉到Claude布局明显的有意从学术竞赛型问题转向真实商业场景,更关注企业实际应用需求,比如更强安全性和注重实际需求性。


别以为学个 DeepSeek 就能不学了,Grok 3、claude 3.7,2025年开年就这么猛,整个 AI 的进步速度比我们想象的还要快得多。


好好期待。


没有评论:

发表评论

NeurIPS 2025! 一个LoRA实现秒级万能图像编辑?浙大哈佛图像编辑模型GitHub狂揽2k星!

点击下方 卡片 ,关注" AI生成未来 " 如您有工作需要分享,欢迎联系: aigc_to_future 作者:Zechuan Zhang等 解读:AI生成未来 在五一假期期间,Hugging Face上出现了一款爆火的图像编辑模型,号称用一个LoRA就可...