2025年2月26日星期三

突破AI编程天花板,性能超越满血版DeepSeek-R1,Claude再次登顶AI热门榜

  点击下方,关注后台回复【666】,免费领取【DeepSeek学习礼包】     



大家好,我是凡人。
就在昨天凌晨Anthropic 宣布推出其"迄今为止最智能的模型" Claude 3.7 Sonnet,这也是全球首个混合推理模型
据官方介绍,Claude 3.7 Sonnet 不仅可以给出近乎即时的回答,还可以生成可扩展的、逐步思考的结果,甚至用户还能通过 API 精确控制模型的思考时间
Anthropic团队的理念太硬核了:"人类用同一个大脑既能快速反应又能深度思考,AI也该这样!"他们直接把推理能力内置进模型,而不是像其他家那样搞个单独的模型出来!但这波操作似乎有点似曾相识啊!
最让人震惊的是它的编码能力!Anthropic官方放话:"这是我们迄今为止最强的编码模型!"不是吹的!在SWE-bench Verified测试中,它不仅吊打了自家的Claude 3.5 Sonnet,还明显超越了OpenAI的o1和DeepSeek R1!
「扩展思考」模式下的Claude 3.7 Sonnet在各种基准测试中几乎全面领先,甚至能与用20万张GPU训练的Grok 3掰手腕不相上下!看来Anthropic说的"迄今为止最智能的模型",确实名副其实!
最牛逼的是,Anthropic还顺手推出了Claude Code——一个真正的"代码搬运工"!它能搜索代码、编辑文件、写测试、提交代码、推送到GitHub,甚至直接操作命令行!虽然目前还是限量测试版,但Anthropic内部已经离不开它了!有测试显示,它能一口气完成平时需要45分钟以上的工作
在我测试它的编程能力后,真的很想说,程序员朋友们,你们的"饭碗"还好吗?  

游戏:3D弹力球 

提示词:帮我写一个3D的弹力球游戏。

游戏:2D坦克大战游戏

提示词:帮我写一个2D的坦克大战游戏,要在地图上和敌方坦克战斗。

游戏:对战游戏

提示词:帮我写一个复古的火柴人的对战游戏,用户的对手是电脑,火柴人可以使用多种武器,需要对火柴人的细节一些,画面也要细腻一些。

卡片:赛博朋克天气

提示词:帮我写一个赛博朋克风格的天气日历。

最后

几轮测试下来,我真的被惊呆了,不仅仅是他写代码的速度,而是它的效率和理解力,聪明的害怕,最近还有消息DeepSeek-R2马上就要发布了,你们觉得R2能否打败Claude 3.7 Sonnet吗?评论区一起讨论下!

福利时间


怎么样今天的内容还满意吗?再次感谢观众老爷的观看。为了答谢各位朋友的捧场,特别和AI头部学习社区AI破局俱乐部申请了DeepSeek公开课的听课有限的名额,朋友们可以直接进群完全免费听课。

连续15天的直播课程,让你彻彻底底地学会DeepSeek,用好DeepSeek。


现在加入还送《Deepseek 15天指导手册--从入门到精通》,别忧郁了赶紧加入吧!

如果有任何问题的朋友可以直接加微信,我为您精心准备了价值 399 的 DeepSeek学习大礼包 和 学习群 为你开启AI的学习之旅。

扫码

链接我领礼包


「 往期DeepSeek精选文章 」

看到中年男人和DeepSeek的对话,直接就给我整沉默了

DeepSeek不会用就等于浪费啊!1分钟掌握8个赛道40条喂饭级指令

告别野路子,两款大厂出品的免费AI编程助手已接入满血版DeepSeek-R1!

7天实测7个免费入口,全部是DeepSeek-r1完全体

一键将GitHup Top100 的超级项目,转换爆款口播文案,deepseek + cursor + 飞书到底有多强!

你微信没有DeepSeek?别急它在这里。。。

终于来了,微信接入DeepSeek-R1

1分钟教你击败你身边99%的同事,Word和WPS丝滑接入满血版DeepSeek

90%人还不会的DeepSeek超实用组合(附极简版新手教程)

1分钟告诉你,全网疯传清华大学 104页的DeepSeek教程到底有多牛

秒杀90%大厂程序员,IDEA+DeepSeek打造你的最熟悉AI编程工具

弃了Cursor吧!VScode + DeepSeek搭建本地最强免费AI编程助手

没有评论:

发表评论

让OpenAI只领先5天,百川发布推理新模型,掀翻医疗垂域开源天花板

超越一众闭源模型,单卡4090可部署 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,全球最强开源医疗模型发布,来自中国。 百川开源最新医疗推理大模型 Baichuan-M2-32B ,在OpenAI发布的Healthbench评测集上,超越其刚刚发布5天的开源模...