2025年2月20日星期四

Grok 3 这样也能破圈?

马斯克旗下 xAI 的 Grok 3 横空出世,不仅在 Chatbot Arena 霸榜第一,还成为首个突破 1400 分的 AI

更让人惊掉下巴的是,马斯克大手一挥:Grok 3 免费!用到服务器崩溃为止! 🤯

然而,在中国互联网,Grok 3 的发布却遭遇了冷遇。不少评论认为,尽管 Grok 3 砸了 20 万张 H100 GPU 训练,但它的投入成本远高于 DeepSeek,而真正的性价比之王,还是 DeepSeek。

甚至有网友犀利评价:Grok 3?环境污染 + 资源浪费。

问题来了:Grok 3 到底有多强?力大飞砖真的是通向AGI的道路吗?它能挑战 OpenAI 和 DeepSeek 吗?免费背后又藏着什么玄机?

今天,我们就来深度解析这场 AI 风暴!

一、Grok 3 究竟是什么?它到底强在哪?

Grok 3 是 xAI 研发的最新 AI 大模型,号称在 数学、科学、编程等任务上全面超越 GPT-4o、DeepSeek V3 和 Gemini 2

从官方数据来看,Grok 3 确实在很多 AI 测评榜单上处于第一梯队

数学推理:超越 GPT-4o,复杂计算能力更强。
编程能力:代码生成能力突出,甚至能写出完整的游戏代码。
DeepSearch 搜索能力:不像普通 AI 只是简单返回答案,而是能「思考」推理链,类似 OpenAI 的 Deep Research。

但光看数据不够,我们来实测一下:

常识轻松拿捏——「9.11 和 9.9 哪个大?」

老生常谈的数r问题——「strawberry里面有几个r?」

但是也有网友反馈他拉胯的时候。

💀 科学知识不稳定——「比萨斜塔两个球谁先落地?」它答错了,伽利略表示很无奈。 这让网友们调侃:「天才 AI,不屑回答简单问题!」😂

不过,Grok 3 的中文写作能力爆棚,甚至被网友称为「中文写作天才」。

一位网友让 Grok 3 写了一篇《我的故乡回忆》,结果文笔细腻、情感真挚,完全不像是 AI 生成的。

有网友让 DeepSeek 也写了一篇《我的高中生活》,虽然细节丰富,但整体情感深度不如 Grok 3,反而像是流水账。

而 OpenAI 的 o1-pro,就像是背了一堆满分作文、堆砌好词好句的「应试 AI」,虽然语言优美,但缺少灵魂。

这说明,Grok 3 不仅是个理科 AI,还是个文科高手!📖

二、Grok 3 是怎么炼成的?靠的是疯狂烧钱!深思:值得吗?


如果说 DeepSeek 走的是高效算法路线,那 Grok 3 走的就是猛冲猛打、暴力堆算力的道路。

🔹 训练用了 20 万张 H100 GPU,是 DeepSeek V3 的 263 倍
🔹 总训练时长 2 亿小时,成本高到离谱。
🔹 马斯克还宣布:我们又买了 10 万张 H100!

网友纷纷调侃:「DeepSeek 靠算法,Grok 3 靠猛砸!

但问题是,Grok 3 只比 DeepSeek R1 高 1-2% 的分数,这么大的算力投入,真的值得吗?

这说明,大模型训练已经进入边际效应递减的瓶颈期,单纯砸硬件未必是最优解。借用李飞飞实验室$50美元可以训练出,近乎相同强劲的大模型。这引起我们的重视,高质量训练方法和数据才是通向AGI的王道。

再加上如此大量的能源消耗和和环境污染,通过力大飞砖的方法终究不是正确的道路。

三、马斯克让 Grok 3 免费,是真 AI 普惠,还是另有目的?

这次 Grok 3 的最大亮点,不是它有多强,而是马斯克直接让它免费
还放话:「用到服务器崩溃为止!

但 AI 时代没有「白嫖」这一说,马斯克的这波操作,背后至少有三个重要目的:

1. 让 Grok 3 快速吸引用户,占领市场

OpenAI、DeepSeek 这些 AI 已经有了稳定的用户群,而 Grok 3 是新玩家,必须靠「免费+流量」抢用户。

马斯克的 X(推特)平台有 5 亿月活用户,这波免费等于直接把 Grok 3 放到全球用户手里,让他们养成使用习惯。

2. 让用户帮 Grok 3 训练 AI,白嫖数据

Grok 3 采用的是基于用户交互的优化,也就是说,用的人越多,它学得越快

就像 Tesla 的自动驾驶,靠着无数用户的数据,持续优化 AI 体验。
而现在,Grok 3 也是在用类似的方法,让全球用户帮它免费训练 AI!

3. 为「AI 超级计算中心」造势

最近,马斯克不止一次提到,他要建一个1.2 GW 超级计算中心,号称「未来世界最强的 AI 计算中心」。

Grok 3 的「免费用到崩溃」,很可能也是为这个项目做测试,看看服务器的极限在哪里。

所以,这不仅仅是一次「免费活动」,更是一场大规模 AI 训练实验

总结一下

从目前来看,Grok 3 确实有很多亮点,但也有不少缺陷。

如果 xAI 能进一步优化推理能力,同时找到更高效的训练方式,那 Grok 3 确实有可能在未来挑战 OpenAI 和 DeepSeek。 但如果继续只靠「猛砸算力」,那它可能会在边际效益递减的瓶颈前止步。

至于马斯克说的「Grok 3 未来会用于 SpaceX 火星任务计算」?
呃……可能得等 Grok 4 再说了。😆

👉 最后,你觉得 Grok 3 能挑战 OpenAI 和 DeepSeek 吗?
欢迎在评论区聊聊你的看法!

·················END·················

没有评论:

发表评论

GPT4o生成的烂自拍,反而比我们更真实。

真实是未经表演的存在。 我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。 能有这么长久,现在依然不断冒出着,各种创意。 我相信无数人都在社交平台里,刷到过这些图。 比如京东外卖跟美团外卖干架干的热火朝天。 但是强子跟兴哥,却穿着各自的工服,在上海...