AI I024: 亲测24小时后我连夜退了ChatGPT Plus，马斯克的Grok3杀疯了！

2025年2月24日星期一

亲测24小时后我连夜退了ChatGPT Plus，马斯克的Grok3杀疯了！

号称"地表最强"的 Grok3 突然上线，掀起了一场AI热潮！

随着马斯克的大手一挥，Grok3 流量瞬间超越 ChatGPT，并强势登顶美区免费应用排行榜第一。

社交平台上，网友们对 Grok3 的评价众说纷纭：

有用户直言："Grok3 是目前最好的大模型！比 GPT-4o 快、便宜，UI 简洁美观，'Think'模式完美适配提示指南。"
更有体验者表示："已经取消 ChatGPT Plus 订阅，转投 Grok3 的怀抱！"

实测对决：Grok3 VS ChatGPT VS DeepSeek-R1

为了探究 Grok3 的真实实力，我们决定让它与 ChatGPT 和 DeepSeek-R1 同台竞技，分别从 深度思考（Think） 和 深度搜索（DeepSearch） 两大功能展开测试。

1. Think 功能：Grok3 深度思考，表现亮眼

马斯克在前几天的发布会上将 Grok3 夸得天花乱坠，并展示了多项基准测试成绩。在编程、数学、创意写作、指令遵循、长查询、多轮对话等维度上，Grok3 稳居第一。

测试 1：经典难题 "mississippi 有几个 i？"

Grok3：仅用 8 秒答对！不仅逐个检查字母，还用另一种方法验证，逻辑严谨。

ChatGPT o3-mini：虽然答对，但仅用几秒，缺乏推理过程，显得"降智"。

结果：Grok3 胜！

测试 2：弱智吧题目 "为什么朝九晚五能接受，朝五晚九不行？"

Grok3：直击重点，指出朝五晚九意味着 16 小时工作时长，超出人体承受范围，逻辑清晰。

ChatGPT o3-mini-high：虽抓住时长问题，但回答缺乏细节和深度。

DeepSeek-R1：洋洋洒洒却跑题，聊了生物钟、通勤等，忽略核心矛盾。

image.png

结果：Grok3 胜！

测试 3：数学题 "49 个同学渡河，船容量 7 人，至少来回多少次？"

正确答案：8 次。
Grok3：耗时 2 分多钟，但推理清晰，识别题目陷阱（需一人撑船），并推导出通用公式：对于 N 人，容量 C，渡河次数 = (N-1)/(C-1)。

image.png

ChatGPT o3-mini-high：推理错误，混淆"来回"定义。

image-20250224154226933

结果：Grok3 胜！

2. DeepSearch 功能：Grok3 搜索能力强大

测试任务：马斯克爆料"美国社保系统疑似史上最大规模欺诈"，以表格总结网友评价

Grok3：

左侧展示搜索路径，清晰透明，搜索 52 个信源，包括 ABC、NBC 等权威媒体及 Reddit、X 平台数据。

image.png

提供两种回答版本：

简版：罗列关键要点，并以表格总结 X 网友评价。

- 详版：完整还原事件来龙去脉，每条事实附来源链接，有效对抗大模型幻觉。

image.png

ChatGPT：Deep Research 功能需 Pro 账户（每月 $200，限 100 次），且体验不佳，用户直接放弃订阅，转投 Grok3。
结果：Grok3 完胜！

Grok 中国官网震撼上线，专为国内用户优化！

激动人心的消息！Grok 中国官网现已正式上线，为国内用户带来全新智能体验。无需复杂的"魔法上网"，即可畅享强大功能。以下是亮点介绍：

无需科学上网，轻松访问
告别繁琐设置，Grok 中国官网面向国内用户开放，访问简单便捷。
OpenAI 的完美平替
Grok 提供媲美甚至超越 OpenAI 的智能服务，满足多样化需求。
零降智，智能满分
告别回答质量下降的担忧，Grok 始终保持高水平智能表现，堪称"聪明"助手。
订阅价格亲民，与 GPT 齐平
定价极具竞争力，首月特惠仅 49.9 元/月！前往客服领取优惠（微信：coder-maynor），轻松开启智能之旅。
专为深度研究用户打造
如果你是深度研究爱好者，Grok 将助你在知识探索中更进一步。

Grok 体验图片

赶快访问 Grok 中国官网，体验这款专为中国用户优化的智能助手吧！首月优惠不容错过，立即联系客服（微信：coder-maynor）抢先订阅！

没有评论:

发表评论

订阅：博文评论 (Atom)

AI I024

2025年2月24日星期一

亲测24小时后我连夜退了ChatGPT Plus，马斯克的Grok3杀疯了！

实测对决：Grok3 VS ChatGPT VS DeepSeek-R1

1. Think 功能：Grok3 深度思考，表现亮眼

测试 1：经典难题 "mississippi 有几个 i？"

测试 2：弱智吧题目 "为什么朝九晚五能接受，朝五晚九不行？"

测试 3：数学题 "49 个同学渡河，船容量 7 人，至少来回多少次？"

2. DeepSearch 功能：Grok3 搜索能力强大

测试任务：马斯克爆料"美国社保系统疑似史上最大规模欺诈"，以表格总结网友评价

Grok 中国官网震撼上线，专为国内用户优化！

没有评论:

发表评论

Agent研究爆发期：190篇必读论文与500个开源项目源码免费获取

标签