号称"地表最强"的 Grok3 突然上线,掀起了一场AI热潮!
随着马斯克的大手一挥,Grok3 流量瞬间超越 ChatGPT,并强势登顶美区免费应用排行榜第一。
社交平台上,网友们对 Grok3 的评价众说纷纭:
有用户直言:"Grok3 是目前最好的大模型!比 GPT-4o 快、便宜,UI 简洁美观,'Think'模式完美适配提示指南。" 更有体验者表示:"已经取消 ChatGPT Plus 订阅,转投 Grok3 的怀抱!"
实测对决:Grok3 VS ChatGPT VS DeepSeek-R1
为了探究 Grok3 的真实实力,我们决定让它与 ChatGPT 和 DeepSeek-R1 同台竞技,分别从 深度思考(Think) 和 深度搜索(DeepSearch) 两大功能展开测试。
1. Think 功能:Grok3 深度思考,表现亮眼
马斯克在前几天的发布会上将 Grok3 夸得天花乱坠,并展示了多项基准测试成绩。在编程、数学、创意写作、指令遵循、长查询、多轮对话等维度上,Grok3 稳居第一。
测试 1:经典难题 "mississippi 有几个 i?"
Grok3:仅用 8 秒答对!不仅逐个检查字母,还用另一种方法验证,逻辑严谨。
ChatGPT o3-mini:虽然答对,但仅用几秒,缺乏推理过程,显得"降智"。
结果:Grok3 胜!
测试 2:弱智吧题目 "为什么朝九晚五能接受,朝五晚九不行?"
Grok3:直击重点,指出朝五晚九意味着 16 小时工作时长,超出人体承受范围,逻辑清晰。
ChatGPT o3-mini-high:虽抓住时长问题,但回答缺乏细节和深度。
DeepSeek-R1:洋洋洒洒却跑题,聊了生物钟、通勤等,忽略核心矛盾。
结果:Grok3 胜!
测试 3:数学题 "49 个同学渡河,船容量 7 人,至少来回多少次?"
正确答案:8 次。 Grok3:耗时 2 分多钟,但推理清晰,识别题目陷阱(需一人撑船),并推导出通用公式:对于 N 人,容量 C,渡河次数 = (N-1)/(C-1)。
ChatGPT o3-mini-high:推理错误,混淆"来回"定义。
结果:Grok3 胜!
2. DeepSearch 功能:Grok3 搜索能力强大
测试任务:马斯克爆料"美国社保系统疑似史上最大规模欺诈",以表格总结网友评价
Grok3: 左侧展示搜索路径,清晰透明,搜索 52 个信源,包括 ABC、NBC 等权威媒体及 Reddit、X 平台数据。
提供两种回答版本: 简版:罗列关键要点,并以表格总结 X 网友评价。
- 详版:完整还原事件来龙去脉,每条事实附来源链接,有效对抗大模型幻觉。
ChatGPT:Deep Research 功能需 Pro 账户(每月 $200,限 100 次),且体验不佳,用户直接放弃订阅,转投 Grok3。 结果:Grok3 完胜!
Grok 中国官网震撼上线,专为国内用户优化!
激动人心的消息!Grok 中国官网现已正式上线,为国内用户带来全新智能体验。无需复杂的"魔法上网",即可畅享强大功能。以下是亮点介绍:
无需科学上网,轻松访问
告别繁琐设置,Grok 中国官网面向国内用户开放,访问简单便捷。OpenAI 的完美平替
Grok 提供媲美甚至超越 OpenAI 的智能服务,满足多样化需求。零降智,智能满分
告别回答质量下降的担忧,Grok 始终保持高水平智能表现,堪称"聪明"助手。订阅价格亲民,与 GPT 齐平
定价极具竞争力,首月特惠仅 49.9 元/月!前往客服领取优惠(微信:coder-maynor),轻松开启智能之旅。专为深度研究用户打造
如果你是深度研究爱好者,Grok 将助你在知识探索中更进一步。
赶快访问 Grok 中国官网,体验这款专为中国用户优化的智能助手吧!首月优惠不容错过,立即联系客服(微信:coder-maynor)抢先订阅!
没有评论:
发表评论