2026年3月20日星期五

马斯克发布Grok 4。2测试版:多智能体协作架构,5000亿参数小版本性能飙升

Grok 4.2测试版由马斯克推出,首创多智能体协作系统,4个Agent分工解答任务;5000亿参数仅为"小版本",高端服务SuperGrok Heavy每月300美元可扩展至16个Agent。模型能实时访问X平台数据,在投资实测中净收益超3000美元,并具备快速编程、幽默互动等能力。国内提供免费试用入口。

Tags:


告别单打独斗!马斯克发布Grok 4.2测试版:首创"AI群聊"架构,5000亿参数小版本性能狂飙!

马斯克再次刷新了全球大模型的竞争天花板。Grok 4.2 公开测试版正式登陆网页端与移动端。

马斯克在社交平台X上放出豪言:Grok 4.2不仅拥有极强的快速进化能力,在公测结束时,其智能程度和速度将比Grok 4高出一个数量级。更令人震撼的是,目前发布的5000亿参数版本竟然只是**"小版本"**。

图片

一、 核心进化:从"单兵作战"到"团队协作"

Grok 4.2测试版最大的亮点,是其独特的多智能体协作系统(Multi-Agent System)。当你输入一个问题时,后台会有4个Agent同时上线,分工明确地为你寻找答案。

Grok 4.2 "梦之队"分工明细表

Agent 角色
核心任务
核心价值
Grok Agent (队长)任务分解与汇总
负责整体逻辑把控,合并最终答案
Harper Agent实时搜索与验证
调取实时数据,确保证据准确无误
Benjamin Agent严谨推理与编程
负责数学计算、写代码及逻辑验证
Lucas Agent创意发散与优化
负责交互体验,提供更具文采的表述

更夸张的是,xAI推出的 SuperGrok Heavy 高端服务(每月300美元),能将协助工作的Agent数量增加到16个,这预示着AI正式从"聊天机器人"进入了"分布式智能"时代。

图片

二、 实战封神:炒币赢麻了,靠的是X平台"超能力"

此前,Grok 4.2测试版在 Alpha Arena 大模型投资实测中大获全胜。在无人工干预的情况下,它是唯一实现盈利的模型:

  • 初始资金: 10,000美元

  • 净收益:3,084美元(约人民币21,307元)

为什么它这么强?
外媒指出,Grok 4.2能直接访问X平台Firehose数据流中每日约 6800万条英文推文。通过毫秒级的速度将全球社交舆情转化为交易信号,这是其他模型(如GPT-4o、Claude 3.5)无法获得的实时护城河。

图片

三、 测评实验室:高情商、懂玩梗,但也有"翻车"瞬间

在多项实测中,Grok 4.2展现了鲜明的个性:

  1. 极速编程: 仅耗时17秒,就写出了一个具备放置炮塔、怪物移动、攻击判定功能的网页版塔防游戏
    图片

  2. 暴力玩梗: 面对"我父母结婚没请我"的陷阱,Grok 4.2不仅点破逻辑,还用了**"哈哈哈哈直接笑出声"**来回应,相比传统AI更加"拟人化"。
    图片

  3. 智商挑战: 虽然在逻辑和幽默上领先,但在基础视觉识别上仍有失误(如将七边形识别为6个角),且在单词统计中偶尔会出现拼写多出一两个字母的小瑕疵。


四、 网友大开脑洞:从赛博朋克到AGI架构

开发者们已经在X平台上晒出了各种惊艳成果:

  • 网站生成: 一句指令生成具有星空背景、霓虹色彩的超前卫个人展示网站。

  • AGI架构设计: 4个Agent通过深度脑暴,提出了名为 HELIX-AEGIS 的双螺旋人工智能架构,引发了技术圈的热烈讨论。

图片

总结

马斯克的Grok系列正在开辟一条**"实时数据+多智能体协作"**的独特道路。Grok 4.2不再只是一个静态的知识库,而是一个能实时感知世界脉动、并由多名"专家"共同决策的智能团队。

想体验马斯克最强Agent团队?
国内快速使用入口:https://chatgpt-plus.top/list/#/home,注册一个账号免费使用

没有评论:

发表评论

开源多模态数据标注平台Tiger:大模型训练降本70%

Tiger是国内领先的开源多模态数据标注平台,面向大模型训练,通过自动化工具链、RAG技术及多模态处理,降低70%人工成本,标注准确率超95%,支持千人级团队协作与私有化部署,适合AI工程师及企业高效构建训练数据集。 Tags: 数据标注平台 开源工具 多模态标...