2025年12月28日星期日

国足缺席世界杯,但中国大模型们集体参赛

全球首个人机对决的AlphaGoal预测杯,正式开启

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

咱就是说啊,这届世界杯,真的太有看头了。

虽然国足是无缘了,但咱们中国大模型们竟然要集体参赛!

参赛要干什么?

进行全球首次人机预测大战

图片

这就是联想集团,这个FIFA(国际足联)的官方技术合作伙伴,在2025联想天禧AI生态伙伴大会上突然宣布要搞的事情——AlphaGoal预测杯

这一次,国产大模型集体站在同一个擂台上不再是关起门来做奥数题、在沙箱里跑代码,而是让这些拥有千亿、万亿参数的大脑,去预测那个充满了汗水、草皮、误判、绝杀,以及无数个"这球都能进?!"的真实足球世界。

而且,不光是大模型在玩。

根据赛制,普通球迷和开发者的AI Agent也能下场,直接跟这些顶尖大模型同台竞技预测。

图片

正如资深足球评论员刘建宏给出的评价:

这可能会是历史上第一次全民参与的AI预测大赛。它不仅是技术的较量,更有可能触发一场将足球从观看变为参与的体验革命。

AlphaGoal,或许将是继AlphaGo下围棋之后,AI从做题家走向预言家的关键一步。

8家中国大模型,争夺下一个"章鱼保罗"

对于资深球迷来说,2010年南非世界杯的记忆,除了呜呜祖拉的噪音,大概就是那条神准的德国章鱼保罗

哪怕你平时不看球,大概也知道这只软体动物当年的统治力:8猜8中,胜率100%。

但在AI时代,我们还要靠章鱼的直觉吗?

这正是本次AlphaGoal预测杯最核心的看点:

中国AI八大金刚,试图用硅基智能的算力,挑战碳基生物(包括人类专家、老球迷和章鱼)的直觉。

咱们先来看看首发阵容。

联想这次攒的局,含金量极高。首批加入的这8家,名单里的每一家,单拎出来都是能在各大榜单上霸榜的存在:

  • 百度文心一言:国内最早布局、知识图谱最厚实的老大哥;
  • 腾讯混元:背靠庞大的社交与游戏生态,对人的数据理解独步天下;
  • 商汤:视觉起家,在多模态处理方面有着夯实的基本功;
  • 科大讯飞:逻辑思维缜密,擅长从纷繁复杂的语音和文本中提取关键信息;
  • Kimi(月之暗面)、智谱MiniMax阶跃星辰:AI时代的新贵,在多模态和拟人交互上各有绝活。

据说,还有海外大模型也在打探这个比赛的消息。这些国内外主流AI大模型平时在跑分榜上你追我赶,现在直接被联想天禧拉到了绿茵场的场边。

图片

阵容看罢,接下来的问题是,怎么预测?

这可不是简单的"我猜A队赢"。虽然具体的赛制细节还在打磨,但我们可以预见的是,大模型预测足球,本质上是一场全维度的信息战

传统的球迷预测,靠的是经验(这队我有感情)、玄学(这队球衣颜色克对手)或者简单的历史战绩。

而到了大模型这里,靠的是全知视角。

  • 过去50年两队的所有交手记录;
  • 每位首发球员近期的跑动距离、传球成功率、甚至伤病恢复情况;
  • 当天的天气湿度对草皮摩擦力的影响;
  • 主裁判的判罚习惯数据(是爱掏黄牌,还是鼓励对抗?);
  • 甚至社交媒体上两队球迷的士气值分析……

这8家模型,各有各的性格。 也许逻辑性强的模型会告诉你:"根据贝叶斯概率,A队胜率55%"; 而擅长拟人交互的模型可能会说:"虽然数据看好A队,但我'感觉'B队的当家球星今天这股复仇的劲头,能创造奇迹。"

分歧,本身就是最大的看点。

就像人类专家争得面红耳赤一样,AI之间的意见不合,恰恰体现了AI认知的多样性。这不再是标准答案的填鸭,而是不同算法权重、不同数据理解下的百家争鸣

如果说章鱼保罗靠的是不可知的天赋,那么中国大模型军团,靠的是数据与逻辑的暴力美学

为什么要pick世界杯?

为什么各大模型厂商,甚至联想这样的巨头,都要死磕世界杯这个场景?

说实话,之前的百模大战,大家看腻了。

过去这两年,AI圈的主旋律就是卷:卷参数规模,从百亿卷到万亿;卷榜单跑分,刷爆MMLU、C-Eval;卷谁的奥数题做得好,谁的代码写得溜。

技术确实在进步,但这种竞争,本质上是小圈子里的封闭测试

就像一群高智商的学霸关在屋子里做卷子,分考得再高,大家也只知道它是个好的做题家。

这正是联想发起天禧AlphaGoal预测杯这一波反向操作的精髓所在。

联想集团没有选择继续在那个封闭的屋子里出题,而是直接把门踹开,指着外面那个充满不确定性、荷尔蒙与混乱的真实世界说:"来,预测这个。"

这不仅仅是一个趣味活动,而是在举办一场属于AI的模型世界杯

它的核心野心在于,推动AI从单纯处理文本、生成图像,甚至是只能在特定环境里动的具身智能,走向一个真正能够感知、理解并预测真实世界的世界模型。

图片

足球比赛,就是一个微缩的真实世界。

它是一个典型的高熵、非线性系统。蝴蝶效应在这里时刻上演:一个后卫早餐吃坏了肚子,可能导致他在第89分钟的一个解围失误,进而导致丢球,最后改变冠军归属。

如果AI能在这个系统中,通过学习历史数据、实时变量(天气、伤病、士气)以及复杂的博弈关系,准确预测出未来的走向,那就证明它不仅懂语言,更懂因果;不仅有逻辑,更有对物理世界的洞察。

足球评论员刘建宏说,这会是足球历史上第一次全民AI竞猜,未来会彻底改变足球这项运动从单纯的球迷"观看",变成全民"参与",意义重大。

对AI发展来说,意义同样重大。我们知道,人类历史上有三次著名的人机对决。

第一战:1997年,深蓝 vs 卡斯帕罗夫。

这是逻辑计算的胜利。国际象棋规则明确,棋盘有限。IBM的深蓝靠的是恐怖的穷举能力,它没有思考,它只是算得快。它证明了在规则明确的封闭系统里,机器能战胜人类。

第二战:2016年,AlphaGo vs 李世石。

这是深度学习的奇迹。围棋的变化数超过了宇宙原子总数,穷举失效了。AlphaGo学会了直觉和大局观。但请注意,围棋依然是一个信息完全公开、规则绝对死板的封闭系统。棋盘之外,没有风,没有雨,没有裁判的情绪波动。

第三战:2024年,AlphaFold颠覆生物学。

这是科学发现的加速器,AI开始预测蛋白质结构,它开始解决自然界的难题。

所以,当联想把这8家大模型拉上这个舞台时,出的题目其实是: AI,你准备好走出温室,面对这个脏乱差、充满噪音、毫无逻辑可讲的真实世界了吗?

这次,面对全球几十亿人关注的体育赛事,面对每一个不可预知的进球,大模型们必须证明: 我不光会做题,我还能理解这个复杂的世界。

或许从联想天禧AlphaGoal预测杯开始,AI的世界杯,来了!

如果中国的AI模型,能在这个高噪声环境下,准确率哪怕比章鱼保罗高那么一点点,或者给出的预测逻辑能让人类专家拍案叫绝,那都是AI从弱人工智能向通用人工智能迈进的一大步。

因为它开始尝试理解因果,而不仅仅是相关。

联想的反向操作

在这场热闹的人机大战背后,还有一个角色的站位非常有意思。

那就是组局者——联想集团

在当前的AI圈子里,大家都在忙着找钉子。 大模型厂商在卷基座,恨不得把参数堆到天上去; 手机厂商在卷系统,把AI塞进每一个语音助手里。

而联想,做了一个反向操作

作为FIFA的官方技术合作伙伴,联想这次不仅提供了服务器、工作站等硬家伙来支持赛事运营,更重要的是,它把自己变成了一个生态组织者

怎么理解?

联想不想再做一个大模型去跟这8家卷,而是说:你们模型都很好,但你们需要触达用户,需要落地场景。 来,我这有场子。

这个场子,正是联想天禧AI平台

联想天禧AI生态目前的月活跃用户已经突破2.8亿。其中,70%是18-34岁的年轻群体(大学生和职场人)。 这意味着,这里有最爱尝鲜、最爱互动的核心用户。

在此次大会上,天禧AI升级到了3.5版本,并且提出了一个更科幻的概念——AI Twin(智能双胞胎)。 它不再是一个简单的助手,而是"思你所想,行你所愿"的队友。 在这个平台上,你的AI Agent不仅能帮你工作,还能帮你看球。

PC全球第一、平板全球第三……联想手里握着通往真实世界的钥匙。 它横跨了Windows、Android等多个生态,覆盖了从办公桌到客厅,从口袋到数据中心的全部场景。

当其他厂商试图用一个豆包手机或者AI Pin来统合世界时,联想选择用天禧智能体系统把这些顶尖的大模型能力,无缝地接入到每一个联想设备中。

或许,AlphaGoal预测杯的模式,才是"AI+"的正确打开方式。

AI不应该高高在上地指导我们生活,它应该变成像世界杯一样,全民参与、全民狂欢的基础设施。

联想大舞台,有AI你就来。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见

”一张照片+一段视频“无限生成数字人!复旦&微软等提出StableAvatar,让“数字人”365 天穿不重样!

添加微信号:AIGC_Tech,公众号小助手会拉你进群!点击下方名片关注AIGC Studio公众号!

添加微信号:AIGC_Tech,公众号小助手会拉你进群!

点击下方名片关注AIGC Studio公众号获取最新AI前沿应用/AIGC实践教程

不用再逐帧重训模型,也无需昂贵多机位拍摄。来自复旦大学、微软亚洲研究院、西安交通大学、腾讯公司提出的 StableAvatar,把"换脸+换装+换背景"做成一次建模、终身可编辑的无限时长 Avatar 生成框架,零样本、零重训、零幻觉,代码与模型已全面开源。

图片

unsetunset一句话看懂 StableAvatarunsetunset

老办法
StableAvatar 新范式
结果
换套衣服重训 300 GPUh
一次通用建模,终身 zero-shot 编辑
训练 ↓ 100%
20 秒后开始"脸崩衣裂"
无限时长,ID/服装/背景三一致
漂移 ↓ 90%
多机位+绿幕+深度相机
单目视频+一张参考图
门槛 ↓ 99%

unsetunset相关链接unsetunset

  • 代码:https://github.com/Francis-Rings/StableAvatar
  • 论文:https://arxiv.org/pdf/2508.08248
  • 模型:https://huggingface.co/FrancisRing/StableAvatar/tree/main

突破长视频生成瓶颈:StableAvatar开启音频驱动3D虚拟形象新时代 在当今数字化浪潮中,3D虚拟形象生成与视频合成技术正逐渐成为科技领域的焦点。从游戏娱乐到虚拟社交,再到影视制作,这些技术都有着广阔的应用前景。然而,现有的音频驱动虚拟形象视频生成方法却面临着诸多挑战,比如难以生成高质量的长视频、画面中的角色和场景容易出现失真和不一致等问题。不过,近期一款名为StableAvatar的创新技术为这一领域带来了新的曙光。

unsetunsetStableAvatar诞生背景unsetunset

当前,扩散模型在音频驱动虚拟形象视频生成领域取得了一定进展,但现有的方法大多局限于生成短于15秒的视频。一旦尝试生成更长的视频,就会出现严重的身体扭曲和外观不一致现象,尤其是在面部区域。这不仅限制了技术的实际应用,也影响了用户体验。为了解决这些问题,StableAvatar应运而生,它致力于实现无限长度的高质量虚拟形象视频生成,无需后期处理。

unsetunset方法概述unsetunset

图片

当前用于音频驱动的虚拟形象视频生成的扩散模型难以合成具有自然音频同步和身份一致性的长视频。StableAvatar是首个无需后处理即可合成无限长高质量视频的端到端视频扩散变换器。StableAvatar 基于参考图像和音频,集成了定制的训练和推理模块,从而实现无限长视频的生成。

我们发现,现有模型无法生成长视频的主要原因在于其音频建模。它们通常依赖第三方现成的音频提取器来获取音频嵌入,然后通过交叉注意力机制将其直接注入扩散模型。由于当前的扩散骨干网络缺乏任何与音频相关的先验信息,这种方法会导致视频片段中潜在分布误差的严重累积,进而导致后续片段的潜在分布逐渐偏离最优分布。为了解决这个问题,StableAvatar 引入了一种新颖的时步感知音频适配器,通过时步感知调制来防止误差累积。在推理过程中,我们提出了一种新颖的音频原生引导机制,利用扩散过程自身不断演化的联合音频-潜在信息预测作为动态引导信号,进一步增强音频同步性。为了提高无限长视频的平滑度,我们引入了一种动态加权滑动窗口策略,该策略融合了随时间变化的潜在信息。基准测试实验从定性和定量两个方面都验证了StableAvatar的有效性。

unsetunset实验结果unsetunset

指标
基线 (TaoAvatar)
纯 3DGS
StableAvatar
FID ↓
19.3
17.8
14.1
LPIPS ↓
0.086
0.072
0.051
身份一致性 ↑
91.2%
93.5%
96.7%
服装保真度 ↑
88.4%
90.1%
95.3%
时长
20 s
60 s
∞(实测 10 min+)

用户研究:92% 受试者认为"换衣后仍是同一个人",显著优于基线。


unsetunset应用场景unsetunset

  • 虚拟偶像与直播: 主播可以拥有一个在任何动作和表情下都"容颜不老"的完美数字替身。
  • 影视与游戏角色制作: 快速生成高保真角色,无需担心不同镜头间的形象跳变,大幅降低后期修正成本。
  • 视频会议与远程协作: 创建能精准反映用户表情和动作的虚拟形象,提升远程沟通的临场感。
  • 个性化定制服务: 为用户提供稳定、高质的个人数字人定制,用于社交、娱乐等场景。

unsetunset结语unsetunset

当 Avatar 生成从"逐帧重训"进化到"码本即插即用",换衣就像换 PNG 图层。StableAvatar 用一次通用建模,把"身份-服装-背景"彻底解耦,零样本、无限时长、零重训,让每个人都能拥有"会动的透明 PNG"。

下一步,也许我们只需一句"今天我想穿宇航服跳街舞",AI 就能 30 秒生成 10 分钟 4K 大片——Avatar 编辑的 Photoshop 时代,正式到来。

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

图片

国足缺席世界杯,但中国大模型们集体参赛

全球首个人机对决的AlphaGoal预测杯,正式开启 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 咱就是说啊,这届 世界杯 ,真的太有看头了。 虽然国足是无缘了,但咱们 中国大模型们 竟然要集体参赛! 参赛要干什么? 进行 全球首次人机预测大战 。 这就是 联想集团...