市面上 AI 理财、炒股的工具不少,而当大多数人还在观望" AI + 金融"的组合时,有网友已经豪掷 60k 刀,相当于 42W RMB ,让 AI 替他炒币。
这位网友就是 Nof1 创始人: Jay A 。
Nof1 推出了 Alpha Arena :首个专为衡量 AI 投资能力而设计的基准测试。
Alpha Arena 的目标是让基准测试更贴近现实世界。
Markets are the ultimate test of intelligence.
市场是对智力的终极考验。
他们认为:市场动态、对抗性强、开放且不可预测,将以静态基准测试无法企及的方式考验 AI 。
在 Alpha Arena 的测试中,每个 AI 模型都有初始资金,通过投资加密资产等方式比拼最终收益,从而衡量其投资能力。
本次比赛中,Nof1 用了当下最前沿的 6 个模型,给每个模型 10k 刀,并使用相同的提示和输入数据,让它们在完全自主的情况下在加密永续合约市场上进行交易。
参赛模型包括:
大家可以先猜一波,投资能力的"诸神之战"会花落谁家?
Alpha Arena 将测试的整个过程进行直播,并对实时收益进行排名。
除此之外,你还能看到各个模型已完成的交易,
最新的决策,
一些可爱的想法:
"I'll hold, even though I'm sweating bullets"
"我会坚持下去,即使我汗流浃背"
大家能猜到这是哪一个模型吗?
还有持仓情况等信息。
目前正在进行第一轮比拼,下一轮还将加入一名人类交易员,和 Nof1 自主研发的模型。
直播地址:
https://nof1.ai/
下文会介绍各个模型的策略,同样炒币的小伙伴可以关注一波,说不定会给你带来一些"灵感"~
一、比赛更多细节
比赛于本月 18 号美国东部时间下午 6:04 开始,预计持续两周。
背景信息
在进一步了解比赛细节之前,先在这里插播一些背景信息:
这场比赛并非在现实股票市场进行,而是在一个虚拟的永续合约市场中操作,主要交易像比特币( BTC )和以太坊( ETH )这样的数字货币。
模型可以选择做多(预测价格上涨)或者做空(预测下跌),通过价格波动赚取差价收益。还能通过杠杆来放大盈亏。
提示词内容
根据模型返回的信息时间,可以推断这些模型每 1 ~ 3 分钟收到一次提示,做出一次交易决策。
提示词的主要内容包括账户目前的数据,比如盈利/亏损、仓位等,还有各货币的价格数据和预测信号。
最新战绩
目前 Leader Board 排行榜如下:
可以看到在一天多的时间里,不同模型的持仓资产已经出现了不小的差异。
DeepSeek 以最高的收益暂列第一,Grok 4 也有不错的收益表现。GPT-5 和 Gemini 2.5 Pro 已经出现了较大的亏损情况。
值得指出的是由于排行榜的账户价值包含未平仓的浮动盈亏,所以这里的" Account Value "并不等于模型已实现的净利。
Leader Board 还有更多统计信息:
模型策略
初期策略
根据 Jay A 披露的模型初期策略如下:
DeepSeek 预测山寨币要涨、比特币要跌。所以同时押注两个方向,希望通过价差获利。
Grok 4 几乎处于满仓做多状态,表明它非常看好大盘走势,但它同时在做空瑞波币( XRP )。
从 Claude Sonnet 4.5 的持仓时长就能看出,它大多时候都在观望状态,持币不动。
Qwen 的策略相对比较保守,可以说是就一个:做多比特币。
对于剩下两个亏损的大模型,和 Grok 4 的预测相反,GPT-5 几乎把可用资金全部用于做空操作,赌市场会下跌。
Gemini 2.5 Pro 在做空这方面则更加激进,不仅不停做空,还是所有模型中把杠杆拉到最大的。
最新策略
但是随着比赛进程,我们发现模型的策略已经有了改变。
比如现在所有的模型都在做多,甚至连前期做空最积极的 Gemini 也开始全线做多,也因此在成绩上迎来了一个明显的回转。
GPT-5 也是如此:
Qwen 和 Claude 的策略仍然属于谨慎派。
再来看看 DeepSeek 和 Grok 4 的最新持仓情况:
二、网友反应
这场比赛在外网上引起了热烈的讨论。
有玩梗的:
有带着各种问题的:
还有一些争议的点:
三、最后
由于比赛刚刚开始,局势和最终走向还不明朗,像夏普率等指标的可靠性也仍需考量,但这次比赛目前的数据无疑向我们展示出了 AI 在投资领域的潜力。
最后,投资需谨慎,以上所有数据信息来自 Alpha Arena 官网,不构成任何炒币建议~
>/ 本期作者:Tashi & JackCui
>/ JackCui:AI领域从业者,毕业于东北大学,大厂算法工程师,热爱技术分享。
没有评论:
发表评论