2026年6月11日星期四

MiniMax M3开源模型实测 金融分析能力惊艳对比Gemini与DeepSeek

MiniMax M3是全球首个融合超长上下文、多模态与编码能力的开源模型。本文实测其金融分析场景:准确识别苹果K线图关键点位,提取财报核心数字并验证营收同比,一次生成可视化HTML看板,对比Gemini和DeepSeek在细节严谨性与代码审美上更胜一筹。适合开发者与金融从业者,支持私有部署。

Tags:

上周,MiniMax 正式发布了新一代旗舰模型 M3,在 AI 圈子里引发不少讨论。

这次 M3 升级亮点,同时支持超长上下文、前沿编码能力和原生多模态。

在过去两年,大家几乎都觉得开源模型想与顶级闭源模型一比,必须同时具备这三项能力。

如今 M3 做到了,也是全球首个将这三大能力合在一块的开源模型。

img

然后就是,为了适配 M3,MinMax 还发布 MiniMax Code,体验和 CodeX 类似。

今天抽空体验一下,同时实测看看 M3 模型的 多模态、Coding 等能力。

这次实测会把 M3 当成一名金融分析师,帮忙完成看 K 线图、读财报、做可视化图表总结。

前几天,苹果全球开发者大会 WWDC 刚结束,股价出现点波动,正好让 M3 来分析下。

读 K 线图

首先来看下 M3 的多模态能力,准备了一张苹果近半年的日 K 线图。

打开 MiniMax Code,让它仔细观察 K 线图上的所有信息,并说说近期趋势、波动幅度、最高最低价格等。

img

可以上下滚动的图片 

M3 很快就输出结果,可能是着急了点,输出的 Markdown 内容工具都忘记渲染了。

但 M3 识别到的信息全部准确,最高点 317.4、最低点 242.97、还有各项指标的具体数值。

甚至是真的读懂了 K 线图里柱子的涨跌幅,点出 5 月初一根红色大阳线拔地而起,突破压力线。

img

同样的 Prompt 和 K 线图,也发给了多模态识别当中标杆 Gemini 3.1 Pro 模型,做了下对比。

说实话,两者的数值识别准确度都丝毫不差,但论看图的细致,M3 略胜半筹。

M3 读出的信息更多、画面感更强,就如一根关键的大阳线都能观察到,这个的确惊艳。

img

可以上下滚动的图片 

啃财报

准备上难度了,继续测试一下 M3 模型对 长文档检索 和 多步推理能力

丢给它一份苹果最新季度财报的 PDF,有几十页内容,也可以测试 M3 超长上下文表现如何。

要求它要提取核心财务数字并标明出处,计算核心数据、以及拆解各业务线营收占比。

img

可以上下滚动的图片 

M3 的表现有点出乎意料,提取出来的数字和页数,大部分我都去核对了一下都是正确的。

在计算营收同比时,它给出的是 16.6%,而财报里写的是 17%,表现得挺严谨的。

甚至还自己做一次验证,把各产品线营收加总,去跟总营收对上账,确认没有遗漏。

img

这种不硬凑、不糊弄、严谨的表现,这时候感觉 M3 确实是一位不错的专业分析师。

同一份财报同样 Prompt,这次选择发给擅长金融分析方面的 DeepSeek V4 Pro 对比看看。

img

可以上下滚动的图片 

第一眼感受,DeepSeek 输出的内容排版比 M3 要直观简洁的多,而且还有 LaTeX 公式。

内容排版 M3 略输一筹,这也可能是 MiniMax Code 对输出的内容渲染还不是很完善。

另外 DeepSeek 在分析财报提取、计算、同比、占比这些数字也是正确的。

但发现了严重的错误,它把财报里一笔欧盟罚款的币种,从「欧元」认为是「英镑」。

数字金额没错,但对币种符号它搞错了,这在金融场景里属于非常严重的犯错。

这次 M3 与 DeepSeek 的对比,在读文档推算数值这块实力相当,但论严谨和细节 M3 要更好一些。

做可视化分析看板

然后继续,看下 M3 这次的 Coding 能力,据说比上一代模型有了很大的提升。

为了与 DeepSeek 对比,我先让 M3 把前面分析 K 线图和财报得到的信息,做一次整理。

拿到这份总结后,分别在 M3 和 DeepSeek 上新开一个对话,做一个单页 HTML 分析看板。

要求放上关键指标卡片、各业务线营收占比的图表、近期走势,以及风险点等信息。

下面分别是 M3 和 DeepSeek 出来的页面效果图,两者均是一次生成。

imgM3
imgDeepSeek

这次对比很明显 M3 做出来页面要比 DeepSeek 好很多,连 K 线图都给画了出来。

而 DeepSeek 页面上的营收占比位置,还出现了文字重叠,页面上的信息点也不够简洁直观。

同样一次直出,两者数据虽没错,但 M3 的代码编写能力,还有 UI 审美更胜一筹。

下判断

最后让 M3 对这次苹果的股票分析做一次系统性的总结,作为这次实测收尾。

img

可以上下滚动的图片 

从输出的结果来看,它没有直接抛出是涨还是跌,而是把所看到的 K 线图和财报结合一起。

客观地分别列出看多的理由、看空的风险,以及几处还要继续盯的不确定性。

还指出财报里有一项资产数据变动偏大,但原文没解释,也如实标明存疑。

没有强行下定论,不替我们拍板、只把判断依据说清楚,反而让我觉得 M3 更加靠谱。

需要说明下,上面分析得到的结论,仅供参考,不构成任何投资建议,大家可以自我评估。

写在最后

以上就是今天的 M3 体验,顺便与Gemini 3.1 Pro、DeepSeek-V4-Pro 模型实测对比了下。

整体来看,M3 这次升级把强大的编码能力、超长上下文和原生多模态能力整合在一起后,可以用它来完成很多工作场景。

就比如这次的分析场景,直接用 M3 就能完成一整个分析链路,无需切换到不同模型、不同工具来接力完成。

无论是对开发者,还是金融从业者来说,这种「全流程跑通」的能力,都要比单项跑分更有价值。

过去想跑通这样一整条链路,基本只能依赖闭源商用模型,数据也得交出去。

如今有一个能自己掌控、私有部署的开源模型选择,对看重数据隐私的应用场景就有解法了。

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

没有评论:

发表评论

首发免费AI视频生成器 自动分镜配音30秒高清 支持Seedance2。0

介绍easyvid工具,提供导演模式15秒和剧情模式30秒,支持自动分镜配音及对口型,可制作AI短剧广告解说视频。注册送350积分,偶有额外积分奖励。导出视频带水印,可配合第三方工具每日两次免费去除。配音仅限英文发音但可输入中文。 Tags: AI视频生成 自动分镜配音 ...