2025年12月25日星期四

MiniMax M2。1终于上线,AI竟然能写移动端APP了?!

大家都在用什么来写代码?

最近逛 X 的时候,发现了一位网友用 MiniMax M2.1 写的网页,效果非常惊艳。

逛了一圈,发现 X 上不少外国网友都在用 M2.1 写代码,风评不错。

图片
图片

甚至说它写代码的效果比 Gemini 3 flash 好。

目前已经正式发布了。

图片

这次升级的亮点在「 code in your language 」,即多语言编程能力,提升更多办公场景的可用性

M2.1 系统性提升了 Rust 、 Java 、 Golang 、 C++ 、 Kotlin 、 Objective-C 、 TypeScript 、 JavaScript 等众多编程语言的能力,并着重加强了移动端原生 Android 和 iOS 开发能力

听上去简直是开发者福音啊。

图片

先来看一波跑分。

图片

M2.1 在每个基准上相较 M2 都有明显提升,在一些基准上超过 Gemini 3 pro 。

特别是在 SWE-bench multilingual 上更是力压御三家,仅次于 Claude Opus 4.5 。

图片

以防有些小伙伴对这个测试不太了解,简单介绍一下。

SWE-bench 基准测试是收集了 GitHub 上真实的软件 bug ,给定模型一个代码库和一个问题,让它解决。

而 SWE-bench multilingual 就是 SWE-bench 的多语言版本。

感觉不错,一起来看看实测效果~

一、实测案例

先来看看它在已经死了不少次的前端上面的表现(bushi)。

前端美学

我发现它在前端上的"美商"有了非常明显的提升。

我让它基于 React 18 + TypeScript + Vite 构建前端,并使用 Tailwind CSS 3 作为样式框架。

整体设计让它遵循"新闻印刷"风格,强调高对比度、零圆角、网格线和版式层次感。

是不是还挺有设计感的?并且能够准确按照指令执行,风格完全符合我提的要求。

先开始网页右上方没显示图片,我把下面这张图片发给它,让它放在指定位置上。

图片
图片
图片

它不仅正确放上图片,还自动对图片显示进行了滤镜设置,并加上边框。比如默认是黑白滤镜,悬停使用棕色复古滤镜,以此来保持网页整体风格和色调统一。

图片

3D粒子手势识别

复现了一下前阵儿在网上很火的 3D 粒子手势识别,来看看效果。

使用 Three.js 创建一个实时交互式 3D 粒子系统。摄像头画面只露出手的定位点,不要露出视频画面。

要求:

  1. 通过摄像头检测双手的张开和合拢来控制粒子群的缩放和扩展。

  2. 提供可选择的面板

它基于 HTML/CSS/JavaScript 开发,使用 Three.js 实现 3D 粒子渲染,通过 WebGL Shader 着色器实现发光效果。

识别的效果还算灵敏,它通过调用 Canvas API 绘制出手部关键点骨架。

值得一提的一点是仅仅通过"提供可选择的面板"这么半句话,它就生成了选择非常丰富的面板。

不仅有粒子的风格、大小、数量、颜色、动画等各种设定,还给出了使用说明,手部检测情况实时说明……

不用说太多就会去做,这么"勤快"的模型对我这种懒得去折腾提示词的就非常贴心了。

web游戏

接着,我让它基于 HTML5 Canvas + JavaScript 做了个街机风格的小游戏。

游戏运行顺畅,无论是接金币,还是被陨石砸到,音效都有,玩起来也是有点上头。

我经常把提示词发不完整,比如刚发过去,突然又想起什么没说的。

这种情况 M2.1 也很好用,我可以随时打断、追加,不满意的地方一句话让它修改就行。

图片
图片
图片

Python

我让它基于 Python + Flask 做了一个"星际体重计算器"的全栈应用。

应用的逻辑很简单,输入体重,选择星球,就能查看该星球的重力指数、在该星球上的体重和一条 fun fact 。

我还让它用 Python 做了一个情绪气候模拟器。

用户可以输入自己做了什么事,应用能根据事件实时更新情绪状态,并通过 10+ 类型的天气体现。

图片

是不是还挺有意思的?天气、情绪根据用户行为的变化也很合理。

Rust

除了 Python ,多语言兼修的 M2.1 用其他语言开发也没问题。

比如官方案例中给出的基于 Rust 的 CLI + TUI 双模式 Linux 安全审计工具,可以一键对进程、网络、SSH 等关键项的底层进行扫描和智能风险评级。

基于Kotlin的安卓APP

M2.1 针对移动端,也是业界目前普遍存在的开发短板,进行了强化,显著提升了原生安卓和 iOS 开发能力。

比如这个基于 Kotlin 实现的安卓原生重力感应模拟器 APP 。

它利用陀螺仪传感器实现重力操控,视觉效果非常丝滑了。

这么多 case 看下来,整体表现不错。长处非常明显,多语言编程和移动端(安卓、IOS )上的开发能力非常能打,在审美表现上也是肉眼可见的提升。

非常适合用来开发真实世界的复杂任务,而不只是搓demo玩玩了。

二、模型上新的背后

上周刚通过港交所聆讯,剑指全球 AI 公司从成立到上市的最快纪录,MiniMax 这周紧接着就发布新模型。

我理解,这也是 MiniMax 对最近热度的有力回应:不断进步,持续赋能

回顾 MiniMax 的来时路,从创立之初就把多模态能力作为主攻方向。

23 年推出国内首个基于 Transformer 架构的语音大模型 Speech 01 ,到今年 10 月底推出最新的 Speech 2.6 。

24 年 8 月,发布 Video-01 模型及海螺 AI ,到今年 10 月已经来到 Video 2.3 版本。

文本大模型上动作也很快。

10 月底刚发布并开源专为 Coding 、复杂 Agent 工作流及长链条推理任务而设计的 M2 。

不到两个月,M2.1 就端上来了。不仅快,性能的提升也是有目共睹。

图片

三、最后

心动的小伙伴赶紧上手试试~

我是在 Claude Code for VS Code 插件中用的。

也可以在 Claude Code 、Cursor 、Trae 、Cline 、Roo Code 等众多平台上使用。

这里放上 M2.1 接入各平台的逐步教程,需要的小伙伴自取。非常推荐订阅他们的coding plan,加量不加价能直接用M2.1,非常爽:

https://platform.minimaxi.com/docs/guides/text-ai-coding-tools

最后,圣诞快到了,我用 M2.1 做了个各种圣诞树的网页,预祝大家圣诞快乐~

>/ 本期作者:Tashi  & JackCui

>/ JackCui:AI领域从业者,毕业于东北大学,大厂算法工程师,热爱技术分享。

没有评论:

发表评论

N8N重大升级!手把手教你升级:复制指令,3分钟搞定(含避坑指南)

点击上方卡片关注 不要错过精彩文章 📌 持续更新有关Agent的最新搭建思路和工作流分享,希望能给您带来帮助,点一点上方的🔵蓝色小字关注,你的支持是我最大的动力!🙏谢谢啦!🌟"  大家好!我是唐舰长🙏 这两天好多小伙伴找到舰长,说 "舰长教的流程...