微软突然放大招:一张图,直接生成可用 3D 模型40 亿参数,TRELLIS.2 把"图生 3D"推到新阶段如
微软突然放大招:一张图,直接生成可用 3D 模型
40 亿参数,TRELLIS.2 把"图生 3D"推到新阶段
如果你最近有关注 AI 圈,会明显感觉到一件事:
2D 生成已经卷到极致,真正的战场,开始转向 3D。
就在这两天,微软悄悄放出了一个重量级项目——
TRELLIS.2,一个 40 亿参数的 Image-to-3D 生成模型。
不是"研究玩具",而是真的能直接产出可用 3D 资产那种。
一句话先给结论
TRELLIS.2 的目标不是"看起来像 3D",而是:
让一张图,直接变成能进引擎、能打光、能渲染的 3D 模型。
这也是它和很多"图生 3D 项目"最大的区别。
为什么这次很多人会认真看它?
先看几个关键点👇
✅ 单张图片 → 3D 网格 + PBR 材质
✅ 40 亿参数大模型
✅ 最高支持 1536³ 级别 3D 分辨率
✅ 微软官方开源
✅ 不是 NeRF,而是直接 Mesh + 材质
一句话:
它不是为了"演示",而是冲着"生产"去的。
先看效果:不是"假 3D",而是真资产
从官方示例可以看到几个细节:
这一步,其实已经帮很多人省掉了整条中间流程。
TRELLIS.2 到底做对了什么?
如果只说"参数多",那没意义。
它真正厉害的,是底层思路。
1️⃣ 它抛弃了传统 NeRF / SDF 那套
过去很多图生 3D 项目,问题都出在这:
表面一堆
结构封闭
转 Mesh 特别痛苦
后处理复杂到怀疑人生
TRELLIS.2 直接换了一条路。
2️⃣ 一个很关键的概念:O-Voxel
官方提出了一种新的表示方式,叫 O-Voxel(Omni-Voxel)。
你可以简单理解为:
不是"隐式场"
而是同时编码几何 + 外观的稀疏 3D 表示
对复杂拓扑(开口结构、非流形)更友好
这一步,直接解决了很多 3D 生成模型**"看着像,但用不了"**的问题。
3️⃣ 原生 3D VAE,把 3D 压进模型
TRELLIS.2 使用了 原生 3D VAE:
对 3D 空间做 16× 压缩
让 40 亿参数真正"装得下"高分辨率 3D
推理速度也能接受
这也是为什么它能做到 1536³ 这种级别。
性能这块,微软给的数据也很硬
在 H100 上的官方数据(形状 + 材质):
512³:约 3 秒
1024³:约 17 秒
1536³:约 1 分钟
放在 3D 领域,这是一个非常能打的数字。
那它能用来干什么?
说几个现实场景,你就懂它的价值了:
🎮 游戏资产生成(角色、道具、环境物件)
🛒 电商 3D 商品建模
🎥 影视 / 动画概念资产
🧠 AI 3D 内容管线的前端生成器
🤖 后续接入 ComfyUI / 自动化工作流
尤其是电商 + 游戏 + AI 生成内容这条线,空间非常大。
当然,它也不是完美的
官方也说得很实在:
❗ 生成的 Mesh 可能有小孔洞
❗ 严格 3D 打印场景需要后处理
❗ 审美不是重点,偏"工程资产"
但说句实话:
能直接出可用 3D,本身就已经跨过了 80% 的门槛。
普通人该怎么看 TRELLIS.2?
我的判断很简单:
TRELLIS.2 不是终点,但它在"图 → 3D 资产"这条路上,
给了一个非常清晰、可复制、可工程化的答案。
而且最关键的一点是——
它是微软开源的。
这两年 AI 最大的变化,不是模型名字换了多少个,
而是"能不能真正走进生产流程"。
TRELLIS.2 至少证明了一件事:
3D,不再只是少数人的专业门槛,而正在被模型一点点拆平。
如果你觉得这篇文章对你有启发👇
欢迎点赞、关注、转发给对 AI / 3D / ComfyUI 感兴趣的朋友。
后面我也会继续拆更多 真正"能用"的 AI 新东西。
AI知识星球:公众号对话框回复"加入社群",即可自行获取(注:是对话框发送,不是在留言区)
想把AI真正用起来,而不是只停留在资讯?
来【写新AI实战圈】,我们每天都在做实战项目:
从ComfyUI、Agent落地到AI变现,全程案例+工具交付。
和一群真正在用AI赚钱的人,一起冲。