2025年12月22日星期一

微软发布 TRELLIS。2——40 亿参数图像到 3D 生成模型

微软突然放大招:一张图,直接生成可用 3D 模型40 亿参数,TRELLIS.2 把"图生 3D"推到新阶段如

https://www.3daistudio.com/_next/image?q=90&url=%2FNewLandingContent%2FTextureGen%2FTextureGen_VAR3.png&w=1920&utm_source=chatgpt.com
https://opengraph.githubassets.com/4cdc63a62c4845e00784c07b9a08113870723ada9516f0f85efc877575bc8d65/microsoft/TRELLIS.2?utm_source=chatgpt.com


图片


微软突然放大招:一张图,直接生成可用 3D 模型

40 亿参数,TRELLIS.2 把"图生 3D"推到新阶段

如果你最近有关注 AI 圈,会明显感觉到一件事:
2D 生成已经卷到极致,真正的战场,开始转向 3D。

就在这两天,微软悄悄放出了一个重量级项目——
TRELLIS.2,一个 40 亿参数的 Image-to-3D 生成模型。

不是"研究玩具",而是真的能直接产出可用 3D 资产那种。


一句话先给结论

TRELLIS.2 的目标不是"看起来像 3D",而是:
让一张图,直接变成能进引擎、能打光、能渲染的 3D 模型。

这也是它和很多"图生 3D 项目"最大的区别。


为什么这次很多人会认真看它?

先看几个关键点👇

  • ✅ 单张图片 → 3D 网格 + PBR 材质

  • ✅ 40 亿参数大模型

  • ✅ 最高支持 1536³ 级别 3D 分辨率

  • ✅ 微软官方开源

  • ✅ 不是 NeRF,而是直接 Mesh + 材质

一句话:
它不是为了"演示",而是冲着"生产"去的。


先看效果:不是"假 3D",而是真资产

https://miro.medium.com/v2/resize%3Afit%3A1400/1%2AqRu7pZg0Ik0uY8jVqnV4VA.jpeg?utm_source=chatgpt.com

https://microsoft.github.io/TRELLIS.2/assets/cover.webp?utm_source=chatgpt.com

从官方示例可以看到几个细节:

  • 生成的是完整网格(Mesh)

  • 同时带有 Base Color / Roughness / Metallic / Opacity 等 PBR 材质

  • 模型不是"糊在一起"的体积云,而是能进 Blender / Unity / UE 的那种

这一步,其实已经帮很多人省掉了整条中间流程。


TRELLIS.2 到底做对了什么?

如果只说"参数多",那没意义。
它真正厉害的,是底层思路。


1️⃣ 它抛弃了传统 NeRF / SDF 那套

过去很多图生 3D 项目,问题都出在这:

  • 表面一堆

  • 结构封闭

  • 转 Mesh 特别痛苦

  • 后处理复杂到怀疑人生

TRELLIS.2 直接换了一条路。


2️⃣ 一个很关键的概念:O-Voxel

https://microsoft.github.io/TRELLIS.2/assets/method/scvae.png?utm_source=chatgpt.com

官方提出了一种新的表示方式,叫 O-Voxel(Omni-Voxel)

你可以简单理解为:

  • 不是"隐式场"

  • 而是同时编码几何 + 外观的稀疏 3D 表示

  • 对复杂拓扑(开口结构、非流形)更友好

这一步,直接解决了很多 3D 生成模型**"看着像,但用不了"**的问题。


3️⃣ 原生 3D VAE,把 3D 压进模型

TRELLIS.2 使用了 原生 3D VAE

  • 对 3D 空间做 16× 压缩

  • 让 40 亿参数真正"装得下"高分辨率 3D

  • 推理速度也能接受

这也是为什么它能做到 1536³ 这种级别。


性能这块,微软给的数据也很硬

https://cdn.prod.website-files.com/64128071fa22275256c1c222/65fa581d046fc07020817ac9_LLMs%20%282%29.png?utm_source=chatgpt.com

https://cdn.mos.cms.futurecdn.net/6VQWSgcKu7HCfYbknYuvnk.png?utm_source=chatgpt.com

在 H100 上的官方数据(形状 + 材质):

  • 512³:约 3 秒

  • 1024³:约 17 秒

  • 1536³:约 1 分钟

放在 3D 领域,这是一个非常能打的数字。


那它能用来干什么?

说几个现实场景,你就懂它的价值了:

  • 🎮 游戏资产生成(角色、道具、环境物件)

  • 🛒 电商 3D 商品建模

  • 🎥 影视 / 动画概念资产

  • 🧠 AI 3D 内容管线的前端生成器

  • 🤖 后续接入 ComfyUI / 自动化工作流

尤其是电商 + 游戏 + AI 生成内容这条线,空间非常大。


当然,它也不是完美的

官方也说得很实在:

  • ❗ 生成的 Mesh 可能有小孔洞

  • ❗ 严格 3D 打印场景需要后处理

  • ❗ 审美不是重点,偏"工程资产"

但说句实话:
能直接出可用 3D,本身就已经跨过了 80% 的门槛。


普通人该怎么看 TRELLIS.2?

我的判断很简单:

TRELLIS.2 不是终点,但它在"图 → 3D 资产"这条路上,
给了一个非常清晰、可复制、可工程化的答案。

而且最关键的一点是——
它是微软开源的。



这两年 AI 最大的变化,不是模型名字换了多少个,
而是"能不能真正走进生产流程"。

TRELLIS.2 至少证明了一件事:
3D,不再只是少数人的专业门槛,而正在被模型一点点拆平。

如果你觉得这篇文章对你有启发👇
欢迎点赞、关注、转发给对 AI / 3D / ComfyUI 感兴趣的朋友。
后面我也会继续拆更多 真正"能用"的 AI 新东西。

AI知识星球:公众号对话框回复"加入社群",即可自行获取(注:是对话框发送,不是在留言区)


想把AI真正用起来,而不是只停留在资讯?
来【写新AI实战圈】,我们每天都在做实战项目:
从ComfyUI、Agent落地到AI变现,全程案例+工具交付。
和一群真正在用AI赚钱的人,一起冲。

图片

没有评论:

发表评论

盘点本周14个热门GitHub开源项目 涵盖AI工具效率神器免费编程

本文盘点了本周GitHub上14个热门开源项目,涵盖微软PowerToys效率工具箱、AI编码Agent费用分析工具agentsview、开源客服系统Chatwoot、免费编程平台freeCodeCamp、AI代码记忆与安全扫描工具,以及LLM推理加速器LMCache等。适合开发...