AI I024: 微软发布 TRELLIS。2——40 亿参数图像到 3D 生成模型

2025年12月22日星期一

微软发布 TRELLIS。2——40 亿参数图像到 3D 生成模型

微软突然放大招：一张图，直接生成可用 3D 模型40 亿参数，TRELLIS.2 把"图生 3D"推到新阶段如

https://www.3daistudio.com/_next/image?q=90&url=%2FNewLandingContent%2FTextureGen%2FTextureGen_VAR3.png&w=1920&utm_source=chatgpt.com

https://opengraph.githubassets.com/4cdc63a62c4845e00784c07b9a08113870723ada9516f0f85efc877575bc8d65/microsoft/TRELLIS.2?utm_source=chatgpt.com

微软突然放大招：一张图，直接生成可用 3D 模型

40 亿参数，TRELLIS.2 把"图生 3D"推到新阶段

如果你最近有关注 AI 圈，会明显感觉到一件事：
2D 生成已经卷到极致，真正的战场，开始转向 3D。

就在这两天，微软悄悄放出了一个重量级项目——
TRELLIS.2，一个 40 亿参数的 Image-to-3D 生成模型。

不是"研究玩具"，而是真的能直接产出可用 3D 资产那种。

一句话先给结论

TRELLIS.2 的目标不是"看起来像 3D"，而是：
让一张图，直接变成能进引擎、能打光、能渲染的 3D 模型。

这也是它和很多"图生 3D 项目"最大的区别。

为什么这次很多人会认真看它？

先看几个关键点👇

✅ 单张图片 → 3D 网格 + PBR 材质
✅ 40 亿参数大模型
✅ 最高支持 1536³ 级别 3D 分辨率
✅ 微软官方开源
✅ 不是 NeRF，而是直接 Mesh + 材质

一句话：
它不是为了"演示"，而是冲着"生产"去的。

先看效果：不是"假 3D"，而是真资产

https://miro.medium.com/v2/resize%3Afit%3A1400/1%2AqRu7pZg0Ik0uY8jVqnV4VA.jpeg?utm_source=chatgpt.com

https://microsoft.github.io/TRELLIS.2/assets/cover.webp?utm_source=chatgpt.com

从官方示例可以看到几个细节：

生成的是完整网格（Mesh）
同时带有 Base Color / Roughness / Metallic / Opacity 等 PBR 材质
模型不是"糊在一起"的体积云，而是能进 Blender / Unity / UE 的那种

这一步，其实已经帮很多人省掉了整条中间流程。

TRELLIS.2 到底做对了什么？

如果只说"参数多"，那没意义。
它真正厉害的，是底层思路。

1️⃣ 它抛弃了传统 NeRF / SDF 那套

过去很多图生 3D 项目，问题都出在这：

表面一堆
结构封闭
转 Mesh 特别痛苦
后处理复杂到怀疑人生

TRELLIS.2 直接换了一条路。

2️⃣ 一个很关键的概念：O-Voxel

https://microsoft.github.io/TRELLIS.2/assets/method/scvae.png?utm_source=chatgpt.com

官方提出了一种新的表示方式，叫 O-Voxel（Omni-Voxel）。

你可以简单理解为：

不是"隐式场"
而是同时编码几何 + 外观的稀疏 3D 表示
对复杂拓扑（开口结构、非流形）更友好

这一步，直接解决了很多 3D 生成模型**"看着像，但用不了"**的问题。

3️⃣ 原生 3D VAE，把 3D 压进模型

TRELLIS.2 使用了 原生 3D VAE：

对 3D 空间做 16× 压缩
让 40 亿参数真正"装得下"高分辨率 3D
推理速度也能接受

这也是为什么它能做到 1536³ 这种级别。

性能这块，微软给的数据也很硬

https://cdn.prod.website-files.com/64128071fa22275256c1c222/65fa581d046fc07020817ac9_LLMs%20%282%29.png?utm_source=chatgpt.com

https://cdn.mos.cms.futurecdn.net/6VQWSgcKu7HCfYbknYuvnk.png?utm_source=chatgpt.com

在 H100 上的官方数据（形状 + 材质）：

512³：约 3 秒
1024³：约 17 秒
1536³：约 1 分钟

放在 3D 领域，这是一个非常能打的数字。

那它能用来干什么？

说几个现实场景，你就懂它的价值了：

🎮 游戏资产生成（角色、道具、环境物件）
🛒 电商 3D 商品建模
🎥 影视 / 动画概念资产
🧠 AI 3D 内容管线的前端生成器
🤖 后续接入 ComfyUI / 自动化工作流

尤其是电商 + 游戏 + AI 生成内容这条线，空间非常大。

当然，它也不是完美的

官方也说得很实在：

❗ 生成的 Mesh 可能有小孔洞
❗ 严格 3D 打印场景需要后处理
❗ 审美不是重点，偏"工程资产"

但说句实话：
能直接出可用 3D，本身就已经跨过了 80% 的门槛。

普通人该怎么看 TRELLIS.2？

我的判断很简单：

TRELLIS.2 不是终点，但它在"图 → 3D 资产"这条路上，
给了一个非常清晰、可复制、可工程化的答案。

而且最关键的一点是——
它是微软开源的。

这两年 AI 最大的变化，不是模型名字换了多少个，
而是"能不能真正走进生产流程"。

TRELLIS.2 至少证明了一件事：
3D，不再只是少数人的专业门槛，而正在被模型一点点拆平。

如果你觉得这篇文章对你有启发👇
欢迎点赞、关注、转发给对 AI / 3D / ComfyUI 感兴趣的朋友。
后面我也会继续拆更多 真正"能用"的 AI 新东西。

AI知识星球：公众号对话框回复"加入社群"，即可自行获取（注：是对话框发送，不是在留言区）

想把AI真正用起来，而不是只停留在资讯？
来【写新AI实战圈】，我们每天都在做实战项目：
从ComfyUI、Agent落地到AI变现，全程案例+工具交付。
和一群真正在用AI赚钱的人，一起冲。

没有评论:

发表评论

订阅：博文评论 (Atom)

AI I024

2025年12月22日星期一

微软发布 TRELLIS。2——40 亿参数图像到 3D 生成模型

微软突然放大招：一张图，直接生成可用 3D 模型40 亿参数，TRELLIS.2 把"图生 3D"推到新阶段如

微软突然放大招：一张图，直接生成可用 3D 模型

一句话先给结论

为什么这次很多人会认真看它？

先看效果：不是"假 3D"，而是真资产

TRELLIS.2 到底做对了什么？

1️⃣ 它抛弃了传统 NeRF / SDF 那套

2️⃣ 一个很关键的概念：O-Voxel

3️⃣ 原生 3D VAE，把 3D 压进模型

性能这块，微软给的数据也很硬

那它能用来干什么？

当然，它也不是完美的

普通人该怎么看 TRELLIS.2？

没有评论:

发表评论

盘点本周14个热门GitHub开源项目涵盖AI工具效率神器免费编程

标签

2025年12月22日星期一

微软发布 TRELLIS。2——40 亿参数图像到 3D 生成模型

微软突然放大招：一张图，直接生成可用 3D 模型40 亿参数，TRELLIS.2 把"图生 3D"推到新阶段如

微软突然放大招：一张图，直接生成可用 3D 模型

一句话先给结论

为什么这次很多人会认真看它？

先看效果：不是"假 3D"，而是真资产

TRELLIS.2 到底做对了什么？

1️⃣ 它抛弃了传统 NeRF / SDF 那套

2️⃣ 一个很关键的概念：O-Voxel

3️⃣ 原生 3D VAE，把 3D 压进模型

性能这块，微软给的数据也很硬

那它能用来干什么？

当然，它也不是完美的

普通人该怎么看 TRELLIS.2？

没有评论:

发表评论

盘点本周14个热门GitHub开源项目 涵盖AI工具效率神器免费编程

盘点本周14个热门GitHub开源项目涵盖AI工具效率神器免费编程