2026年5月21日星期四

腾讯ARC联合清华Pixal3D:单图生成重建级精度3D模型(开源)

Pixal3D由腾讯ARC与清华大学联合提出,论文被SIGGRAPH 2026收录。该技术实现像素级对齐、重建级精度的单图生成3D,保真度超越TRELLIS等主流模型。已开源代码并上线Hugging Face在线试用,无需专业建模技能即可生成高精度3D资产,适用于设计、游戏、元宇宙等场景。

Tags:

点击下方名片关注AIGC Studio公众号获取最新AI前沿应用/AIGC实践教程
扫描下方二维码,加入AIGC Studio知识星球可以获得最新AI前沿应用/AIGC实践教程/大厂面试经验/算法刷题IT各学科入门到精通学习资料学习/科研/工作/副业,强烈推荐!
图片

最近3D生成模型火得一塌糊涂,TRELLIS、HY3D 这些模型已经能生成相当不错的3D资产了。但有一个核心痛点一直没解决 —— fidelity(保真度)。

什么意思?就是你给一张图,模型生成的3D模型,从原来那个视角看过去,到底像不像原图? 答案是:大部分模型都不太行。因为它们在一个"规范空间"里生成形状,然后用注意力机制把图像信息"注"进去,像素和3D点之间的对应关系是模糊的。

近期,腾讯ARC实验室联合清华大学等机构推出的Pixal3D技术 直接把这个问题干掉了。 它不再在规范空间里生成,而是直接在像素对齐的视角下生成3D,让每个像素都能找到自己对应的3D点。结果?保真度直接逼近3D重建的水平!这不是小改进,这是范式级的飞跃

图片

相关链接

• 在线试用:https://huggingface.co/spaces/TencentARC/Pixal3D

• 开源代码:https://github.com/TencentARC/Pixal3D

• 论文链接:https://arxiv.org/abs/2605.10922

论文介绍

图片

Pixal3D论文《Pixal3D: Pixel-Aligned 3D Generation from Images》已被SIGGRAPH 2026(计算机图形学顶会)收录,由腾讯ARC实验室、清华大学团队联合完成,聚焦图像生成3D的像素保真度核心痛点。

论文指出,现有3D生成方法多在规范空间建模,通过注意力机制注入图像特征,导致2D-3D对应关系模糊,细节易失真。为此,研究团队借鉴3D重建思路,设计像素反向投影条件机制,将多尺度图像特征显式映射到3D特征体,从根源消除对应歧义。

实验证明,Pixal3D不仅可生成高质量3D资产,更将像素保真度提升至重建级别,且能自然适配多视图生成与场景合成任务,兼具创新性与实用性。

方法概述

Pixal3D核心由三大模块构成,形成完整像素对齐3D生成链路,全程以“像素对齐”为核心,兼顾质量与效率:

1.  像素对齐结构化隐表示学习:通过稀疏VAE将像素对齐的稀疏符号距离函数(SDF)压缩为高效稀疏隐变量,平衡精度与效率;

2.  图像反向投影条件器:提取图像全局与局部特征,经反向投影将2D特征升维为3D特征体,建立明确的像素-3D关联,彻底解决对应模糊问题;

3.  两阶段生成流程:先基于密集特征体预测粗粒度3D结构,再通过稀疏特征体细化几何细节,最终解码生成高精度网格。

实验结果

实验对比了Pixal3D与主流模型TRELLIS 2、HY3D V3.1,从四大维度展现碾压级优势:

图片
图片
图片
图片

✅ 像素保真度:生成的3D资产与输入图像像素对齐度显著领先,精准还原纹理细节(如插画线条、物体花纹);

几何细节:结构无扭曲、无缺失,边缘锐利、层次清晰,还原物体真实形态;

✅ 多场景适配:在复杂物体、日常场景、艺术风格等场景中均稳定输出高质量结果;

✅ 拓展能力:支持多视图生成(融合多视角特征,一致性更强)、场景合成(生成物体分离、细节完整的3D场景)。

结论

Pixal3D的问世,为图像生成3D领域提供了像素对齐的全新技术范式,有效解决了长期存在的2D-3D对应模糊、细节失真难题。

该技术最大的价值的是:大幅降低高精度3D资产的生成门槛,无需专业建模技能,单张图像即可生成可用3D模型。

作为腾讯ARC实验室在AIGC 3D领域的重磅成果,Pixal3D开源后将助力3D设计、游戏开发、元宇宙场景构建、数字藏品等多个领域,推动AIGC从2D图像向3D空间的深度落地,未来有望成为3D AIGC领域的核心基础技术之一!

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

图片

没有评论:

发表评论

腾讯ARC联合清华Pixal3D:单图生成重建级精度3D模型(开源)

Pixal3D由腾讯ARC与清华大学联合提出,论文被SIGGRAPH 2026收录。该技术实现像素级对齐、重建级精度的单图生成3D,保真度超越TRELLIS等主流模型。已开源代码并上线Hugging Face在线试用,无需专业建模技能即可生成高精度3D资产,适用于设计、游戏、元宇...