2026年5月21日星期四

TapNow世界模型实测:不会建模也能生成可漫游3D场景,零门槛截图做视频

TapNow平台基于3D高斯溅射技术,让用户从文字生成图片后一键转为可自由移动的3D世界。无需建模技能,支持多角度截图并生成画面一致的视频,内置打光调节、素材库和视频拼接功能。适合AI视频创作者、零基础用户尝试。平台正举办“一万个平行宇宙”全球AI影视大赛,90秒以上预告片可角逐300万奖金池。

Tags:


最近这段时间,我一直都有听到一个词「世界模型

我看了不少相关视频了,也知道「世界模型」是怎么一回事儿,不过就是没机会体验

今天,我终于有机会体验了---

效果,让我有点震惊

我是在TapNow上体验的,这可能是目前少数能玩到世界模型的平台了。

下面我从头讲讲这个东西到底是啥,以及我是怎么玩的。

世界模型到底是啥

在开始前,先给小伙伴们科普下什么是世界模型。

最近这个词突然火了,李飞飞的WorldLabs、腾讯HYWorld2.0、Google的Genie3都在抢这个赛道。

它解决的是一个很根本的问题:传统AI视频是逐帧猜画面的,帧和帧之间没有共享的空间信息,所以换个角度就穿帮。

世界模型的思路不一样——先建一个3D空间,再从里面取景。 底层用的是一种叫3D高斯溅射的技术,你可以理解为用几百万个"光点"融合出一个3D场景,比传统建模更快更自然。

因为空间是同一个,你在里面怎么换角度,画面都是一致的。

图片

道理不复杂,但真正做成普通人能用的创作工具的,目前我试下来,TapNow是最早的一批。

上手体验,比想象中简单

操作不复杂。在TapNow上,选「3D世界」,或者从一张图片节点拖出来选「3D世界」,就能进去。

图片

不需要会3D建模,不需要装什么插件,进去之后鼠标拖一拖就能换角度。

选好角度之后截图,截出来的图直接拿去生成视频。因为所有截图都来自同一个3D空间,生成的视频画面自然是一致的。

相当于你有了一个虚拟片场——场景搭好了,你只管选机位。

图片

我用AI造了一个奇幻世界

光说不练没意思,我决定搞个大的。

我写了一段很长的提示词,要求生成一个写实风格的高奇幻开放世界。

A photorealistic high fantasy open world inspired by World of Warcraft and The Lord of the Rings. A majestic white stone castle with tall spires on a sunlit hilltop, surrounded by vibrant green meadows and crystal clear rivers. Bright blue sky with soft white clouds, warm sunlight flooding the scene. Colorful wildflowers along a cobblestone path, lush trees with golden and green leaves, waterfalls sparkling in the distance. Bright, vivid colors, noon sunlight, no shadows on faces, Unreal Engine 5 quality, ultra realistic, 8K. No people.
图片

我在这个例子里面,选择了 合适的模型,连续生成 4 张图片(多点选择机会)

最后,我选的是下面这张图片

图片

图片生成之后,我选择了3D世界的节点

图片

点之前我还在想,这能有多3D?

点进去之后,愣住了。

周围都是3D的场景,最关键的是,我可以在里面移动。

不是那种固定视角转一转的效果,是真的能在空间里走来走去,跟玩游戏一样。

说实话这个效果超出我的预期了。一张图,变成了一个我能走进去的世界。

现代豪宅的完整工作流

奇幻世界够震撼,但我还想试试更实际的场景。

这次我换了一个室内场景的提示词:一个宽敞的现代豪华客厅,落地窗外是日落时分的城市天际线,极简设计,大理石地面,奶白色L型大沙发。

图片

图出来之后,直接丢进世界模型。

这次我重点走了一遍完整的创作流程:

生图 → 进入3D世界 → 选不同角度截图 → 生成视频

图片

在 世界模型内,我们可以直接选择不同方向的图片分图,点击后,直接应用到画布

然后我们在画布里面,就可以看到四个方向的图了

图片

这四个图,光照、场景,都保持了完美的一致性。

我发现世界模型给的图有一张有点模糊,就是那张「Front」的图片,于是,我就用TapNow的图片增强功能,让整个图片更清晰了

图片

相对原来的图片来说,看起来清晰了不少

图片

走完基本流程之后,我又试了试TapNow的各种编辑功能,这块值得单独说说。

打光调整——生成视频之后觉得光线不对?可以直接在编辑器里改。不用重新生成,拖一拖就能调整光源方向和强度。

图片

多角度切换——在3D世界里你选好的那些机位,可以直接在编辑器里切换。想从沙发视角切到窗边视角,不用重新进3D世界截图,编辑器里就能搞定。


图片

素材库——TapNow自带一个资产库,我们可以把创建好的素材直接保存到这里,作为自己的资产,下次再用。

图片

这三个功能加在一起,基本上就是一个完整的视频后期工具了。而且整个流程都在同一个画布上完成,从生图到建3D世界到剪辑出片,不用在不同软件之间来回跳。

说到最终出片,不得不说说这个playlist功能了,我们生成的单视频可以直接添加到列表里面,可以在里面很方便的拼接和下载合并的视频

图片

我们生成的作品几乎都是15秒左右的,有了这个功能就不需要到其他编辑软件进行剪辑了。

可以在新建的时候选择播放列表就可以了

图片


最后给大家看看我生成的一个视角的视频

这个视频可能没有别人的作品那么惊艳,没有啥剧情

但这个视频,是从原始的照片够贱的3D世界模型中,提取的一个场景,然后根据这个场景构建的视频,光照,环境主题一致性都比较好。

TapTV社区,创作过程也能看

这个社区有个有意思的设计,你上传作品的同时,创作的全流程也会被记录下来。别人点进去不只是看成品,还能看到你是怎么一步步做出来的,甚至可以一键复刻你的工作流。

就比如,我很喜欢里面一个AI短片,叫做《迫降》。先给大家欣赏下这个短片

这个是TapTV社区的一个叫KUNC的大神的作品。


我就直接复制了整个工作流,可以看到大神是怎么一步一步做出来的。

图片

这个工作挺复杂的

图片

优秀的作品,果然不是一下子就能完成的。

对创作者来说,这等于是一边展示作品,一边积累教程内容。

图片
传送门如下:
图片

最后说一嘴大赛的事

TapNow在办一个「一万个平行宇宙」全球AI影视创作大赛,规则是用世界模型做一个你自己的预告片,题材不限,90秒以上视频就可以。

总奖金池300w,评委阵容也是顶级的。优质的作品还有ip孵化的机会,全程给积分,有实力的小伙伴建议去看看

图片


感兴趣的,可以去进竞技场看看

图片

另外,想体验世界模型的,可以去TapNow看看:

图片

觉得有用的话,转发给你身边也在折腾AI视频的朋友。

你有试过用AI做视频吗?评论区聊聊。


没有评论:

发表评论

腾讯ARC联合清华Pixal3D:单图生成重建级精度3D模型(开源)

Pixal3D由腾讯ARC与清华大学联合提出,论文被SIGGRAPH 2026收录。该技术实现像素级对齐、重建级精度的单图生成3D,保真度超越TRELLIS等主流模型。已开源代码并上线Hugging Face在线试用,无需专业建模技能即可生成高精度3D资产,适用于设计、游戏、元宇...