2025年9月22日星期一

实测可灵AI的新视频模型,它生成的动作戏酷到封神。

你可以永远相信可灵

可灵2.5,来了。
不仅已经对可灵的超级创作者们正式进行灰度内测,还在这个周末,登上了釜山国际电影节。
图片
我其实已经很久很久没做过小片子了,在前几天拿到可灵2.5的体验资格以后,试了一下,居然,又激起了我的一些创作欲望。
就,我自己是非常喜欢科幻、非常喜欢动作、也非常喜欢一些张力很足的动作戏的。
这些,是过往几乎所有的AI视频模型,都不太行的东西。
但,可灵2.5,不说媲美那种动作大片,但是,还是把AI视频在动作和表演上,又拉到了一个新的高度。
我也花了一整天的时间,用可灵2.5,手搓了一个AI版《速度与激情》,做了一个小片子,更直观的感受一下,可灵2.5在动作戏上的实力。
这里面可以说是集齐了我从十五岁到现在喜欢的所有视觉效果,肾上腺素飙升的追车战,经费燃烧的爆炸大场面,拳拳到肉的打戏,超级酷炫的漂移,等等等。
而这些效果,现在,可灵能以一己之力,给我都实现了,如果在24年,这就是不可能想象的。。。
从这个小片子,大家应该就能感受到,可灵2.5的能力圈了。
我把他总结成两块:
运动的超进化,表演的超进化。
一块一块来说。
一.运动的超进化

先用一个case,让你们直观感受一下可灵2.5的进步到底有多大。

提示词:电影大片风格,一个身穿黑衣,头戴面具的金发女特工破窗而出,借助升降绳迅速滑落在地,然后飞速跑到准备好的摩托车旁,镜头跟随女特工运动。然后女特工跨上摩托车,在街道上飞驰,周围的景物因高速运动而动态模糊,采用令人眩晕的高速镜头,低机位拍摄,突出女特工的速度感和力量感。

可灵2.5,非常丝滑地衔接了下落、奔跑、骑摩托几个动作,最后飞驰而去。

还顾及到了破窗时玻璃渣散落,落地时蹲一下缓冲,这种极具真实感的细节。

整个看下来真的很爽。
图片
而可灵2.1,只能保持人物基本不崩坏,但所有与环境交互的细节,全都糊掉了。
下降到一半绳子不知所踪,说好的高空速降变成了一楼跳窗,摩托车凭空出现在大马路上,跨上摩托的动作也是错的。
图片
再来看一个栗子。

提示词:霓虹都市背景,车辆爆炸,火光四起,黑衣特工从车中飞跃而出,翻滚落地,然后迅速爬起,左手右手同时举枪开火,镜头跟随特工运动,最后环绕特工360度旋转。

可灵2.5就一个字,稳。人物的动作稳,运镜也稳。

图片
而可灵2.1看起来,就有种很忙、但不知在忙什么的感觉。
图片
再来看一个跑酷的case。

提示词:镜头高速跟随,一个机甲在霓虹闪烁的赛博都市楼顶跑酷,灵活翻越金属栏杆,在大楼之间跨越,动作迅捷流畅。

可灵2.5的机器人跑酷过程中的动作和交互,相当真实。

甚至完全不需要做首尾帧,只要输入提示词,它就可以自动给你补全所有运动画面。

直接靠文生视频能达到这样的效果,我真的跪了。

图片

而这是可灵2.1,会不受重力控制地,逐渐飞天。
图片
这么看下来,你们应该知道,可灵2.5的运动能力相比2.1到底提升多少了。
再来欣赏几个可灵2.5跑出来的case。
我真的很喜欢这个跑酷的感觉,机器人动作和镜头运动配合得特别好。
图片

还有这个第一视角跟随镜头,我在提示词里让它猛然加速,它真的做出了那种急迫感。

提示词:他跨上最后一级台阶冲出地铁口,逆光里捕到前方那道模糊人影正要拐走,他猛地加速追过去,镜头跟随。

图片
让可灵2.5生成各种运动镜头,效果也贼好。
让它滑雪,它给你来套空翻,还会摸雪,呲雪墙,耍酷耍得停不下来。
图片
玩滑板速降,效果几乎可以媲美《白日梦想家》原片。
图片
打篮球,投篮已经是小case了,直接给你来场篮球赛。
图片
还可以飙车。
图片
在废土世界开装甲车。
图片
在陌生的星球上开飞行器。
图片
满足各种奇幻脑洞也不在话下。
和小鹿一起闯进魔法森林。

走在路上突然被吸入时空圆环。

二.表演的超进化

之前的可灵2.1不是不能做表情,而是表情做的不够准确。

拿下面这个case来举例。

提示词:他眉心忽然锁死、眼神由散到准、然后下一秒对着电话怒吼,随后愤怒的挂断电话,随后用手搓着自己脸,告诉自己要冷静。

男人有一个从愤怒到克制的过程,可灵2.5比较自然地完成了这个转变。

图片
而可灵2.1,基本就是一个全程超雄的状态。
用稍微专业点的话来说就是,表演没层次。
图片
下面这一组对比也很明显。

提示词:女人暗中观察着自己的杀父仇人,带着浓浓的的恨意,镜头推进到女人的脸部特写,女主感觉对方已经在自己的掌握之中,马上就要复仇成功,脸上露出淡淡的笑意。

女主是一个躲在暗处、胜券在握的杀手,她的笑应该是淡淡的,不动声色的,但给人一种不寒而栗的感觉。

可灵2.5这个阴恻恻的笑,就很对味。

图片
而可灵2.1,我怀疑它没理解淡淡的笑这四个字,牙花子都笑出来了。
这怕是还没复仇成功,自己就先被仇人发现了。
图片
除了表情做得太过之外,表情太粗糙也是一个问题。
拿这个拳击手的例子来说。
提示词:克林顿伊斯特伍德风格,一名拳击手被击倒在地,镜头360度旋转,定格在拳击手的脸部特写镜头,他满脸伤痕,晕眩,疲惫,近乎绝望。但是,他深吸了一口气,咬紧牙关,用手撑着颤抖的身体,一点点站了起来。晃动镜头跟随。眼神变得坚定,带着不屈的力量。
可灵2.5这里,你能感受到这个拳击手非常虚弱,但还是挣扎着站起来,继续应战。
图片
而可灵2.1,怎么说呢,感觉就是一个傻大个,噌的一下站起来了。
太直白了,感受不到情绪。
图片
看到这里你们应该也能感受到,可灵2.5对于不同层次情绪的理解和表达,有怎样的提升了。
再来看几个case。
好莱坞老电影,两个欢喜冤家斗嘴,女主这个无语的翻白眼,还有男主手足无措的样子,太真实了,就很搞笑。
图片
剧烈的爆炸映亮了女主的脸,女主的爱人和家园都毁掉了,但她不能回头,必须继续战斗。
图片
受了重伤的男人捂着自己的胸口,大口吸气,强撑着不让自己倒下。
图片
古灵精怪的女孩看着摄像头灿烂一笑,却发现对面的人没有回应,有点失落地收起了自己的表情。
图片
李白在白帝城得知了自己被赦免的喜讯,又哭又笑,喜极而泣。
图片
女孩在幻境里看到了平生从未见过的奇观,她目不转睛地看着,悲欣交集。
图片
一个男人刚刚得知自己母亲的死讯,在无人处悲恸哭泣。
图片
写在最后
总结一下可灵这次更新。
运动能力、表演能力毫无疑问地又卷上了一个新高度。
除此之外,文生视频的能力也提升了一大截,我这些case里面有至少一半,都是只靠提示词生成出来的。
在理解能力上有巨幅提升,很多以前理解不了,因果关系和细节不到位的问题,都能解决了。
不愧我之前叫它,人民的可灵。
其实我觉得,可灵的野心,一直都是让更多年轻的创作者,拥有更多属于自己的创作自由,不需要被团队和资金所束缚,也能在专业领域获得自己的一席之地。
让我们,期待可灵的下一次进化。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克、水杉

>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com

没有评论:

发表评论

港大和字节携手打造WorldWeaver:以统一建模方案整合感知条件,为长视频生成领域带来质量与一致性双重飞跃。

生成视频建模虽有进展,但长序列结构与时间一致性保障仍是难题。现有依赖 RGB 信号的方法,会使物体结构和运动在长时间累积误差。 生成视频建模虽有进展,但长序列结构与时间一致性保障仍是难题。现有依赖 RGB 信号的方法,会使物体结构和运动在长时间累积误差。为此港大和字节提出了一...