点击上方卡片关注 不要错过精彩文章📌持续更新有关Agent的最新搭建思路和工作流分享,希望能给您带来帮助,点
点击上方卡片关注 不要错过精彩文章
持续更新有关Agent的最新搭建思路和工作流分享,希望能给您带来帮助,点一点上方的🔵蓝色小字关注,你的支持是我最大的动力!🙏谢谢啦!🌟"
大家好!我是唐舰长🙏
时间过的真快,一晃火山Force原动力大会又开启了,这已经算是舰长在AI行业里经历的第二个火山大会
去年的火山中和Coze官方的互动比较多,但今天看了很多新产品的发布,尤其是对视频模型Seedance 1.5 Pro 非常感兴趣。
毕竟现在绘图模型的能力已经非常强了,而视频模型还是非常平淡。尤其前段时间的sora让我们对视频的能力又有了非常多的期待。
在前几天的万相2.6 模型也有各大博主的测评,但舰长知道字节的Seedance 1.5 Pro模型即将发布,就为了这一次去做一个相对测试,看哪个模型更适合什么样的场景
万相2.6使用地址:
https://tongyi.aliyun.com/wan/generate/video/starring-roles?model=wan2.6
豆包Seedance 1.5 Pro使用地址:(即梦)
https://jimeng.jianying.com/ai-tool/generate
在使用上,万相赠送的积分足够进行多轮使用和测试,而豆包Seedance 1.5 Pro的使用就显得尤为不够
在即梦中非会员每日赠送60到100左右的积分,而生成一次视频就需要消耗50点积分,等于大部分未充值会员的小伙伴都用不了,不想在即梦充值会员的,还可以去火山的方舟大模型平台上去使用:但5s的视频需要1块钱
https://console.volcengine.com/ark/region:ark+cn-beijing/experience/vision?modelId=doubao-seedance-1-5-pro-251215&tab=GenVideo
无论是sora、万相2.6、以及刚发布的Seedance 1.5 Pro,本质上最吸引的还是音画同步,画面和音频能对上,这也是当下视频模型的最高级能力。
注:以下案例均为一次生成,未进行抽卡
语言与中文方言训练提示词
提示词:
生成一个男人,在繁华热闹的大街上面对着镜头边走边用粤语说:"欢迎来到中国,我亲爱的朋友,中国是一个美丽且富饶的国家"
Seedance 1.5 Pro:
通义万相2.6
看了这两个视频,豆包的方言明显略好,当然不会讲粤语的人会觉得不错,真真会讲的也能听出一些不对,但总的算起来,起码能说出来。
通义的视频模型舰长生成了三次,还是普通话;但通义的画面明显更真实一点。
多语言测试提示词
提示词:
采用哆啦A梦的声线,用日语(中文)说"我回来了,大雄"
参考图片:
Seedance 1.5 Pro:的日语和中文版
通义万相
这个板块确实是比较有趣了,万相不给生成,毕竟涉及到版权问题
Seedance 1.5 Pro的音频参考确实不错,比较这个哆啦A梦的中文汉化版确实是这个声音,非常相似;也算是一个特色了。
萌宠视频提示词
众所周知(舰长团队测试过,用小猫起号7天一万粉丝),毕竟现在有个玩笑话,挣男人钱不如挣宠物钱,所以不管是流量还是变现都来得快
提示词:
镜头怼脸拍,柔光灯下,一只大脸盘子的狸花猫正襟危坐,胸口别着个只有指甲盖大小的迷你麦克风。一脸严肃地盯着面前还在冒热气的香肠。它先是凑近了嗅一嗅,胡须随着呼吸高频颤动,然后歪着头,拿起香肠"啊呜"一口咬住酥脆的肠衣。麦克风里瞬间传来清晰放大的"咔滋咔滋"脆响,紧接着是湿漉漉的"吧唧吧唧"咀嚼音。眼神霸气地盯着镜头,说:"香香脆脆真好吃"
Seedance 1.5 Pro
通义万相
这两个视频都是一次生成,未抽卡。在这个案例中就可以明显看出两个模型的优缺点
Seedance 1.5 Pro的主体形象动作、表情非常和谐,但物品的真实性比较差:"猫都有齐牙了,香肠里面还有一层。说实话这种烤肠,在真实生活非常少见。"而通义万相的则是相反,香肠还有猫和牙齿都比较正常、真实;但画面表情动作就略显空假。
多镜头叙事提示词
随着sora2的爆火,AI短剧开始大面积推广,不少人通过AI短剧实现了导演梦,那么让我们来对比下两款产品在多镜头叙事方面的能力如何吧
提示词:
第1个镜头|0-4秒:夜晚,城市屋顶。男子半蹲在通风管旁,低头看着手腕上的手表,扫了一眼时间后,他起身、整理衣领、确认随身装备,随后沿屋顶边缘低姿态前行 第2个镜头|4-7秒:固定机位,在室内走廊。男子贴墙小心移动,在拐角处骤然停下,侧身探头观察,抬手示意"等待",随后一个利落的转身贴着墙面穿过门口,全程无声。 第3个镜头|7-12秒:外部逃离路线。男子快步穿过狭窄通道,翻越围栏落入下层平台,几乎不停顿地继续前 注意:各个镜头间要衔接自然,人物保持一致
Seedance 1.5 Pro:
通义万相:
通义这边显示有内容不符合平台规则,生成不出来,我们这边就先放一放
虽然舰长没有成功生成,确实对通义的词汇不太清楚,但舰长在别的博主那边看到的这个案例并进行测试
在别的博主那里的效果视频:尤其在男人停顿观察的时候,非常的乱,但画面非常清晰真实
这一个案例豆包的视频模型算是做的真好,从多个细节可以看出
停顿、抬手示意"等待"、观察都做得非常完美,除了清晰度,普通人手搓大片真很接近了。
镜头控制能力提示词
提示词
在一个美术馆走廊中,镜头聚焦在走廊尽头一位害怕的日本女学生面部,随着时间推移,她脸部在画面中的比例完全保持静止不变,但她身后的长廊背景却产生强烈的空间压缩感,远处的门窗仿佛瞬间拉近到了她脑后,走廊两侧画作以一种诡异的视觉错觉在极短时间内改变了排列密度,制造出强烈的眩晕与压迫感。
Seedance 1.5 Pro:
通义万相:
行吧,通义还是比较遵循提示词的,
这个案例,舰长就不多说了,起码Seedance 1.5 Pro音效确实做得挺不错的
情感表现力提示词
提示词
开心地(震惊地/害怕地)说:"你还在啊"
参考图:
Seedance 1.5 Pro:(开心版)
通义万相:(开心版)
Seedance 1.5 Pro对于人物的参考和最终生成的效果确实优秀于通义,好似通义模型就是在训练真实性和合理性。对于音效的配置也是Seedance 1.5 Pro更佳。
在这几个方面的测评,案例可能会偏向Seedance 1.5 Pro,因为万相在目前其他视频做表现是比较好的,但舰长的测试下能力还是略缺,也有可能是这些豆包擅长的点,万相不擅长。毕竟万相更能做出专业一点、真实一点。
在选择使用的时候,如果具有专业能力的用通义去做是没有什么问题的,但想要充满惊喜,有模型主动思考,用Seedance 1.5 Pro是比较好的。
写在最后
看完这轮测评,舰长最大的感受是:AI视频的春天真的来了!
从上个月Sora的惊艳亮相,到这周的万相2.6和Seedance 1.5 Pro的正面交锋,我们见证的不仅是技术的迭代,更是创作门槛的极速降低。
一个问题抛给大家: 如果给你充足的积分/额度,你会用AI视频模型做什么?
做自媒体短视频涨粉?
实现自己的短剧导演梦?
批量生产萌宠治愈内容?
还是纯粹玩创意脑洞?
关注公众号并添加舰长微信,领取智能体学习资料,并参与智能体技术直播讲解
另外非常欢迎大家加入[唐舰长AI落地智能体交流群],主要交流群每周都会进行公益直播教大家搭建AI智能体工作流
没有评论:
发表评论