2025年1月23日星期四

可灵上线多图参考功能,电商或是最值得期待的场景

昨天可灵上线了多图参考功能,今天测试了一下,总体感觉有一定的可玩性,但是实用性貌似还不是很高~ 下面是我的一些测试
一开始想到的就是跨场景的应用,于是用黑神话的Lora生成了一张悟空的图片,然后找了一张青岛五月的风雕塑图片,使用提示词"悟空跑向红色的雕塑"

虽然内容图片的内容是融合到一起,但是雕塑变形严重,而且这也明显不是"跑向",当然这可能也跟图片初始的朝向有些关系,如果提示词使用转身跑向或许会有效果。如下面这个机甲转身的场景。

然后想到前段时间比较火的巨物玩法,之前流程是使用谷歌的whisk把图片合成,然后再图生视频。这次直接从网上找了两张图片,使用提示词"巨型哪吒躺在古罗马斗兽场上面"。虽然主体是躺了上去,但是并没有体现出巨物感。

然后又尝试了下双主体的对打效果,使用提示词"一个穿着黄色衣服的女人和一个穿着青色衣服的男人,拿着剑正在对打,武侠片"
虽然画面有些感觉,但是质量还是差了些,女主的武器都没了,好在服饰外观保持的还算可以。

最后尝试了下模特换装应用,生成了一张裙子的图片,然后主体只框选了人脸,提示词"美女穿着红色的连衣裙站在展台上,作揖给大家拜年"

打眼一看以为找到了应用场景,裙子正面还原的貌似很不错,甚至腰带的花都很相近,但仔细看还是有很多细节问题,甚至提示词都没有遵循,再继续尝试一组。
这次从京东找了一套衣服,把服装的正反面都上传上去了,发现效果原来也是要靠抽卡

还尝试了一组,介绍产品"一个美女手里拿着一瓶洗发水,站在在一个绿色植物背景的展台上介绍着洗发水的功效"

发现洗发水的比例明显有问题,比例协调问题也是多图不如合成一张图的主要缺点,当然一些不太容易融合的图片还是可以尝试多图参考来试试的,其实指定主体也算是可灵给出的保持主体一致性的方法,大家有兴趣的不妨也去试试。而且这只是多图参考的第一个版本,让子弹飞一会,未来电商或许真的不再需要模特了。
ps.官方多图参考教程:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxp?identityId=1oE1iQt0sbr#section=h.fe892pkbwcfk

没有评论:

发表评论

一文看懂!大语言模型与AI智能体的前沿进展

点击下方卡片,关注"AI生成未来"如您有工作需要分享,欢迎联系:aigc_to_future近年来,大语言   点击下方 卡片 ,关注" AI生成未来 " 如您有工作需要分享,欢迎联系: aigc_to_future 近年来,大语言模型...