AI I024: 可灵上线多图参考功能，电商或是最值得期待的场景

2025年1月23日星期四

昨天可灵上线了多图参考功能，今天测试了一下，总体感觉有一定的可玩性，但是实用性貌似还不是很高~ 下面是我的一些测试

一开始想到的就是跨场景的应用，于是用黑神话的Lora生成了一张悟空的图片，然后找了一张青岛五月的风雕塑图片，使用提示词"悟空跑向红色的雕塑"

虽然内容图片的内容是融合到一起，但是雕塑变形严重，而且这也明显不是"跑向"，当然这可能也跟图片初始的朝向有些关系，如果提示词使用转身跑向或许会有效果。如下面这个机甲转身的场景。

然后想到前段时间比较火的巨物玩法，之前流程是使用谷歌的whisk把图片合成，然后再图生视频。这次直接从网上找了两张图片，使用提示词"巨型哪吒躺在古罗马斗兽场上面"。虽然主体是躺了上去，但是并没有体现出巨物感。

然后又尝试了下双主体的对打效果，使用提示词"一个穿着黄色衣服的女人和一个穿着青色衣服的男人，拿着剑正在对打，武侠片"

虽然画面有些感觉，但是质量还是差了些，女主的武器都没了，好在服饰外观保持的还算可以。

最后尝试了下模特换装应用，生成了一张裙子的图片，然后主体只框选了人脸，提示词"美女穿着红色的连衣裙站在展台上，作揖给大家拜年"

打眼一看以为找到了应用场景，裙子正面还原的貌似很不错，甚至腰带的花都很相近，但仔细看还是有很多细节问题，甚至提示词都没有遵循，再继续尝试一组。

这次从京东找了一套衣服，把服装的正反面都上传上去了，发现效果原来也是要靠抽卡

还尝试了一组，介绍产品"一个美女手里拿着一瓶洗发水，站在在一个绿色植物背景的展台上介绍着洗发水的功效"

发现洗发水的比例明显有问题，比例协调问题也是多图不如合成一张图的主要缺点，当然一些不太容易融合的图片还是可以尝试多图参考来试试的，其实指定主体也算是可灵给出的保持主体一致性的方法，大家有兴趣的不妨也去试试。而且这只是多图参考的第一个版本，让子弹再飞一会，未来电商或许真的不再需要模特了。

ps.官方多图参考教程：https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxp?identityId=1oE1iQt0sbr#section=h.fe892pkbwcfk