2025年6月18日星期三

最新扣子(coze)制作微电影保持最强人物一致性技术,彩蛋在最后


图片

点击上方卡片关注 不要错过精彩文章


🎉

读完这篇文章,别忘记给舰长点一个关注!舰长的智能体搭建文章,不仅是节点的构建,也有思路的分享。智能体搭建最重要的就是思路。最希望,能给大家带来不一样的搭建思路和方法。 

点一点上方的🔵蓝色小字关注,你的支持是我最大的动力!🙏谢谢啦!🌟" 


大家好!我舰长团队的AJ阿军🤓

无论是用AI制作儿童睡前故事绘本/视频,还是小说推文/视频!甚至是AI微电影制作!在AI加速爆火的这些年,大伙应该都尝试过很多方法保证一个绕不开的关键难点"人物一致性"!

Image


这篇文章将带领大家大致体验和测评目前最强的几个绘图模型人物一致性的表现!全文以图文的形式给大家做了详细的对比!


阅读后你将收获、了解这些模型的能力对比,以及使用平台的简单介绍,文章末尾还会把我在扣子上集成了这些模型的插件分享给大家,让大家也可以在工作流中愉快的DIY!

Image


你做的AI图片/视频人物一致性了吗?

"人物一致性"决定了你的作品让观众是否专注剧情和故事本身,而不是聚焦到"多变"的角色身上,否则这样的作品很容易让人跳戏!也很难有好口碑😭

Image

就在最近一段时间从gpt- image-1到黑森林flux.1 kontext,再到最近爆火的字节刚推出的即梦3.0!可谓是一场"人物一次性比拼大秀",让人目不暇接,高潮迭起!

Image

我将从一些简单案例给大家对比和总结,让大家对这个三种模型有个大致的直观感受,然后方便结合自己的需求使用!



一.无文本图片编辑能力对比

就用舰长的头像做一个简单的换衣服测试,分别在gpt-image-1、flux.1 knotext、即梦3.0中验证,提示词很简单:"把衣服换成XX颜色,其它保持不变"


  • gpt-image-1 中的表现(左边为原图,右边是AI编辑生成的图)

prompt:把衣服换成红颜色,其它保持不变

图片
  • flux.1 kontext(左边为原图,右边是AI编辑生成的图)

prompt:把衣服换成红橙色,其它保持不变

Image


  • 即梦3.0(左边为原图,右边是AI编辑生成的图)

prompt:把衣服换成黑色,其它保持不变

Image

是不是咋一看,基本都还不错,都符合我们都预期(只换了衣服的颜色,其它不相干的东西都似乎都保持住了👍)但是可谓"可远观而不可亵玩焉"😂,下面对比一下细节:


  • gpt-image-1 中的表现(左边为原图,右边是AI编辑生成的图)
Image

细节对比:

小男孩的瞳孔颜色、笑容时脸蛋幅度、嘴里面的牙齿、烟斗的颜色均有所不同(特别是牙齿,原图的牙齿是有几颗缺失的,而编辑后的没有缺陷的,一口大白牙😂)


  • flux.1 kontext(左边为原图,右边是AI编辑生成的图)
Image

细节对比:

除了烟斗的颜色略有不同外,基本保持和原图细节一致了(有缺陷的牙齿也保持住了👍)


  • 即梦3.0(左边为原图,右边是AI编辑生成的图)
Image

细节对比:

除了烟斗的颜色略有不同外,基本保持和原图细节一致了(有缺陷的牙齿也基本保持住了👍,但嘴巴打开打幅度稍微小一了些😂)


综合总结(个人观点仅供参考):

Image



二.有文本图片编辑能力对比

这次用我之前视频里的角色(衣服上有大的文字,背景有小文字,还有logo)做一个简单的换衣服测试,分别在gpt-image-1、flux.1 knotext、即梦3.0中验证,提示词很简单:"把衣服换成XX颜色,其它保持不变"


  • gpt-image-1 中的表现(左边为原图,右边是AI编辑生成的图)

prompt:把衣服换成红颜色,其它保持不变

Image


  • flux.1 kontext(左边为原图,右边是AI编辑生成的图)

prompt:把衣服换成咖啡色,其它保持不变

Image


  • 即梦3.0(左边为原图,右边是AI编辑生成的图)

prompt:把衣服换成紫色,其它保持不变

Image

是不是也是咋一看,基本都还不错,都符合我们都预期(只换了衣服的颜色,其它不相干的东西都似乎都保持住了👍)但是可谓"可远观而不可亵玩焉"😂,下面再次对比一下细节:


  • gpt-image-1 中的表现(左边为原图,右边是AI编辑生成的图)
Image

细节对比:

  1. 1. 人物面部有微略变化,镜片和肤色(特别是鼻子变红了😂)
  2. 2. logo图标细节变了"j"字细节不一样了
  3. 3. 衣服上的文字细节有变化(原图文字与衣服褶皱贴合,编辑后的融合度不高,位置有稍微调整)


  • flux.1 kontext(左边为原图,右边是AI编辑生成的图)
Image

细节对比:

  1. 1. 人物面部及光泽基本保持一致👍
  2. 2. logo图标细节处理基本保持一致👍
  3. 3. 衣服上的文字细节、光泽、贴合度基本保持一致👍


  • 即梦3.0(左边为原图,右边是AI编辑生成的图)
Image

细节对比:

  1. 1. 人物面部及光泽基本保持一致👍
  2. 2. logo图标细节处理基本保持一致👍
  3. 3. 衣服上的文字细节、光泽、贴合度基本保持一致,但是加上了卫衣帽子的拉线😂


综合总结(个人观点仅供参考):

Image

所以综合总结下来目前一致性最强的绘图模型排名:

GPT-Imgae-1 < 即梦3.0 < Flux.1 Kontext

Image


三.平台简要说明及Coze插件使用

目前三个平台都对模型开启了API,开发者可以愉快的DIY了😍,不会调用API也没关系,可以直接去官方网站使用或者用我弄的插件在coze工作流中使用!目前黑森林flux注册成功后有200积分、即梦3.0有每天80积分、gpt-image-1就需要小伙伴们自己去官网付费了订阅了😂

Image

已经做成插件工具有需要麻烦您一键三连,评论"0618"添加下方二维码领取插件具体使用文档🙏



关注公众号并添加舰长微信,领取智能体学习资料,并参与Coze技术直播讲解

Image

另外非常欢迎大家加入[唐舰长AI落地智能体交流群],主要交流群每周都会进行公益直播教大家搭建AI智能体工作流

Image
Image







没有评论:

发表评论

NotebookLM全自动操控教程 零编程基础傻瓜式操作指南

本文提供NotebookLM全自动操控的傻瓜式教程,专为不懂编程的用户设计。核心亮点在于无需代码知识即可实现全自动操作,适合希望快速上手AI工具的学习者。教程步骤清晰,零基础可跟随操作,无额外费用,永久有效。 Tags: NotebookLM教程 AI工具 零基...