2025年6月30日星期一

媲美GPT4o,用自然语言对图片进行修改,超强人物一致性,fux。1-kontext-dev免费版来了!

之前我们介绍过黑森林的 kontext 模型,它可以像 GPT4o 那样具备上下文理解、本地编辑、样式迁移等能力,可以只通过自然语言描述,就可以实现对图片的修改,而且图片的一致性非常高。
不过当时只支持在线试用和付费API调用。
好消息是现在免费的dev版本模型终于来了!
现在赶紧来尝鲜吧!
工作流在文末
一、模型下载
1、版本更新
在下载模型前首先要先把 comfyUI更新到最新版本
图片
2、模型下载
在黑森林的huggingface页面上提供了kontext的模型,容量为23.8G,不过官方说运行它需要32G显存。

链接:

https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev/tree/main

图片
32G显存明显不是大多数人能够跑起来的,所以还提供了只要20G显存的fp8版本。不过实际使用中16G显存的显卡也能使用。
链接:

https://huggingface.co/Comfy-Org/flux1-kontext-dev_ComfyUI/resolve/main/split_files/diffusion_models/flux1-dev-kontext_fp8_scaled.safetensors

3、模型放置位置

kontext模型放置到comfyui安装目录/models/diffusion_models里面

ae.safetensor放置到comfyui安装目录/models/vae里面

clip_l.safetensors 和 t5xxl 放置到comfyui/models/text_encoders里面

二、运行工作流

打开comfyUI,打开工作流模板,找到 Flux,最靠前的两个工作流就是 kontext工作流了(要把 comfyUI更新之后才会有)。

这两个工作流本质上是一样的,我们先以第一个工作流为例进行讲解。

图片

1、打开工作流

这个工作流有两个加载图像节点(其中一个被禁用了)。

默认情况下,我们加载一张图片,然后输入提示词就可以对图片进行编辑了。

图片

如果想节省显存,可以将剪枝类型改变fp8的

图片

为了方便写提示词,我们可以在提示词前面加一个翻译节点,这样我们就可以用中文写提示词了。

图片

2、单图操作

我的提示词是"保持人物一致性,保持服装一致性,保持场景一致性,让女人身体转90度,侧身向屏幕",最后生成的图像里人物完美的转过了身去,画面的一致性也保持得相当好。

图片
3、双图操作
将之前禁用的图像加载节点取消禁用,上传两张图片,提示词为:让两个女人出现在同一个场景中,两人手拉着手,背景是城市街道
图片
生成的图片中两人出现在了街道中,手拉着手,还是比较遵守提示词的。
不过在进行多人操作时,人物的面部就不像单图那么严格保持一致性了,多少会出现一些变样。
图片
4、多轮修改编辑
kontext支持对图片进行多轮编辑,就是对已经编辑过的图片再次进行编辑。
这就要打开模板中的第二个工作流了。
图片
模板打开后长这样
图片
我们把注释和禁用的节点去掉后,这个工作流比上一个工作流简单多了,主要是因为它多了一个FLUX.1 Kontext Image Edit节点,这个节点其实是一个多功能集成的节点,所以整个工作流看起来简单多了。
还有一点,如果只想做单图操作的话,记得把下面那个加载图片节点给禁用或者删了。
图片
输入提示词:保持人物一致性将女人的衣服变成粉色
图片
如果你想对编辑好的图片继续编辑,只需要在图像保存节点上单击,就会跳出跳出一组按钮,继续点击"添加模型编辑步骤"按钮,就会在右面添加一个kontext图像编辑节点。
这时你还需要再添加一个图像保存节点。
图片
这里要注意的是,为了保证多轮编辑的图片和上次生成的图片不发生变化,需要将种子数设为固定值。
图片
输入提示词后,点击最后一个图像保存节点,在它上方会出现一个绿色的三角形,点击它就可以生成图像了
图片
这次的提示词是"将图片变成迪士尼卡通风格"
图片
你还可以用同样的方法再继续下一轮的编辑,不过随着图片编辑轮数的增加,图片的一致性会有所下降。
在线工作流:

https://www.runninghub.cn/post/1938613725001605122

往期文章:
万物迁移+角色一致性+风格转绘+局部重绘+文字编辑,目前最优质的一致性解决方案,Flux.1 Kontext Pro变革级技术!
LBM-relighting:AI打光黑科技,10秒智能补光,人物和背景完美融合+100%保留原画质,工作流拆解
史诗级电影镜头,堪比闭源模型,wan2.1_14B_FusionX,6步就可生成高质量AI视频,完全开源

END




感谢您的阅读,麻烦点个赞+在看吧!

没有评论:

发表评论

明明买了贵的显卡AI绘图还是慢,GUDA+cuDNN+pytorch安装,让你的comfyUI起飞!

有人的电脑配置明明很 高,显卡也很好,但在做AI绘画时速度却很慢,那可能是你没有安装CUDA和cuDNN。 我的电脑刚做了系统,comfyUI也重装了,comfyUI 没装 CUDA,出图就变得很慢很慢,今天就带大家把 CUDA、cuDNN还有 pytorch 安装一下,让 ...