2025年5月17日星期六

低显存玩家的最爱,最强AI大模型Gemini和comfyui结合,多图识别解锁更多ai玩法!

在排名前几名的主流AI大模型中,谷歌的Gemini才是那个最博爱的,因为别人的API都收费,只有它免费提供AP

在排名前几名的主流AI大模型中,谷歌的Gemini才是那个最博爱的,因为别人的API都收费,只有它免费提供API服务。
ComfUI接入Gemini的API后,生图是不需要本地算力的,低显存或者集显都可以完美运行这个工作流。
Gemini是一个多模态模型,既能生成图片和识别图片,又能通过对话对图片进行修改。
今天我们来介绍Gemini在ComfyUI中的使用方法。
一、节点安装
我们需要安装两个节点:ComfyUI-Gemini-API和comfyui_ssl_gemini_EXP
地址:
https://github.com/CY-CHENYUE/ComfyUI-Gemini-API
https://github.com/tatookan/comfyui_ssl_gemini_EXP
下面以以ComfyUI-Gemini-API节点为例进行安装。
图片
Gemini API页面提供了两种安装方法,大家可以参照这个方法进行安装。
我们采取另一种更简单的方法来安装。
(1)在custom_nodes文件夹的地址栏输入 cmd 然后回车,调出命令行。
图片
(2)在命令行输入下面命令,然后回车
git clone https://github.com/CY-CHENYUE/ComfyUI-Gemini-API.git
图片
二、基础工作流
基础工作流比较简单,由加载图像节点+Gemini 2.0 image节点+预览图像节点和展示文本节点组成。
这里面最重要的参数就是Gemini节点中的API的获取。
图片
三、API的获取
1、进入Google AI Studio,用谷歌账户登陆
地址:https://aistudio.google.com/apikey?hl=zh-cn
2、点击创建API密钥
图片
3、创建完成后复制密钥,将密钥粘贴到工作流中即可。
图片
四、多模态生图
1、单图工作流
单图工作流就是上面讲的基础工作流,别看工作流简单,但借助谷歌的Gemini能实现很多复杂的功能。
比如下面工作流的载入图像中包含一个女人,发个包和一瓶香水,在提示词中告诉Gemini"一个女人挎着包,手拿香水",就能得到想要的图片。
图片
类似的操作还有很多,比如P图。先给一张人物图片,让Gemini改变人物衣着,实现快速换衣功能;改变人物发色、站立姿势等。
更多玩法大家可以自行尝试。
2、双图工作流
双图工作浪用到的是上面提到的第二个节点,它允许我们提供2张图片。
用下面的工作流很容易就将两张图合为一张图片。
图片
两张图为我们的操作提供了更多便利。
例如上面提到的人物一键换衣操作,我们分别给一张衣服的图片和一张人物的图片,提示词输入让人物穿上这件衣服,就能完美实现在键换衣。
这个功能在电商中非常实用。
双图工作流比单图工作流更加灵活,功能也多,更多玩法大家自己去探索吧。
关于代理IP和端口
下图红圈内的代理IP和端口,一般默认就可以。
如果网络有问题,我们可以先查看本机的代理地址和端口。
图片
本机代理你IP和端口的查询方法见下图,我本机的地址和端口和节点上的一致,如果你的不一致,要改成一致的。
图片
工作流:

gemini单图和双图片工作流.json

链接: https://pan.baidu.com/s/1mMDCjwvsP97J_bIMkuKhdg?pwd=bm57 提取码: bm57 

END




感谢您的阅读,麻烦点个赞+在看吧!

没有评论:

发表评论

这两款完全免费的短视频下载工具可以下载很多平台短视频,包括视频号视频,值得你拥有

不过今天高粱seo给大家带来的这两款ai短视频下载工具非常好使,也是高粱seo目前一直在使用的,值得给大家推荐一番,基本上国内的大平台都可以下载。 在图片生成ai短视频的过程中,有一个非常重要的步骤就是运镜。运镜是什么东西?高粱seo觉得可能很多人未必明白,其实 运镜是影视制...