AI I024: 低显存玩家的最爱，最强AI大模型Gemini和comfyui结合，多图识别解锁更多ai玩法！

2025年5月17日星期六

低显存玩家的最爱，最强AI大模型Gemini和comfyui结合，多图识别解锁更多ai玩法！

在排名前几名的主流AI大模型中，谷歌的Gemini才是那个最博爱的，因为别人的API都收费，只有它免费提供AP

在排名前几名的主流AI大模型中，谷歌的Gemini才是那个最博爱的，因为别人的API都收费，只有它免费提供API服务。

ComfUI接入Gemini的API后，生图是不需要本地算力的，低显存或者集显都可以完美运行这个工作流。

Gemini是一个多模态模型，既能生成图片和识别图片，又能通过对话对图片进行修改。

今天我们来介绍Gemini在ComfyUI中的使用方法。

一、节点安装

我们需要安装两个节点：ComfyUI-Gemini-API和comfyui_ssl_gemini_EXP

地址：

https://github.com/CY-CHENYUE/ComfyUI-Gemini-API

https://github.com/tatookan/comfyui_ssl_gemini_EXP

下面以以ComfyUI-Gemini-API节点为例进行安装。

Gemini API页面提供了两种安装方法，大家可以参照这个方法进行安装。

我们采取另一种更简单的方法来安装。

（1）在custom_nodes文件夹的地址栏输入 cmd 然后回车，调出命令行。

（2）在命令行输入下面命令，然后回车

git clone https://github.com/CY-CHENYUE/ComfyUI-Gemini-API.git

二、基础工作流

基础工作流比较简单，由加载图像节点+Gemini 2.0 image节点+预览图像节点和展示文本节点组成。

这里面最重要的参数就是Gemini节点中的API的获取。

三、API的获取

1、进入Google AI Studio，用谷歌账户登陆

地址：https://aistudio.google.com/apikey?hl=zh-cn

2、点击创建API密钥

3、创建完成后复制密钥，将密钥粘贴到工作流中即可。

四、多模态生图

1、单图工作流

单图工作流就是上面讲的基础工作流，别看工作流简单，但借助谷歌的Gemini能实现很多复杂的功能。

比如下面工作流的载入图像中包含一个女人，发个包和一瓶香水，在提示词中告诉Gemini"一个女人挎着包，手拿香水"，就能得到想要的图片。

类似的操作还有很多，比如P图。先给一张人物图片，让Gemini改变人物衣着，实现快速换衣功能；改变人物发色、站立姿势等。

更多玩法大家可以自行尝试。

2、双图工作流

双图工作浪用到的是上面提到的第二个节点，它允许我们提供2张图片。

用下面的工作流很容易就将两张图合为一张图片。

两张图为我们的操作提供了更多便利。

例如上面提到的人物一键换衣操作，我们分别给一张衣服的图片和一张人物的图片，提示词输入让人物穿上这件衣服，就能完美实现在键换衣。

这个功能在电商中非常实用。

双图工作流比单图工作流更加灵活，功能也多，更多玩法大家自己去探索吧。

关于代理IP和端口

下图红圈内的代理IP和端口，一般默认就可以。

如果网络有问题，我们可以先查看本机的代理地址和端口。

本机代理你IP和端口的查询方法见下图，我本机的地址和端口和节点上的一致，如果你的不一致，要改成一致的。

工作流：

gemini单图和双图片工作流.json

链接: https://pan.baidu.com/s/1mMDCjwvsP97J_bIMkuKhdg?pwd=bm57 提取码: bm57

END

感谢您的阅读，麻烦点个赞+在看吧！

没有评论:

发表评论

订阅：博文评论 (Atom)

AI I024

2025年5月17日星期六

低显存玩家的最爱，最强AI大模型Gemini和comfyui结合，多图识别解锁更多ai玩法！

在排名前几名的主流AI大模型中，谷歌的Gemini才是那个最博爱的，因为别人的API都收费，只有它免费提供AP

没有评论:

发表评论

免费大模型 API全景指南：20+平台白嫖攻略，从注册到上手

标签