在排名前几名的主流AI大模型中,谷歌的Gemini才是那个最博爱的,因为别人的API都收费,只有它免费提供AP
在排名前几名的主流AI大模型中,谷歌的Gemini才是那个最博爱的,因为别人的API都收费,只有它免费提供API服务。ComfUI接入Gemini的API后,生图是不需要本地算力的,低显存或者集显都可以完美运行这个工作流。Gemini是一个多模态模型,既能生成图片和识别图片,又能通过对话对图片进行修改。今天我们来介绍Gemini在ComfyUI中的使用方法。我们需要安装两个节点:ComfyUI-Gemini-API和comfyui_ssl_gemini_EXPhttps://github.com/CY-CHENYUE/ComfyUI-Gemini-APIhttps://github.com/tatookan/comfyui_ssl_gemini_EXP下面以以ComfyUI-Gemini-API节点为例进行安装。
Gemini API页面提供了两种安装方法,大家可以参照这个方法进行安装。(1)在custom_nodes文件夹的地址栏输入 cmd 然后回车,调出命令行。git clone https://github.com/CY-CHENYUE/ComfyUI-Gemini-API.git基础工作流比较简单,由加载图像节点+Gemini 2.0 image节点+预览图像节点和展示文本节点组成。这里面最重要的参数就是Gemini节点中的API的获取。1、进入Google AI Studio,用谷歌账户登陆地址:https://aistudio.google.com/apikey?hl=zh-cn3、创建完成后复制密钥,将密钥粘贴到工作流中即可。单图工作流就是上面讲的基础工作流,别看工作流简单,但借助谷歌的Gemini能实现很多复杂的功能。比如下面工作流的载入图像中包含一个女人,发个包和一瓶香水,在提示词中告诉Gemini"一个女人挎着包,手拿香水",就能得到想要的图片。类似的操作还有很多,比如P图。先给一张人物图片,让Gemini改变人物衣着,实现快速换衣功能;改变人物发色、站立姿势等。双图工作浪用到的是上面提到的第二个节点,它允许我们提供2张图片。例如上面提到的人物一键换衣操作,我们分别给一张衣服的图片和一张人物的图片,提示词输入让人物穿上这件衣服,就能完美实现在键换衣。双图工作流比单图工作流更加灵活,功能也多,更多玩法大家自己去探索吧。如果网络有问题,我们可以先查看本机的代理地址和端口。本机代理你IP和端口的查询方法见下图,我本机的地址和端口和节点上的一致,如果你的不一致,要改成一致的。gemini单图和双图片工作流.json
链接: https://pan.baidu.com/s/1mMDCjwvsP97J_bIMkuKhdg?pwd=bm57 提取码: bm57
感谢您的阅读,麻烦点个赞+在看吧!
没有评论:
发表评论