2026年6月12日星期五

AI作画离线版V9。11 免费可控文生图 支持Ideogram4模型

AI作画离线版V9.11是一款基于开源项目的免费AI绘画工具。新增Ideogram4模型,支持框选模式构建结构化描述,实现元素位置与风格可控的文生图,效果真实;修复提前终止等bug,提升稳定性。适合拥有英伟达2GB以上显存显卡的用户。提供百度网盘、123网盘等下载方式。

Tags:

「本期内容标签」
安卓 iOS 电脑 小程序 网站 游戏 教程
图片
本月V9.11带来了一些更为便捷的功能,如下更新:

1、支持Ideogram 4模型,支持框选模式构建结构化描述,最终文生图各种元素位置、风格可控,效果不错,真实性挺强; 

2、提前终止bug修复,目前可快速停止; 

3、修复众多bug,提高稳定性。

01
软件概览
软件名字叫做:AI作画离线版,基于GitHub上的开源项目Disco Diffusion与Stable Diffusion以及众多开源项目
如下,软件主界面,还是以操作简单为主:
图片
02
软件功能介绍
功能一:SD(Stable Diffusion)作画
SD作画模式下,目前支持文生图(SD一代、SD XL、FLUX、Qwen、Z-image、ERNIE-Image等)、图生图、文字生成视频LTX、animatediff、deforum、队列模式、局部修改、扩图、背景替换、图片描述解析等功能
1、描述词设定描述词包括正描述和负描述,负描述默认可以不写,负描述如果写,就代表不想让绘画结果出现的元素。
图片
1.1、队列模式下的描述词设定:当如下勾选了队列模式后,通过固定的句式,可以生成大量的配置文件,也就可以实现生成多套参数的图。
图片
比如我的文字描述这样描述:a beautiful girl by {400|1|艺术家},当点击保存设置后就会生成400个艺术家的不同配置文件。
注意这个格式{400|1|艺术家}中的{}|这些不能缺少,完全按照固定格式来,400代表生成400个配置文件,1代表by一个艺术家名字(如果设置成2就代表by两个艺术家名字混搭),艺术家代表的是软件目录下【描述风格库】文件夹下的艺术家.csv文件,而艺术家.csv文件如下所示,两列数据:
图片
软件支持各位自建这种语料库,大家可以复制csv建立副本,然后在副本里修改,注意也是按照两列格式来,第一列是描述,第二列是解释。比如下面我建的颜色.csv文件,简单写了一下,也是一定严格两列来哈,且都放在软件目录下的【描述风格库】文件夹。
图片
2、绘图参数绘制图片轮数代表每次画几张图。
图片
3、显存占用模式选择软件提供不同显存占用模式。
图片
4、图生图参数比较简单,基本上就是导入原图,修改描述,设置图片差异度参数即可。
图片
如下,试试SD参考图,实现真人二次元效果或者其他的一些效果:
图片
6、文字图片生成视频LTXSD动画选择LTX,描述里输入文字,图生图里导入参考图,即可根据文字图片生成视频,如下设置:
图片
如下为效果演示视频:

7、SD、LORA、VAE模型选择支持选择第三方safetensors、gguf格式的SD模型、VAE模型以及LORA模型,如下所示:
图片
SDXL扩图:
如下面的图,每张图左侧为原图,右侧为AI脑补扩图制作而成:
图片
图片
FLUX作画:当选择FLUX-DEV时,自动切换到FLUX模式作画,FLUX的语义理解能力不错,全‮模能‬型,手可‮画以‬好,文字也支持,各‮类种‬型画‮都风‬能胜任,如下测试的FLUX做的图:
图片
当选择FLUX-DEV时,可以手动选择gguf模型,如下所示,显存占用更小:
图片


图片
FLUX Kontext图片编辑:当选择FLUX-DEV-KONTEXT时,导入参考图然后通过描述即可控制图片编辑,实现用嘴P图的方便快捷功能,如下演示:
图片
图片
如下演示的图,就是完全通过描述实现的,比如描述复原上色老照片、美女带个眼镜、换绿色衣服、带墨镜、拿水杯、风格转换等等。
图片
图片
Qwen-Image作画:当选择Qwen-image时,输入中文描述即可生成图片,如下演示:
图片

图片
图片
Qwen-Image-Edit-2509或Qwen-Image-Edit-2511作画:当选择Qwen-image-edit-2509或2511时,输入中文描述,导入多图即可生成按照描述要求的图片,如下演示:
图片
图片
图片
图片
图片
如下当选择一些Qwen的lora时,功能更加有针对性,比如下面选的多视角的lora,出图及设置如下:
图片
图片
Flux2-Klein作画:如下选择Klein的模型,和Qwen-Image-Edit一样的导入参考图操作,即可实现改图,速度很快,效果也不错:
图片
图片
图片
图片
Z-Image-Turbo画:当选择Z-Image-Turbo时,输入中文描述即可生成图片,如下演示:
图片
图片
图片

ERNIE-Image作画:当选择ERNIE-Image时,输入中文描述即可生成图片,如下演示:

图片
图片
图片
Microsoft Lens作画:当选择Microsoft-Lens时,输入中文描述即可生成图片,如下演示:
图片
图片
图片
图片
Seed VR2高清放大:当选择Seed-VR2时,导入参考图即可高清放大图片到4K分辨率,如下演示:
图片
图片
Ideogram 4作画在描述设置里点击结构化描述,可以进入结构化描述框,可以创建不同的框代表最终文生图的元素,每个框的风格描述都可以定义:
图片
图片
如下图,右半图我生成前结构化描述设置左上角和右上角都建立了一个框,一个框里描述太阳,一个框里描述松树,最终成图确实存在我描述的元素:
图片
功能二:CN作画
CN就是目前大名鼎鼎的ControlNet,目前软件同步到CN 1.1版本,总体使用方式和SD差别不大。
CN的精髓在于下图,不同的这些模型:
图片
1、各模型简单演示这些模型的作用就是针对不同的参考图进行创作,诸如Lineart模型就是针对线稿参考图,然后实现线稿上色或者二次创作的目的,如下演示,选择Lineart_Anime这个二次元线稿的CN模型配上二次元SD模型和描述:
图片
如下选择openpose这个人体姿势的CN模型,左图为原图,中间为识别原图的骨骼图,图为生成的图。
图片
如下SEG语义分割的CN模型效果:
图片
如下MLSD这种识别建筑线稿的CN模型效果:
图片
如下为超分辨率的Tile的CN模型,真的是模糊图重绘神器:
图片
如下为二维码模型qrcode_monster_v2的CN模型,可以做图片二维码:
图片
图片
如下为tile模型的妙用,实现文字光影效果:
图片
2、CN视频重绘:基于animatediff,我们通过选择合理的CN模型,然后在控制图导入要重绘的视频即可,软件操作很简洁,如下视频重绘效果演示视频,同时支持勾选队列模式,批量选择控制视频进行重绘。
图片

图片

3、CN的Instant ID和PhotoMaker-V2创作:Instant ID和PhotoMaker-V2功能一样操作,都是不用训练即可生成CN给定的人脸控制图,然后根据描述或者不同风格模型绘制出不同风格的此人图片,注意SD模型要选择XL大模型,如下测试图(第一张为原图,其他图为生成图):
图片
图片
图片
功能三:DD(Disco Diffusion)作画
1、描述词设定如下默认的描述,每段(回车换行算一段)都是同一描述的不同权重关键词。
图片
2、图生图参考图也人性化了,直接点击按钮选择图片即可,注意看参数旁边的问号,一般加入参考图时,skip_steps这个参数需要设置大一些
图片
4、AI作画模型选择参数设置里提供两种绘图Diffusion模型引擎选择,原版DD、像素版DD以及其他自定义的PT格式模型,如下图设置:
图片
如下演示的是国画模型:
图片
图片
03
显卡要求
需要至少2GB显存,且必须是英伟达显卡,AMD、intel等不支持。
各种显存测试参数可参考:https://docs.qq.com/sheet/DTGxSSkNJcnVhV1VP。
04
小结
这个项目确实很有意思,唯一的问题就是对显卡要求高,最起码需要英伟达2G及以上显存,AMD等其他显卡不支持,感兴趣的可以体验一下新版本了,更详细的作图参数、教程多刷刷B站相关视频即可。
05
本期内容获取
方式一:百度网盘
https://pan.baidu.com/s/16srtMV6rfSLFndCyi9B8YQ?pwd=tzss
提取码:tzss
方式二:123网盘(速度挺快)
https://www.123pan.com/s/H3GRVv-3qWLh?
提取码:6yCn
方式三:夸克网盘
https://pan.quark.cn/s/7a11b19b88ba
提取码:BMSE































没有评论:

发表评论

开源数字孪生服务平台 构建使用共享降本增效

本文介绍开源数字孪生服务平台,提供完整源代码。适合开发者与企业用户,核心亮点包括低代码建模工具、实时监控交互、AI仿真预测及共享协作功能。支持私有化部署,保障数据安全,适用于智能制造与智慧城市等场景。 Tags: 数字孪生 开源平台 智能制造 智慧城市 数字孪生...