添加微信号:AIGC_Tech,公众号小助手会拉你进群!点击下方名片关注AIGC Studio公众号!
点击下方名片关注AIGC Studio公众号!获取最新AI前沿应用/AIGC实践教程!
告别抠图!Qwen-Image-Layered 一键生成"PS级"透明图层,ComfyUI极速工作流分享!重新定义一致图像编辑
阿里千问团队最新推出的Qwen-Image-Layered能够将图像分解为多个 RGBA 图层。这种分层表示方式赋予图像固有的可编辑性:每个图层都可以独立操作,而不会影响其他内容。同时,这种分层表示方式自然地支持高保真度的基本操作,例如调整大小、重新定位和重新着色。通过将语义或结构组件物理隔离到不同的图层中,该方法实现了高保真度和一致性的编辑。
效果展示
分层分解的应用
给定一张图像,Qwen-Image-Layered 可以将其分解为多个 RGBA 图层分解之后,编辑操作将仅应用于目标图层,使其与其余内容物理隔离,从而从根本上确保编辑操作的一致性。
例如可以重新着色第一层,而保持其他所有内容不变:
还可以将第二层中的女性角色替换为男性角色(目标图层使用 Qwen-Image-Edit 进行编辑):
这里将文本修改为"Qwen-Image"(目标图层使用 Qwen-Image-Edit 进行编辑):
此外,这种分层结构自然而然地支持基本操作。例如可以干净利落地删除不需要的对象:
还可以在不变形的情况下调整物体大小:
图层分解后,可以在画布内自由移动对象:
灵活迭代分解 Qwen-Image-Layered 模型的层数并不固定。该模型支持可变层数分解。例如可以根据需要将图像分解为 3 层或 8 层:
此外,分解可以递归应用:任何一层本身都可以进一步分解,从而实现无限分解。
相关链接
论文:https://arxiv.org/pdf/2512.15603 主页:https://qwenlm.github.io 代码:https://github.com/QwenLM/Qwen-Image-Layered 模型:https://huggingface.co/Qwen/Qwen-Image-Layered ComfyUI:https://docs.comfy.org/tutorials/image/qwen/qwen-image-layered
介绍
QwenImage-Layered 提出了一种革命性的分层图像生成范式,通过端到端扩散模型将单张RGB图像分解为多个语义解耦的RGBA图层,实现类似专业设计工具的独立编辑能力。其三大创新包括:
RGBA-VAE统一RGB与RGBA的潜在表示; VLD-MMDiT架构支持可变数量图层分解; 多阶段训练策略适配预训练模型。
为解决训练数据稀缺问题,论文构建了从PSD文件中自动提取多层图像的流水线。实验表明,该方法在分解质量和编辑一致性上显著超越现有技术,为AI图像编辑提供了新方向。
方法概述
Qwen-Image-Layered 概述。
左图:VLD-MMDiT(可变层分解 MMDiT)示意图,其中输入 RGB 图像和目标 RGBA 层均由我们提出的 RGBA-VAE 进行编码。在注意力计算过程中,这两个序列沿序列维度连接,从而增强层间和层内交互。 右图:Layer3D RoPE 示意图,其中引入了一个新的层维度以支持可变层数。
实验结果
感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~
没有评论:
发表评论