2026年3月22日星期日

腾讯混元开源HY-WU:无需微调实时生成LoRA,图像编辑性能SOTA

腾讯混元推出HY-WU框架,无需微调即可实时生成个性化LoRA适配器,实现高保真图像编辑,性能媲美Nano-Banana。开源模型、代码、论文均已发布,支持服装迁移、虚拟试穿等应用。

Tags:

点击下方名片关注AIGC Studio公众号获取最新AI前沿应用/AIGC实践教程
扫描下方二维码,加入AIGC Studio知识星球可以获得最新AI前沿应用/AIGC实践教程/大厂面试经验/算法刷题IT各学科入门到精通学习资料学习/科研/工作/副业,强烈推荐!
图片

腾讯混元团队提出了一个可扩展的框架HY-WU,用于动态条件生成低秩(LoRA)更新。HY-WU从混合图像-指令表示中合成实例条件适配器权重,并在前向传播期间将其注入到冻结的主干网络中,从而生成实例特定的算子,而无需进行测试时优化。图片

主要特点

  • 功能性神经记忆: HY-WU 为 AI 引入了一种轻量级的"神经记忆"。它可以根据请求生成条件模型适配器(无需微调!),从而在保持基础模型通用能力的同时,实现实例级个性化。

  • 可扩展至大型模型: HY-WU 仍然适用于大型基础模型(即使参数量高达 800 亿!)。凭借结构化的参数标记化,该方法天然兼容大规模架构。

  • 强大的人类偏好: HY-WU 在与开源模型的比较中取得了较高的人类偏好胜率,超越了强大的闭源基准,并且与最新的 Nano-Banana 系列保持接近。

unsetunset跨领域服装融合unsetunset

图片

unsetunset创意角色扮演和角色服装迁移unsetunset

图片

unsetunset高保真度人脸身份迁移unsetunset

图片

unsetunset无缝服装转移和虚拟试穿unsetunset

图片

unsetunset高质量纹理合成unsetunset

图片

unsetunset相关链接unsetunset

  • 论文:https://arxiv.org/pdf/2603.07236
  • 主页:https://tencent-hy-wu.github.io
  • 源码:https://github.com/Tencent-Hunyuan/HY-WU
  • 模型:https://huggingface.co/tencent/HY-WU/tree/main

unsetunset方法概述unsetunset

图片HY-WU流程概述。该框架从源图像和编辑提示中提取条件,这些条件由可训练的神经网络Transformer处理,以合成特定实例的参数标记。然后,这些标记被解标记化为LoRa适配器,并集成到包含θ1 · · · θL的冻结基础模型中,其中θl表示第l层。整个流程采用端到端优化,生成器通过扩散损失的反向传播进行更新。

unsetunset实验unsetunset

图片

GSB(人类评估)

HY-WU 的性能显著优于领先的开源模型,并且与顶级闭源商业系统相比也毫不逊色。虽然 Nano Banana 2 和 Nano Banana Pro 的总体得分略高(分别为 52.4% 和 53.8%),但差距仍然不大。

鉴于这些商业系统很可能使用规模更大的骨干网和专有数据进行训练,性能差距不大,这表明即使在模型规模受到更多限制的情况下,操作员级条件自适应仍然有效。

unsetunset使用教程unsetunset

from wu import WUPipeline

base_model_path = "tencent/HunyuanImage-3.0-Instruct"
pg_model_path = "tencent/HY-WU"

pipeline = WUPipeline(
    base_model_path=base_model_path,
    pg_model_path=pg_model_path,
    device_map="auto",
    moe_impl="eager",
    moe_drop_tokens=False,
)

prompt = "以图1为底图,将图2公仔穿的衣物换到图1人物身上;保持图1人物、姿态和背景不变,自然贴合并融合。"
# prompt_en = Using Figure 1 as the base image, replace the clothing on the character in Figure 1 with the outfit worn by the figurine in Figure 2. Keep the character, pose, and background of Figure 1 unchanged, ensuring the new clothing fits naturally and blends seamlessly.
imgs_input = ["./assets/input_1_1.png""./assets/input_1_2.png"]

sample = pipeline.generate(prompt=prompt, imgs_input=imgs_input, diff_infer_steps=50, seed=42, verbose=2)

sample.save("./output.png")

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

图片

没有评论:

发表评论

微信ClawBot AI助手插件实测:三步连接,原生排版更流畅

微信官方推出ClawBot AI助手插件,三步即可在微信内连接OpenClaw,实现AI对话。体验发现原生插件排版干净、回复无代码符号,支持自定义头像名称,流畅度优于第三方工具。目前仅支持单个Agent,未来有望支持多Agent协同。适合在微信中体验AI助手的用户。 Tags: ...