2025年11月21日星期五

NeurIPS`25 I 感叹岁月神偷!南开&三星开源Cradle2Cane :完美破解“年龄-身份”两难困境!

点击下方卡片,关注"AI生成未来"

👇扫码免费加入AI知识星球,如您有工作需要分享,欢迎联系:aigc_to_future

图片

作者:Tao Liu, Dafeng Zhang

解读:AI生成未来
图片

论文链接: https://arxiv.org/abs/2506.20977 

代码链接: https://github.com/byliutao/Cradle2Cane

亮点直击

  • 直击痛点,提出"Age-ID Trade-off": 深入分析了人脸老化任务中"年龄准确性"与"身份保持"之间的内在矛盾。现有方法往往顾此失彼,而本文提出的框架旨在打破这一零和博弈 。
  • 首创两阶段(Two-Pass)解耦架构: 提出 Cradle2Cane 框架。第一阶段利用自适应噪声注入(AdaNI)专注于"变老",第二阶段利用身份感知Embedding(IDEmb)专注于"找回身份"。这种分而治之的策略实现了1+1>2的效果 。
  • 巧妙的特征解耦设计: 引入了 SVR-ArcFace 和 Rotate-CLIP 模块。通过奇异值重加权(SVR)剔除ArcFace特征中的年龄干扰,利用球面线性插值(Slerp)在CLIP空间平滑迁移年龄属性,实现了身份与年龄特征的精准剥离与控制 。
  • 基于SDXL-Turbo的高效推理:利用少步(Few-step)扩散模型的优势,仅需0.56秒即可生成高质量图像,在保持极高保真度的同时,完美支持从"幼年到老年(Cradle to Cane)"的全年龄段平滑变换 。


解决的问题

长期以来,人脸老化(Face Aging)任务都面临一个核心挑战:如何在大幅度改变年龄特征的同时,完美保留原本的身份信息? 作者将这一挑战定义为 "Age-ID Trade-off"(年龄-身份权衡)。

  • 传统GAN方法(如Lifespan, CUSP):在身份保持上表现尚可,但在处理大跨度年龄变化(如从幼年到老年)时,往往生成模糊,且难以模拟真实的皮肤纹理和骨骼变化 。
  • 现有Diffusion方法(如FADING):虽然生成画质高,但往往伴随着严重的身份漂移(Identity Drift),生成的"老年版"看起来像是另一个人 。 如图1所示,现有方法的性能曲线往往呈现"trade-off"的趋势——年龄迁移准确性越高,身份相似度就越低。反之,身份相似度越高,年龄迁移准确性就越低。如何打破这一现状,实现全生命周期的高保真老化,是本文解决的核心问题。
图片

提出的方案

本文提出了一种基于 SDXL-Turbo 的两阶段(Two-Pass)扩散框架 —— Cradle2Cane。该方案的核心思想是"解耦":将年龄变换和身份保持拆解为两个独立的子任务进行优化。

图片

第一阶段(1st Pass):自适应噪声注入 (AdaNI)

这一阶段的目标是"精准变老"。 作者发现,年龄跨度越大,所需的图像结构变化越剧烈。因此,AdaNI 机制会根据目标年龄与源年龄的差距,动态调整注入潜空间(Latent Space)的噪声水平 。

  • 小跨度: 注入低噪声,微调纹理。
  • 大跨度: 注入高噪声,允许模型对脸型、皱纹、发际线进行大刀阔斧的修改。 虽然这一步会牺牲部分身份信息,但它为生成逼真的老化特征奠定了基础。
图片

第二阶段(2nd Pass):身份感知Embedding (IDEmb)

这一阶段的目标是"找回身份"。 在第一阶段生成的图像基础上,模型通过引入 IDEmb 进行去噪引导。IDEmb 由两个创新模块组成:

  • SVR-ArcFace: 传统ArcFace特征中混杂了年龄信息。作者利用奇异值重加权(Singular Value Reweighting, SVR)技术,抑制特征中随年龄变化的成分,提取出更纯粹的"身份核心" 。
  • Rotate-CLIP: 既然CLIP文本特征具有方向性,作者提出在CLIP空间中进行"旋转"(Rotate)。通过球面插值(Slerp)而非简单的向量相减,平滑地将特征导向目标年龄,同时保留语义一致性 。

达到的效果

平衡的性能

在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 数据集上的实验表明,Cradle2Cane 在 Face++ 和 Qwen-VL 多模态大模型两种评估协议下,均取得了 SOTA 的成绩。 特别是在 HCS (Harmonic Consistency Score) 这一综合指标上,本文方法大幅领先于 SAM, CUSP, FADING 等基线模型 。

图片

自然的视觉效果

无论是皱纹的加深、皮肤的松弛,还是发色的改变(如变白),Cradle2Cane 都能生成极其自然的细节。 更重要的是,即使是处理 In-the-wild 的图片,在面对遮挡、侧脸、复杂光照时,该模型仍旧能够展现不错的效果。

图片
图片

灵活的应用扩展

得益于两阶段编辑的灵活性,除了单独改变年龄,该方法还能同步进行人脸属性编辑。比如该方法可以无缝地应用各种属性,例如,戴眼镜、绿色的头发、戴帽子,同时持续地进行年龄增长,显著提高了生成图像的多样性和可控性。

图片

更多结果

图片
图片

总结

Cradle2Cane 的成功证明了在生成式AI时代,针对特定任务的结构化解耦设计依然具有巨大的潜力。通过放弃"一步到位"的传统思路,采用由粗到精、先年龄迁移再ID增强的策略,南开大学与三星的研究团队为基于Diffusion的人脸年龄编辑任务提供了一个新的框架,来解决长久存在的"Age-ID trade-off"问题。 这不仅是一次算法的创新,更让我们看到了AI在数字娱乐、影视特效甚至寻找走失人口等社会公益领域的广阔应用前景。

参考文献

[1] From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging

技术交流社区免费开放

这是一个👉️免费👈️的高质量AIGC技术社群。

涉及 内容成/理解(图像、视频、语音、文本、3D/4D等)、大模型、具身智能、自动驾驶、深度学习及传统视觉等多个不同方向。这个社群更加适合记录和积累,方便回溯和复盘。愿景是联结数十万AIGC开发者、研究者和爱好者,解决从理论到实战中遇到的具体问题。倡导深度讨论,确保每个提问都能得到认真对待。

图片
欢迎扫码免费加入
图片



技术交流

加入「AI生成未来社区」群聊,一起交流讨论,涉及 图像生成、视频生成、3D生成、具身智能等多个不同方向,备注不同方向邀请入群!可添加小助手备注方向加群!

图片

没有评论:

发表评论

开源!数据治理平台,可以二开,可以商业化

数据治理平台 源代码 https://www.gitpp.com/essay/project-data-quality 可以商业化,市场巨大 PKU协议 数据治理平台「智数管家」功能、价值、场景与推广全解析 核心功能体系 数据资产全生命周期管理 数据源中枢 :支持MySQL、...