2025年9月20日星期六

替换视频人物:阿里开源wan2。2-vace-fun,可实现图片人物替换视频人物,文末一键包

最近阿里持续在图文视频领域发力,其开源的wan系列一直是国内头部,最近阿里开源了wan2.2-vace-fun,可以实现一张图片替换视频人物,很是好玩呀,哈哈,笔者第一时间测试了一下,感觉以后做自媒体又多了一个途径,废话不多说,直接上干货,文末给大家找了一个一键包,不喜欢细节的可以直接文末获取。
老规矩先看效果
效果

人物图片
图片
要模仿的动作


01


项目简介

Wan2.2-Fun-14B文图生视频权重,以多分辨率训练,支持首尾图预测。以VACE方案训练的Wan2.2控制权重,基础模型为Wan2.2-T2V-A14B,支持不同的控制条件,如Canny、Depth、Pose、MLSD、轨迹控制等。支持通过主体指定生视频。支持多分辨率(512,768,1024)的视频预测,支持多分辨率(512,768,1024)的视频预测,以81帧、每秒16帧进行训练,支持多语言预测。

02


程序应用

机器配置:
笔者机器是:window,32G内存,16G4080显卡
运行使用显存最高8G,如果显存不足,会自动使用内存
实践应用:
下载解压程序后,点击【开始.bat】会自动弹出使用页面
图片
上传要模仿的视频和一张要替换的人物图片,然后写上中文提示词,注意视频的帧率和时间长度要和你上传的一致。
点击【开始运行】
运行成功后,结果如下
图片
一键包也提供了 comfyui的使用工作流,直接一键启动。
需要的赶紧试试吧
需要一键包和模型文件的,关注后私信回复【va】可以获取
大模型感兴趣的可以进群交流,已在群的就不要进了,我会定时清理
图片
#文生图#数字人#图生图#视频人物替换#comfyui#wan#阿里

03


历史优秀文章

AI+3D打印:从一张图片到真实的手办,保姆教程实现手办自由!文末一键包
图片数字人:对话唱歌都很自然,文末一键包,还有comfyui一键包
qwen-image-edit保持一致性真不错,图片编辑很灵活,文末一键包
基于claude code 接入国产模型,可调用agent,可控制操作系统,无需梯子使用本地大模型

没有评论:

发表评论

OCR 文档识别赛道,新王诞生!

伴随着大模型与视觉识别技术的迅猛发展,无论是企业还是个人对电子化办公的需求都在持续攀升,围绕 PDF 文档的解析还原能力也正在从 "能用" 向 "好用" 迈进。 在发票报销、合同归档、学术论文整理、复杂表格抽取、竖版古籍提取等众多的实际...