阿里WanX2.1:文生和图生视频模型ComfyUI体验WanX 2.1简介在昨天的文章(阿里Wan2.1
阿里WanX2.1:文生和图生视频模型ComfyUI体验
WanX 2.1简介
在昨天的文章(阿里Wan2.1:最强开源视频,本地部署优先体验!Vbench榜首第一,超越Sora&混元&Gen3&Pika等)已经介绍有阿里巴巴通义万相团队开源的最新的最强开源AI视频生成模型:Wan 2.1视频模型。Wan 2.1视频模型是首个能够生成中英文文本的视频模型,具有强大的文本生成能力,增强了其实用性;提供了强大的文本到视频(text-to-video)和图像到视频(image-to-video)生成,以及视频编辑、视频到音频等任务能力;登顶Vbench榜首第一,超越Sora、HunyuanVideo、Minimax、Luma、Gen3、Pika等国内外视频生成模型。
• 参考文章:阿里Wan2.1:最强开源视频,本地部署优先体验!Vbench榜首第一,超越Sora&混元&Gen3&Pika等 • Github:https://github.com/Wan-Video/Wan2.1 • 在线体验:https://www.runninghub.cn/ai-detail/1894632237306937345?utm_source=kol01-RH059
Wan2.1视频模型ComfyUI体验
当前社区大佬kijai已第一时间神速完成了ComfyUI-WanVideoWrapper插件支持ComfyUI体验。模型文末网盘获取。
• ComfyUI-WanVideoWrapper:https://github.com/kijai/ComfyUI-WanVideoWrapper • Wan2.1模型:已完成fp8模型的量化并发布huggface。下载并放置对应模型(unet、clip、vae目录)。文末网盘已放置好,直接覆盖models目录。模型地址:https://huggingface.co/Kijai/WanVideo_comfy/tree/main
Wan2.1视频模型ComfyUI工作流
Wan2.1视频模型ComfyUI工作流已上传LIBLIB平台:https://www.liblib.art/modelinfo/dd0437999e2d4503afd58616a7b97807?versionUuid=4aeaf0a203aa4defbd283a78d5e65c26
注意:
• 使用最小显存可16G运行,使用使用20/40块卸载方式加载。 • 14B文生视频和图生视频都有很好稳定的质量,当然依赖提示词质量。后续静待社区LORA等生态成熟,有望直逼闭环视频模型。 • 24G显存运行480*848分辨率共81帧(每帧16,视频长5分钟视频)约4-5分钟时长。
01.喝茶
古风女人坐在茶桌旁,端起茶杯放到嘴边,妩媚、悠闲的喝茶。
02.巾帼英雄
女人缓缓的带上面具,遮住了脸部,一副巾帼英雄的威严,面向镜头方向。高质量视频
03.文生图-转身
中国国风,古风美少女,头戴发饰身穿古代服饰,转身看向镜头
04.猫咪厨房
45度俯视固定镜头,中景,浅景深,晨光穿过梧桐斑驳洒落。画面中央的橘猫穿着围裙,稳稳举刀切黄瓜,尾巴随着切菜节奏轻晃。背景灶台炊烟缭绕上升,阳光斜射在木案与老铁锅上泛起温暖光晕。
感谢你看到这里,也欢迎点击关注公众号并添加公众号小助手加入官方读者交流群,一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术,欢迎一起交流学习💗~
没有评论:
发表评论