点击下方,关注我,后台回复【666】,免费领取【AI学习礼包】
大家好,我是肝铁侠。
最近《世界人工智能大会2024》大会真是出尽了风头,各家大模型厂商也是充分的发挥自己的优势,乐此不疲的介绍最新的科技成果,而作为这次大会上AI视频生成式大模型最亮眼的仔「快手可灵大模型」,这次可灵在大会上不仅推出了Web端,同时将AI绘画大模型「可图」给开源了,突然想到某大佬,前段时间说的"开源都是智商税",嗯~~~,我只能说达不到大佬的高度,还看不到他所说的点,反正对我有好处能学到到东西的,肯定就支持!
本文将对快手系产品可灵和可图一次讲明白,请各位观众老爷坐稳了。
01
HOTSPOT
可灵大模型
网址:https://kling.kuaishou.com/
关于可灵的APP端我写过两篇比较详细的文章,大家可以看看:
快手「可灵」图生视频霸气上线,「Sora」依然稳如老狗(付提示词)
那这次APP端有哪些更新呢?
一、APP中文生视频
可灵APP的文生视频中增加了高表现模式,每日可以生成3次的高质量的视频,同时直接就可以生成10秒视频。
二、APP中图生视频
可灵APP的图生视频中也增加了高表现模式,但图生视频没有10秒的视频时长。
02
HOTSPOT
可灵大模型Web端
网址:https://kling.kuaishou.com/
可灵官方团队也是非常贴心的放出了驯服指南:
提示词(Prompt)=(镜头语言+光影)+ 主体(主体描述)+ 主体运动 +场景(场景描述)+(氛围)
如果想要《视频驯服指南-V1.0》,可以下面关注公众号,回复"驯服指南"即可:
可灵Web端AI视频生成目前有两大主要功能:
一、文生视频
Web端文生视频和APP功能大致相同:
一)创意描述
其实就是填写AI视频描述的提示词。
二)参数设置
1、创意
创意向左边移动AI的创造力更强也就是想象力更丰富。
创意向右边移动AI视频的生成会紧靠根据提示词的要求,而减少AI的创造力。
2、生成模式
高性能:生成视频的速度更快,一般在4-5分钟。
高表现(每天3次):生成速度慢,但是视频质量高,生成时间最少5分钟,最长可能到30分钟。
3、生成时长
生成时长只有文生视频调整,10秒也只有高表现才能体验到。
4、视频比例
视频比例目前提供三个:16:9、9:16、1:1。
三)运镜控制
运镜:类似于电影的运镜,它将摄像机的运动与影片的叙事紧密结合,创造出独特而富有张力的视觉体验。通过平移、升降、旋转等多样化的镜头运动方式,电影运镜能够引导观众的视线,加强情感表达,使观众如同身临其境地感受故事的发展。
所以可灵为了制作出来的视频更有大片韵味,特别加入了多种运镜选项,效果也确实不错。
但目前运镜只能针对文生视频,且只针对高表现模式下的 5 秒视频制作。
四)不希望呈现的内容
如果用过Stable Diffusion的朋友对应该对此功能并不陌生,可以排除在视频中出现畸形、多指等问题,所以可以适当的加入需要排除的负面提示词,以减少出现错误的几率。
二、图生视频
其实做过AI视频的人都知道,文生视频玩的创意,而图生视频才适合做完整的故事。图生视频在文生视频的功能基础上加入了,根据上传图片和提示词生成高质量视频。
一)首位帧
图生视频在文生视频功能的基础上加入了首尾帧的创意,可以直接从文生图或图生图的历史创作中选择图片完成视频创作。
当然首位帧也只针对高保真的视频生成,每天也只能3次。
03
HOTSPOT
可图大模型
网址:https://kling.kuaishou.com/
一、开源
可图文生图模型Kolors在世界人工智能大会2024上宣布开源,Kolors模型的能力甚至都超过了MidjourneyV6版本,目前可以完整的运行在ComfyUl上。
二、使用
目前可图有三个版本:
1)APP版本
通过快影的文生图可以使用,这个其实不用介绍,直接可以通过提示词进行图片的生成。
2)Web版本
网址:https://kling.kuaishou.com/
1、快手可图大模型主要功能:
文生图功能:根据文本描述生成图像。
图生图功能:根据已有图像生成新图像,如AI形象定制。
AI形象定制:通过人脸保持技术,保留人像的自然特征,一键生成不同风格的人像作品。
高质量输出:可图只需1张图和几秒钟,即可生成一套高质量的AI图像。
3)小程序版本
小程序算是非常有意思了,不仅有文生图、AI滤镜和单人写真的AI创作,同时还有双人合影和AI盲盒的应用,很好玩。
文生图 | 图生图:AI盲盒 |
图生图:单人写真 | 图生图:双人合影 |
好了这就是今天的全部内容了,感谢观众老爷的观看,在最后如果有任何问题的朋友可以直接加微信,我为您精心准备了AI学习大礼包和学习群,为你开启AI的学习之旅。
扫码
连接我领礼包
声明:已经有多名同学领到礼包,加好友就送,绝对没套路!
「 往期文章 」
我愿称它为 AI 配音界的天花板(附一键安装包和12000种音色库)
Runway Gen-3 Alpha 如约开放!Luma、可灵集体沉默,Sora真没啥可期待了!(附使用方法和提示词)
Claude 3.5上线4天后,全网网友都玩疯了!居然能制作GPT-4o的克隆体,关键还免费!
快手「可灵」图生视频霸气上线,「Sora」依然稳如老狗(付提示词)
「Claude3.5」全面超越「gpt-4o」,我用它做了个贪吃蛇,玩了一整天!
没有评论:
发表评论