2026年6月23日星期二

AI视频生成教程 世界杯美女观众制作方法 HappyHorse 1。1优惠每秒0。54元起

本文详细拆解火爆全网的世界杯美女观众AI视频制作全流程,包含生图提示词、HappyHorse 1.1模型首帧生视频操作步骤及多场景应用(广告、游戏界面、直播带货)。适合AIGC创作者与视频爱好者。核心亮点:人物表情精控、指令遵循强、音画同步稳定,且优惠后1080p视频生成成本降至每秒0.72元,720p仅0.54元。

Tags:

最近正值世界杯,经常会刷到这种世界杯美女观众的视频:

图片

是不是感觉这些女孩不像真人?

一刷评论区,有这种疑惑的人还真不少。

图片图片图片

其实,里面确实也有真人观众,但大部分类似主题的美女视频,都是 AI 生成的。

我也生成了一个,放在下面了:

是不是很真实?

我在这里分享下我的工作流。

首先生成首帧图片,可以用 GPT Image 2 之类的生图工具生成,提示词参考如下:

   一位法国女球迷坐在世界杯球场观众席里,镜头是电视转播捕捉到的半身中近景。
她是年轻白人女性,五官精致,蓝灰色眼睛,棕色微卷长发自然披散,气质清冷高级,美若天仙。
她脸颊两侧画着法国国旗蓝白红彩绘,耳朵戴着法国小旗耳坠,身穿深蓝色法国队吊带球衣。
背景是虚化的观众席,周围有穿蓝白红球衣的法国球迷、法国国旗和红色座椅,现场氛围像世界杯比赛直播。画面左上角有比赛比分牌:FRA 2 - 1 AUS;
右上角有电视台直播标识:TF1 DIRECT LIVE。
整体像真实体育赛事直播截图,人物居中偏右,背景浅景深虚化,画面干净、真实、有电影感。`


`style prompt:`


`Photorealistic live sports broadcast still, FIFA World Cup stadium crowd shot, 
close-up telephoto lens, shallow depth of field, realistic skin texture, natural 
stadium lighting, ultra-detailed face, broadcast TV graphics overlay, high-
resolution sports photography, cinematic realism, sharp subject with soft blurred background, authentic live TV capture, 
85mm lens look, natural colors, 
no illustration, no cartoon, no CGI.`


`--ar 16:9 --style raw --v 6.1 --q 2 --s 120

要生成其他国家的女生,按需替换中文提示词就可以。英文提示词是用来限定影像风格的,不要更改,直接复制粘贴。

然后,打开 HappyHorse,选择 1.1 版本的模型,首帧生视频模式,将你生成的图片放上去。

图片

视频生成提示词:

   【镜头运动】 固定镜头切换 (Fixed Camera Cut):模拟现场直播的摄影机视角,前3秒平稳,最后以一种尴尬又可爱的互动视角结尾。


【画面描述】 0-3秒:画面完美复刻转播镜头,女生原本正认真看着赛场,神情平静自然。左上角的比分栏和右上角的SPOTV台标清晰可见,画面带有轻微的广播级画质感。 
4-7秒:他先是愣了一下,随即意识到全场都在看他,表情从冷静瞬间转变为羞涩的惊慌。 
8-10秒:他不好意思地露出一个略显尴尬的微笑,美丽。周围隐约可见观众席的晃动,最后画面在转播台切换镜头的特效中自然收束,转回比赛现场。


【视觉风格】 广播级体育现场转播风 (Broadcast Sports Live-Streaming):保持高清电视画质,色彩呈现直播特有的明亮感,带有轻微的电子干扰纹理,完美还原图片中的
UI信息层(比分框与台标)。


【光影设计】 体育馆内部的高强度聚光灯光效,光线打在人物脸上明亮且略带冷色调,强调出那种“被聚光灯锁定”的现场感。


【节奏与情绪】 从专注的沉静  突发的尴尬惊奇  羞涩的互动。节奏符合现场直播的真实感,情绪自然、生动且极具代入感。


【声音联觉提示】 背景是巨大的体育馆现场嘈杂声(欢呼声、口哨声),当他上大屏幕时,人群中发出了起哄的笑声和尖叫,背景音乐是热血的足球比赛应援旋律,结尾处
伴随转播切换的轻微电子音。
   
图片

这里值得注意的是,可以先使用 720p 生成视频,抽卡抽到合适的视频以后,再升级成 1080p。

画面描述一定要搭配“x秒”写,这是视频生成具有活人感的关键。

左下角这里还可以选择画幅比例,建议和你生图时的 16:9 的比例保持一致。不过,你也可以在第一步就生成竖屏美女,毕竟竖屏比较适合短视频。

图片

HappyHorse 的会员一次可以生成 4 个视频,不是会员的话,一次生成 2 个视频也够用了,非会员不限制生成 1080p 的视频。

在意抽卡速度的朋友可以考虑一下这个 7 天 6.6 元的会员,还挺划算的。

图片

最后,将生成的视频放到剪辑软件里,作简单拼接处理,就大功告成了!

图片

HappyHorse 的长项在于情绪精控,我个人体验下来,在人物表情这一块做得非常极致。如果你在生视频时,老碰到人物表情僵硬,神态没有活人感的问题,可以尝试一下这个模型。

除此之外,我还用它生成了一个世界杯主题的零食广告。

没有用到任何故事板辅助,仅用纯文字描述分镜,4 抽已经能达到下面的效果:

给到的提示词比较长,但很实用。

大家复制后,可以直接丢给自己的 AI 微调提示词,替换成另外的产品。

   广告基本信息
时长:15
风格:世界杯大片感 / 幽默反差 / 电商电影广告
核心逻辑:赛前极致紧张  一口下去全员破防快乐
画面规则:不出现任何文字,不出现官方赛事 Logo,不出现真实队徽,商品与玩具比例严格符合实际大小。


0-3秒】悬念引入:决赛前的秘密装备
画面内容:
世界杯决赛夜,巨大的球场灯光照亮夜空,通道里气氛紧张。一个穿着黑色西装的冷酷足球教练站在更衣室中央,表情严肃。球员们沉默坐在两侧,所有人都像要上战场一样。
教练缓缓打开一个银色战术手提箱。箱子里没有战术板,也没有球鞋,只有一颗正常大小的恐龙蛋@Image1,安静躺在聚光灯下。


旁白独白(低沉、大片腔): “决赛最后三分钟,真正的秘密武器,终于登场。”


AI 视频生成提示词:
Cinematic World Cup inspired football locker room, tense final match atmosphere, 
a serious coach in a black suit opens a metallic tactical briefcase under dramatic
spotlight, inside the briefcase lies one real-size Kinder Joy egg, players 
sitting silently around him like soldiers before battle, stadium lights glowing 
outside, ultra realistic, 8k, dramatic lighting, commercial film style, no text, 
no logos, no words.


【3-7秒】神级操作:战术被撕开了
画面内容:
教练戴着黑色战术手套,像拆炸弹一样小心翼翼地拿起恐龙蛋。全队屏住呼吸。
他“啪”地一声把恐龙蛋撕开成两半。
镜头特写:左边是浓郁的牛奶可可酱,上面有两颗松脆小酥球;右边是一个蓝色迷你足球玩具和一把白色小勺,里面还有小恐龙。
旁边的球员震惊地瞪大眼睛,仿佛看见了世界级战术。


旁白独白(极度严肃):
“左路,双重能量核心。右路,快乐进攻阵型。”


AI 视频生成提示词:
Extreme close-up, black gloved hands slowly opening a Kinder Joy egg into two 
halves inside a football locker room. Left half shows rich white milk cream and
cocoa cream with two crispy wafer balls. Right half shows a tiny blue football 
toy and a small white plastic spoon. Serious football players in the blurred 
background look shocked. High-end food photography, macro detail, realistic 
proportions, cinematic commercial lighting, no text, no logos, no words.

【7-11秒】灵魂反转:硬汉教练破防
画面内容:
教练拿起小勺,优雅地挖起一颗沾满牛奶可可酱的小酥球,放入口中。
下一秒,他原本冷酷的表情彻底崩塌。眼睛突然放光,嘴角控制不住上扬,背景从紧张更衣室瞬间变成梦幻的绿茵奶香风暴。
身后的球员也全部破防,从严肃备战变成幼稚小孩一样欢呼。有球员抱着足球跳舞,有人举着小勺庆祝,教练头上突然出现一个滑稽的足球生日纸帽。


旁白独白(突然变成欢快魔性男声):
“一口下去,战术忘掉,快乐进球!”


AI 视频生成提示词:
A serious football coach eats a chocolate wafer ball from a tiny white spoon. 
Slow motion funny reaction, his cold face instantly turns goofy and joyful, eyes
shining, players behind him suddenly celebrate like children, surreal green
football field and milk splash background, funny football party hat appears on 
the coach, photorealistic, cinematic comedy commercial style, no text, no logos, 
no words.


【11-15秒】高潮收尾:真正的世界杯快乐
画面内容:
镜头拉开。更衣室桌面变成一块迷你足球场。那辆蓝色迷你足球玩具和小恐龙在桌面上飞速滑行,像在带球突破。
教练穿着西装、戴着足球纸帽,趴在桌子上,用手指推着迷你玩具冲向“球门”。几个球员围在旁边兴奋呐喊,完全忘记自己马上要踢决赛。
最后画面定格:桌上正常大小的恐龙蛋、一把小勺、两颗小酥球、蓝色迷你足球玩具。背景是暖光更衣室和远处隐约的球场灯光。


旁白独白(欢快、有感染力):
“恐龙蛋,一口美味,双重快乐。世界杯看球夜,买它!”


AI 视频生成提示词:
Wide cinematic commercial shot, a funny football coach in a black suit wearing a 
small football party hat lies on a locker room table, joyfully pushing a tiny blue
football toy with his finger like a mini match. Football players gather around 
laughing and cheering. A real-size Kinder Joy egg, tiny spoon, cream dessert and 
toy are on the table with realistic proportions. Warm locker room lighting, 
stadium lightsinthebackground,hilariouscontrast,high-ende-commercevideo,ultrarealistic,8k,notext,nologos,no words.

之前 1.0 版的 Happyhorse 上线时,多分镜视频生成,很容易出现幻觉。

1.1 版本更新后,确实有了明显的进步,更能理解专业镜头语⾔,在节奏编排与叙事表达上,也更加⾃然流畅。

特别是在广告生成领域,看得出来应该是补充了不少素材....

图片

另外,我抽卡时几乎没遇到过音画不同步的情况,联同生成非常稳定,10 抽里至少有 9 抽的人声都是可用的,而且模型还会根据画面生成的结果,自主调节人声和音效的节奏。

这一点在我这里挺加分的,因为成片感会强很多,后期要修的地方也少很多。

图片

由于前面的 case 效果还不错,我就给它上了点难度。

前段时间,用 AI 生成游戏界面在网上比较火,我也想自己手搓一个西游主题的角色选择界面,但是一直没空。

大圣,我来了!

我的成片:

做这个视频的步骤会比前面的要复杂一些。

首先,要生成四个角色的白底三视图,以及一张首帧游戏界面。

这一步是为了人物拉近摆 pose 时,能做到五官精控。

图片

人物生成提示词:

   白色纯背景,孙悟空角色设定图,3A游戏角色三视图,正面、侧面、背面并排展示,全身比例,
暗黑中国神话风格,瘦而强壮的猴王战士,毛发凌乱,金色瞳孔,脸部带有野性和神性,
身穿破损金甲、兽皮披肩、红色破布腰带、旧佛珠和金属护臂,手持如意金箍棒,
棒身有古老雕纹和磨损痕迹,整体像黑神话风格的主角模型,高精度写实3D,PBR材质,电影级灯光,
Unreal Engine 5 render,character turnaround sheet,front view side view back viewno textno logo,no UI,no background scene

游戏界面生成提示词:

   给我生成一张大师级3A游戏人物选择界面,3d游戏,中国古代暗黑神话,庙内,篝火旁坐着4个人,孙悟空@参考图1、猪八戒@参考图2、沙僧@参考图3、白龙马@参考图4

然后,扔到 HappyHorse 1.1 里,选择参考模式,放入四张参考图,生成 15s 的视频。

    游戏画面第一阶段选择角色,@Image2 为首帧图,鼠标依次划过侧边角色栏,
 同时镜头推进特写(zoom in),每个角色依次起立展示自己的招牌动作武打pos,
 每个角色2-3s,顺序是孙悟空  猪八戒  沙僧  白龙马。
 白龙马脸部参考@Image6 沙僧脸部参考@Image5 猪八戒脸部参考@Image4
 孙悟空脸部参考@Image3,然后选择左侧的孙悟空,他立即起身挥舞金箍棒摆出战斗姿势。

因为人物动作复杂,如果直接生成 15s 的视频,需要 10 抽以上才有比较好的效果。

目前 HappyHorse 还不能很好地控制左侧文字。追求精控的朋友也可以分开生成角色摆 pose 的 3s 片段,然后作拼接。

图片

我顺手还生成了一个游戏实机画面:

首帧生成提示词:

   3A动作角色扮演游戏截图,中国古代暗黑神话风格,第三人称越肩视角,
主角孙悟空背对镜头站在画面中央,身穿破损战甲与兽毛披风,手持金箍棒,正面对峙远处巨大的牛魔王BOSS。
场景是火焰山深处的古老神庙,石桥横跨熔岩河,地面刻着发光的符文阵,桥两侧岩浆翻涌,

远处宫殿被火光照亮,巨型牛魔王坐镇神庙中央,双角巨大,眼睛发红,身后燃烧着冲天火焰。
空气中漂浮火星、黑烟、灰烬,整体压迫感强,史诗级BOSS战前夕,暗红色火光,电影级构图,
强烈景深,高细节材质,写实3D渲染,游戏UI界面,左上角任务提示,右上角小地图,

底部血条、技能图标、法术按钮,沉浸式战斗HUD,16:9横屏。

视频提示词:

   1-3秒:


孙悟空突然向前冲刺,沿着刻满发光符文的石桥快速奔跑,镜头跟随在他身后,轻微手持感和速度感,金箍棒斜背在身后。


3-6秒:


孙悟空跑到牛魔王附近,牛魔王猛然站起并发出震撼嘶吼,身体开始变身膨胀,双角燃起熔岩红光,肌肉暴涨,
背后火焰爆发,神庙地面震裂,冲击波吹散烟尘。
此时画面顶部出现巨大的BOSS血条,名称显示为“牛魔王”,压迫感极强。


6-8秒:


孙悟空停步旋身,双手握住金箍棒,快速挥舞出第一击,金箍棒带出金色残影和火焰粒子,
冲向牛魔王腿部或胸口。牛魔王挥臂迎击,双方武器/拳风第一次碰撞,爆出火星和冲击波,
画面进入正式战斗状态,底部技能图标亮起,镜头剧烈震动但保持清晰,不要结束战斗。

这个思路可以直接拿去复刻生成任何游戏的 boss 战。

我跑下来最大的感觉是,HappyHorse 对物理世界的理解更上一层楼,1.0 版本时人物打架还轻飘飘的,没有重量。

1.1 版跑的实机画面已经明显能看到打击感了。

孙悟空挥舞金箍棒时,攻击方向和牛魔王的迎击动作是连贯的,前面奔跑时的透视也没有问题。

看了 case 手痒的,现在就可以自己去跑一版了。

图片

众所周知,HappyHorse 是阿里旗下的视频生成模型。我个人比较期待版本升级后,它在电商场景的表现。

电商赛道用 AI 最怕两件事:一个是人说话不自然,另一个是商品失真。

这两个问题没解决,画面再精致,也很难投入真实场景使用。

我试着生成了一段口红带货的视频:

先生成人物首帧图,确定主播的形象。

人物生成提示词:

   竖屏9:16,真实影像风格,近距离自拍视频构图,一位成年东亚女性美妆博主,面对镜头微笑说话。
她有白皙通透的皮肤,小巧鹅蛋脸,五官精致,大而有神的眼睛,清透卧蚕,细长自然眉,挺直鼻梁,粉色水润唇妆,整体是甜美干净的韩系妆容。
她留着深棕色长发,微卷蓬松,中分八字刘海,头发自然垂落在肩侧。
佩戴银色小花耳钉、精致四叶草项链。穿白色蕾丝边吊带上衣,外搭米白色轻薄针织开衫,
气质温柔、亲近、像直播间里的美妆达人。
画面像手机前置摄像头拍摄,真实直播质感,soft lighting,realistic beauty influencer vlog style。

再生成商品白底图,这一步是为了保证视频能还原产品细节,不发生畸变。

图片

商品生成提示词:

口红,白底电商主图,商业产品摄影,极简风格

也可以用已有商品生成白底图,直接在指令后@参考图就可以。

使用 HappyHorse 参考模式,上传首帧图和商品图。

视频生成提示词:

生成女主播@Image1 直播带货@Image2 的真实影像,女主口播台词:姐妹们,这款口红真的属于那种一拿出来就很有质感的口红。你看,上嘴之后颜色很高级,显气色但不夸张,薄涂是日常温柔感,厚涂气场一下就出来了。我最喜欢它的一点是,它的妆效很精致,不会显得嘴巴很廉价。

成片我比较满意的地方是:

1、在提到口红效果的时候,模型会自主生成口红试色的片段,没有一直机械地讲解。

2、主播语气很自然,有直播带货的亲和感。

不足的地方也比较明显,如果能生成一段连贯的“打开口红—展示膏体—上嘴试色—对镜头讲卖点”的动作,会更真实一些。

我个人感觉,这次的抽卡结果是可以直接用到现实的带货场景的, 不是只能拿来炫技的 Demo。

图片

HappyHorse 1.1 这次的升级,不是只是多了几个参数,而是把上一版里最影响成片质感的几个地方,集中补了一遍。

以前 1.0 有些片段单帧看还不错,但一动起来,镜头衔接并不紧凑。1.1 里这种问题明显少了,画面更连续,更符合逻辑。

角色一致性也更好了,人物在不同镜头里,不容易突然变脸、炸毛。

另外,指令遵循的能力变强了。它不只是理解“要什么画面”,更能理解“这个场景里应该发生什么”。有些动作和镜头,会根据上下文补出合理的表演。

视觉质感也有提升,光线、皮肤、布料、空间背景这些细节更完整,整体不再只是 AI 味很重的漂亮画面,而是更接近真实拍摄的质感。

音频生成也更自然,声音和画面内容的匹配度更高。

不管你是 AIGC 新手,还是 AI 深度创作者,我认为都是值得入手的。

图片

再看看价格方面:

现在HappyHorse 1.1已经上线了阿里云百炼平台和HappyHorse官网,目前还有优惠活动。以文生视频为例,生成720p视频每秒0.9元,优惠后是每秒0.54元;1080p的价格优惠后更是比之前1.0的版本降了25%,只需要每秒0.72元。

也就是说,它在提升画面、动态、角色一致性和音频表现的同时,还维持了创作者能接受的使用成本。

图片

最近,HappyHorse 还同步启动了 HORSEPOWER・AI 影像大赛。

这是一个面向 AI 视频创作者的投稿比赛,只要你能用 AI 做出一段完整视频作品,就可以在活动期间通过官网投稿。

奖项方面,官方慷慨给到了百万商单权益和算力奖金。

除此之外,优秀作品还有机会和张纪中导演的《镜花奇缘》剧组进行影像项目共创。

感兴趣的朋友可以去体验一下!

体验链接:https://www.happyhorse.cn/

没有评论:

发表评论

Agent研究爆发期:190篇必读论文与500个开源项目源码免费获取

本文聚焦当前快速发展的Agent赛道,涵盖大模型智能体的决策逻辑、记忆机制、多智能体协作等前沿方向。适合从初学者到资深研究员,提供190篇必读论文、321个谷歌落地项目案例及500个开源AI智能体应用,扫描文末二维码回复指定关键词即可免费获取全部资源。 Tags: Agent ...