2026年4月28日星期二

GPT-image-2提示词教程:新手可控出图的风格、构图、镜头与光线

GPT-image-2出图不稳定?本文教你用风格、构图、镜头、光线四步写出可控提示词,附2000+案例GitHub项目及OOAI平台链接。

Tags:

GPT-image-2爆火,但很多朋友还是写不好提示词

最近GPT-image-2出来之后,OOAI创作平台第一时间也上线了GPT-image-2模型。

但很多朋友反映自己生成的图片跟网上看到的相差很大,同样是用GPT-image-2出图,但不同的提示词生成的结果可能大相径庭。

这篇文章就讲讲怎么写出“可控出图”的风格、构图、镜头与光线提示词。

另外分享一个GPT-image-2提示词合集项目,里面有从网络上收集的2000+优秀提示词案例,以供大家学习借鉴:

GPT-image-2提示词合集地址:

https://github.com/YouMind-OpenLab/awesome-gpt-image-2

GPT-image-2可以在OOAI创作平台中使用:

https://ooai.ai/

那么,应该怎么写出好的提示词呢

你不是不会审美,你是卡在“翻译”这一步

如果把 2024—2026 这波 AI 生图热潮封进时间胶囊,2030 年的人大概率会看得直乐。

人类明明一眼能分清:这张“高级”、那张像“廉价海报”。

可一到输入框,就只剩下三件套:好看、电影感、高清。然后祈祷模型懂你。

提示词不是咒语,是说明书。你写得越像拍摄/美术执行单,模型越稳定;你写得越像许愿清单,你越像在抽盲盒。

更现实的一点:社区里提示词库确实多,我在 GitHub 上也能搜到不少提示词合集/清单类仓库(直接搜索 “prompt collection / stable diffusion prompts” 就能看到大量结果)。

但它们更像“成箱的预制菜”:能吃、也省事——就是吃久了你还是不会做饭。

你真正缺的不是灵感,而是一张“视觉语言 → 提示词语言”的翻译表:

  • • 脑子里有画面
  • • 但写不出可执行的指令

这篇文章不按“严格时间线”讲行业演进,而按新手更容易上手的四步进阶路径来拆:风格 → 构图 → 镜头 → 光线。近几年社区常见的写法确实有这些侧重变化,但不同模型、不同社区并不一定完全同步。

每一段都给你能直接复用的模板。


2019—2022:关键词时代的后遗症——别把“风格”当滤镜名

那几年最常见的写法,是把“风格”当贴纸往上贴:赛博朋克、蒸汽波、油画、8K、超清、史诗级。

当然能出图,但问题也很直白:不稳定、不可控、难复现

你今天觉得好看,明天同样的词可能像换了个厨师。

更靠谱的做法,是把“风格”拆成 4 个能观察、能描述的部件:

  • • 媒介/类型(摄影?插画?海报?)
  • • 笔触/材质(颗粒?纸张?厚涂?金属?)
  • • 色彩策略(低饱和?高对比?单色系?)
  • • 时代/文化语境(70s 印刷广告?90s 街拍?日系海报?)

风格翻译词典:把“感觉”写成细节

  • • “高级”“干净” → minimalist, clean background, limited color palette, lots of negative space
  • • “复古” → 1970s print ads, halftone dots, slightly yellowed paper texture, muted colors
  • • “日系清透” → soft pastel tones, high-key, gentle contrast, airy atmosphere
  • • “厚涂感” → painterly, visible brushstrokes, textured paint, impasto highlights
  • • “像杂志大片” → editorial fashion photography, styled set, polished retouching

新手最容易踩的坑是:只写“油画风/电影感”。

你得补一句:它为什么像?

模型不懂你心里的“高级”,但它懂:低饱和 + 负空间 + 柔和对比 + 纸张纹理

另外补一条:像 8K/超清/high detail 这类更偏“质量参数”,建议放到提示词靠后的质量/限制条件区域,而不是当成风格本体来写。

一套可复用的风格模板(直接拼)

[媒介/类型] + [材质/笔触] + [色彩与对比] + [时代/参考语境]

示例(替换方括号即可):

  • • digital illustration, smooth gradient shading, muted pastel palette, contemporary Japanese poster design
  • • film photography, fine grain, low saturation, 1990s street documentary vibe

风格越“可观察”,越能跨模型、跨版本复用;越抽象,越靠运气。


2023:构图时代——你不是在“画”,你是在安排观众先看哪

到了 2023,在一些社区里常见的变化是:越来越多人开始补“构图信息”。主体不变、风格不变,构图一换,质感直接换档

构图真正厉害的地方,不是“把元素摆好看”。

是控制视线:观众先看哪里、再看哪里、停多久。

你不写构图,模型就按它的默认审美来——通常很平均、很安全。

但你想要的可能是:压迫感、孤独感、信息密度爆炸。

构图翻译词典:把画面感觉变成指令

  • • “突出主体” → center composition 或 tight framing / close-up
  • • “更有故事” → foreground / midground / background layers, environmental storytelling
  • • “压迫、强势” → low angle, subject near the top edge, tight framing
  • • “孤独、空旷” → small subject, vast negative space, wide shot
  • • “秩序感” → symmetry, leading lines, grid-like composition
  • • “动态、冲击” → diagonal composition, motion blur streaks, off-center framing

新手最稳的 3 种构图写法

1)层次法(最像电影分镜)

foreground elements (out of focus) + subject in midground + background context

2)比例法(把主次写死)

tight framing on the subject, background minimal

3)留白法(让“氛围”有落点)

large negative space on the left, subject on the right third

有个小技巧很管用:

写“rule of thirds”不如直接写 “subject on the right third”

前者是术语,后者是动作指令。模型更容易照做。


2024:镜头时代——从“清晰好看”到“像摄影师拍的”

从 2024 开始,在一些提示词写法里,镜头信息出现得更频繁:焦段、景深、机位、对焦点、运动感。

原因很简单:当大家都能生成“清晰好看”的图后,区分度往往来自“镜头语言”。

我更愿意把它说成:镜头信息常常是新手最容易验证、也最容易复现的一类控制杆

因为它会同时改掉:透视、空间关系、脸的比例、背景压缩程度。

镜头翻译词典:零基础也能直接用

  • • “更像手机随拍” → 28mm wide, slight distortion, casual framing
  • • “更像人眼、舒服” → 35mm, natural perspective
  • • “更像人像大片” → 85mm portrait lens, shallow depth of field, creamy bokeh
  • • “很有空间感、建筑宏大” → 16mm ultra-wide, dramatic perspective, vertical lines
  • • “背景被压扁、很电影” → telephoto compression, compressed background
  • • “主角很近、情绪强” → close-up, tight framing, focus on eyes
  • • “速度感” → panning shot, motion blur

把镜头写进去,你通常能感觉到:画面像换了一个更明确的拍摄方案。

镜头“四件套”(更稳定的写法)

[焦段/镜头] + [机位角度] + [景别] + [对焦与景深]

示例:

分解版(逐行)

  • • 85mm lens
  • • eye-level
  • • medium close-up
  • • shallow depth of field
  • • focus on the eyes

合并版(整句)

  • • 85mm lens, eye-level, medium close-up, shallow depth of field, focus on the eyes

分解版(逐行)

  • • 16mm ultra-wide
  • • low angle
  • • wide shot
  • • deep focus
  • • sharp from foreground to background

合并版(整句)

  • • 16mm ultra-wide, low angle, wide shot, deep focus, sharp from foreground to background

写“电影感”很难被稳定执行;写“35mm、低机位、浅景深、对焦眼睛”,更像是在给模型明确的拍摄指令。


2025—现在:光线时代——把“氛围”从玄学拽回摄影棚

近一两年在一些社区里,光线描述变得更细:当大家更追求“像真的”,光线常常是最直接的区分点之一。并不是说以前不重视光线,而是现在更常被写进提示词、变成可复用的结构化描述。

很多新手写光线,只有两句:柔光、氛围感

结果是:图也许好看,但不稳定;更要命的是——

你想要“悬疑”,它给你“温柔”;你想要“广告棚拍”,它送你“夕阳滤镜”。

我的态度很明确:光线要写到摄影棚能执行

至少交代 3 件事:

  • • 光源方向
  • • 光质(软/硬)
  • • 色温/色彩关系

光线翻译词典:把情绪落到参数上

  • • “高级棚拍” → studio lighting, softbox key light, controlled shadows, clean reflections
  • • “电影侧逆光” → backlight / rim light, strong edge highlights, moody shadows
  • • “阴天自然光” → overcast daylight, soft shadows, low contrast
  • • “夕阳氛围” → golden hour, warm highlights, long soft shadows
  • • “霓虹夜景” → neon practical lights, mixed color temperatures, blue-magenta contrast
  • • “恐怖感” → underlighting, high contrast, hard shadows, limited fill
  • • “梦幻” → diffused light, haze, glow bloom, pastel color grading

一句话把光线写清楚(建议直接背)

key light from [方向], [光质], [色温/色彩], [阴影控制], optional: haze/glow

示例:

分解版(逐行)

  • • key light from the left
  • • soft diffused
  • • neutral daylight
  • • gentle fill
  • • subtle skin highlights

合并版(整句)

  • • key light from the left, soft diffused, neutral daylight, gentle fill, subtle skin highlights

分解版(逐行)

  • • key light from behind
  • • hard rim light
  • • cool-blue ambient with warm practicals
  • • deep shadows
  • • slight haze

合并版(整句)

  • • key light from behind, hard rim light, cool-blue ambient with warm practicals, deep shadows, slight haze

我常用一个类比劝人:

你去咖啡馆拍照,和店员说“给我来点氛围感”,他只会尴尬。

但你说“把窗边那盏暖灯打开、把顶灯关掉”,他立刻就懂。

提示词也一样:别许愿,给操作。


适用范围与模型差异提醒:哪些更稳,哪些更看模型

不同文生图模型(以及同一模型的不同版本/不同平台封装)对摄影术语、数值与“伪参数”的理解差异很大。为了让你更容易复现,这里给一个实用分层:

  • • 通常更稳(更像动作指令)low angle / high angleclose-up / wide shotsubject on the right thirdsymmetryleading linesshallow depth of fieldbacklight / rim lightsoft light / hard lightneon practical lightsnegative space
  • • 可能有效但更依赖模型(数值/精确比例类)subject occupies 60% of the framesubject takes up 70% of the frame 这类百分比;以及过于精确的技术写法
  • • 更容易“看起来专业但不一定可控”(摄影参数拟态):例如 1/30s shutter look 这类快门速度写法,有时会生效,有时会被当作无意义噪声;更稳的替代通常是 motion blurpanning shotlong exposure trails

如果你照抄某条指令效果不明显,优先把它改写成可观察结果:用 tight framing/close-up 替代百分比,用 telephoto compression / compressed background 替代过度精确的镜头暗示,用 soft diffused light 替代笼统的“氛围感”。


把四类概念装进同一个提示词:一张“翻译拼装公式”

当你能写清 风格、构图、镜头、光线,提示词就不再是散装关键词。

它会变成一个可复用的“镜头方案”。

我建议的拼装顺序是(不教条,但稳定):

主体与场景(发生什么) + 构图(画面怎么安排) + 镜头(怎么拍) + 光线(怎么照) + 风格(怎么呈现) + 质量/限制条件(不要什么)

下面给你一条完整示例(主体可替换):

分解版(逐行)

  • • A lone cyclist on a rainy city street at night
  • • subject on the right third with large negative space on the left
  • • foreground raindrops bokeh
  • • 35mm lens
  • • eye-level
  • • medium shot
  • • shallow depth of field focusing on the cyclist
  • • neon practical lights with mixed color temperatures (blue ambient + warm signage)
  • • wet asphalt reflections
  • • slight haze and glow bloom
  • • cinematic color grading
  • • film grain
  • • high detail
  • • no text, no watermark

合并版(整句)

A lone cyclist on a rainy city street at night, subject on the right third with large negative space on the left, foreground raindrops bokeh, 35mm lens, eye-level, medium shot, shallow depth of field focusing on the cyclist, neon practical lights with mixed color temperatures (blue ambient + warm signage), wet asphalt reflections, slight haze and glow bloom, cinematic color grading, film grain, high detail, no text, no watermark

你会发现:这里几乎没靠“玄学词”撑场面。

哪怕出现 cinematic,也被镜头和光线托住了,不会飘。


结尾:提示词会越来越像“视觉写作”,而不是“关键词搬运”

我更愿意把它说得直接一点:

提示词不会消失,但“提示词集合崇拜”会慢慢失效。

模型越来越聪明,能补全你没说的;而真正拉开差距的,是你能不能把脑海画面写成可执行的视觉指令。

说不清风格、构图、镜头、光线,你就只能靠运气抽图;写得出句子,你才开始拥有稳定的创作能力。

下次卡在输入框里,别再硬憋“高级感”了。

把问题换成 4 个更具体的:

  • • 我想让观众先看哪里?(构图)
  • • 我想离他多近?(镜头)
  • • 我想让他觉得冷还是暖?(光线)
  • • 我想让画面像什么媒介做出来的?(风格)

把答案写进去。

你就从“许愿的人”,变成“会调度的导演”。

没有评论:

发表评论

GPT-image-2提示词教程:新手可控出图的风格、构图、镜头与光线

GPT-image-2出图不稳定?本文教你用风格、构图、镜头、光线四步写出可控提示词,附2000+案例GitHub项目及OOAI平台链接。 Tags: GPT-image-2 AI提示词教程 可控出图 风格构图镜头光线 新手友好 ...