2026年6月25日星期四

AI改图新方法:用无限画布标注需求让Codex精准修改教程

本文介绍利用Codex结合无限画布进行图片修改的实操流程。适合经常改图的设计师或运营人员。核心亮点是将文字需求转化为可视化标注,通过箭头和旁注明确修改位置,大幅降低AI理解偏差。提醒:此方法适合快速改稿,但最终交付图需人工检查,不适合精密UI或证件类图片。

Tags:

Codex + 无限画布:改图需求不用再反复讲

Codex 加无限画布改图
Codex 加无限画布改图

最近我看到一个特别适合做图的人用的 Codex 玩法:

把图片拖进无限画布,在画布上直接标注修改位置,再让 Codex 读取画布内容去改图。

它解决的不是“AI 会不会生成图片”这个问题。

它解决的是另一个更烦的问题:

你明明知道哪里要改,但用文字跟 AI 讲半天,它还是理解错位置。

比如一张课程海报里有 3 处文字要改,你如果只写:

“把 AI 工作流提效改成 Agent 工作流提效。”

AI 很可能不知道你说的是哪一行、哪一块、哪个标题。

但如果你把原图放到画布里,用箭头把“原文字”和“目标文字”连起来,它就清楚多了。

这就是这个方法最爽的地方:

不是把需求讲给 AI 听,而是把需求画给 AI 看。

先建立操作入口

从 Codex 打开浏览器入口
从 Codex 打开浏览器入口

第一步,在 Codex 里打开右侧面板。

里面可以进入内置浏览器。

这个内置浏览器很关键,因为后面 Codex 要看的不是你口头描述的画面,而是浏览器里正在展示的画布。

进入浏览器后,打开一个白板类网页工具。

你可以把它理解成一个无限画布:

• 可以拖入图片
• 可以写文字
• 可以画箭头
• 可以圈出重点区域
• 可以把改图逻辑摆在同一个画面里

这一步的价值,是先给 Codex 准备一个“视觉上下文容器”。

以前我们写 prompt,只能一行一行解释。

现在可以把图片、文字、箭头、修改关系都放到同一张画布上。

把原图拖进画布

把图片拖进无限画布
把图片拖进无限画布

第二步,把你要改的图片直接拖进去。

比如你有一张课程目录图,里面有几处标题需要替换。

不要急着让 Codex 生成。

先把原图放好,让它成为画布里的核心素材。

这里有一个小技巧:

原图不要放得太小。

如果图太小,模型读取文字和细节会更吃力。

最好让原图在画布里占据比较明显的位置,旁边留出空白区域,用来写修改目标。

把修改意图变成视觉标注

把修改意图写到画布上
把修改意图写到画布上

第三步,把你要改的内容直接写在图旁边。

比如:

• “课程大纲目录”改成“课程部分目录”
• “AI 工作流提效”改成“Agent 工作流提效”
• “AI 工作流”改成“Agent 工作流”

光写文字还不够。

最好再用箭头把目标文字指向原图里的对应位置。

这样 Codex 看到的就不是一段孤立的命令,而是一组明确的视觉关系:

画布元素
作用
原图
告诉模型要改哪张图
新文字
告诉模型改成什么
箭头
告诉模型对应哪个位置
多处标注
告诉模型这不是单点修改
空白区域
给提示词和修改目标留出阅读空间

这一步很像你在给设计师改稿。

你不会只说“这里改一下”。

你会圈出来、写旁注、画箭头。

现在 AI 也需要同样的上下文。

让 Codex 读取画布并调用生图

让 Codex 读取画布并调用生图
让 Codex 读取画布并调用生图

第四步,回到 Codex 的输入框,把提示词写清楚。

你可以直接这样写:

请读取内置浏览器里的画布内容。

画布中有一张原始图片,还有我用文字和箭头标出的修改目标。

请理解每个箭头对应的修改位置,根据标注把原图重新生成一版。

要求:
1. 只改我标注出来的文字内容。
2. 尽量保持原图的版式、配色、字体风格和层级关系。
3. 不要改动没有标注的区域。
4. 输出一张可直接使用的新图片。

这段提示词的重点不是“写得多高级”。

重点是让 Codex 明确 3 件事:

先看画布,再理解标注,最后生成新图。

很多人失败,是因为只把图扔给模型,然后说“帮我改一下”。

这太模糊了。

Codex 不知道你要改哪里,也不知道哪些部分不能动。

画布 + 箭头 + 文字,就是在帮模型降低理解成本。

关键是证明模型真的读懂了

Codex 读取到多处改动
Codex 读取到多处改动

第五步,看 Codex 的反馈。

如果它能说出“读取到 3 处改动”,基本就代表它已经理解了画布上的关系。

这一步很重要。

不要一看到它开始生成就立刻相信结果。

你要先确认它有没有读懂:

需要确认
为什么
它是否识别到原图
否则可能只是在凭空生图
它是否识别到箭头
否则位置容易错
它是否识别到新文字
否则改出来还是旧内容
它是否知道有几处改动
否则可能漏改
它是否保留其他区域
否则容易把整张图改花

如果 Codex 的反馈里没有提到这些关键点,可以先让它复述一次画布上的修改计划。

确认无误后,再让它正式生成。

这个方法好用,但不要神化

降低预期避免神化
降低预期避免神化

这个流程不是 100% 稳。

因为它本质上还是让图片生成模型重新生成一张图。

只要重新生成,就有概率带来一些不可控变化。

比如:

• 字体可能不完全一致
• 边距可能轻微变化
• 图里的小字可能变形
• 没标注的区域也可能被影响
• 复杂排版可能需要多跑几次

所以更适合这些场景:

场景
适合程度
海报标题替换
很适合
课程封面改字
很适合
信息图局部改文案
适合
社群宣传图快速改版
适合
精密 UI 截图改字
谨慎
合同、证件、票据类图片
不建议

我的建议是:

把它当成“快速改稿工具”,不要当成“精修设计工具”。

它特别适合帮你把第一版、第二版、第三版快速跑出来。

但如果是最终交付图,还是要人工检查一遍。

最值得学的是这个思路

把方法变成可复用流程
把方法变成可复用流程

这套方法真正值得学的,不只是 Codex 会改图。

而是它把“改图需求”从纯文字,变成了可视化流程。

以前我们跟 AI 沟通,经常卡在一句话:

“你怎么又理解错了?”

但问题可能不是 AI 太笨,而是我们给它的信息太抽象。

一张图里有那么多文字、模块、层级和视觉关系,光靠一句 prompt 很难讲清楚。

无限画布的价值,就是让你把需求拆开摆出来:

• 哪张图要改
• 哪一处要改
• 原来是什么
• 目标是什么
• 哪些地方不要动
• 修改后希望保持什么风格

这比单纯写 prompt 稳很多。

一句话总结:

复杂图片修改,能画就别只讲。

把“我想怎么改”画给 AI 看,往往比讲给 AI 听更靠谱。


国内 Codex 使用教程:
https://my.feishu.cn/wiki/Vjulwif06izNiMkPor0cM9uYn1e

国内官网入口(开了 Cloudflare,打不开需要挂梯子,适合国外用户使用):
https://codex.chatgpt-plus.top/login

购买入口:
https://maynorai.jichiyun.sbs/buy/30


没有评论:

发表评论

Agent研究爆发期:190篇必读论文与500个开源项目源码免费获取

本文聚焦当前快速发展的Agent赛道,涵盖大模型智能体的决策逻辑、记忆机制、多智能体协作等前沿方向。适合从初学者到资深研究员,提供190篇必读论文、321个谷歌落地项目案例及500个开源AI智能体应用,扫描文末二维码回复指定关键词即可免费获取全部资源。 Tags: Agent ...