2025年12月30日星期二

AI 设计的下半场,拼的不只是模型,还有工作流

  见字如面,我是艾康。
点击关注👆防止迷路。







 

本文字数 2479,阅读大约需 5 分钟

每到年底这段时间,大概是很多创作者和打工人最「分裂」的时刻。

一边要盘算着元旦去哪玩;

一边还要应付年底扑面而来的各种设计需求:跨年活动的海报、年度总结的 PPT、新年祝福的贺卡。

好在,今天我们身处 AI 时代。

在之前的文章里,我也多次推荐过像 Nano Banana Pro 这样的顶级 AI 生图模型。

确实强大,能把我们脑海中模糊的想法,迅速变成一张张精美的图片,解决了「从 0 到 1」的难题。

但新的问题也随之而来。

很多时候,用它生成了一张非常惊艳的图,满心欢喜。

结果发现上面的文字是「Happy New Year」,但老板要的是「元旦快乐」;

或者,画面的构图很棒,但某个角落的元素颜色不太对劲。

最后就是好多时间都耗费在了精细化调整上。

这个过程让我开始思考一个问题:为什么即便用上了最顶级的模型,还不能一步到位?

直到我深度用了一段时间 Lovart,才找到了答案。

img

症结在于,我们一直把 AI 当作一个单一的「生图工具」,而忽略了设计本身是一个完整的「工作流」。

而 Lovart,从一开始就没想只做个出图工具,它的目标,是一个「设计 Agent」。

Agent 到底有什么不一样?

Agent」这个词,在今年特别火,但很多人可能还是觉得有点抽象。

它和直接使用生图工具的本质区别是什么?

我打个比方,你就明白了。

如果说 Nano Banana Pro 是一台能拍出 8K 超高清画质的顶级摄影机。

那直接使用它,就相当于把这台摄影机直接塞给你,让你自己去拍。

而 Lovart 更像一个自带导演、灯光、美术、后期的完整摄制组。

你给它一句指令(剧本),它不只是简单地按下快门,同时后台会调度一整个团队,帮你完成提示词优化、风格对齐、局部重绘、元素组合等一系列复杂动作。

最终,它交付给你的是一部可以直接使用的「成片」,而不仅仅是一段原始素材。

这种「Agent 思维」,让 Lovart 能够真正理解并完成一个「设计任务」,而不是仅仅「生成一张图片」。

听起来很玄乎?我们直接来看实战。

实战:五分钟搞定一套跨年设计

我们就以年底最常见的场景为例,看看 Lovart 这个「设计 Agent」是怎么干活的。

案例一:一句话,生成品牌跨年海报

假设我们要为一个品牌制作一张氛围感的跨年海报。

我给 Lovart 的指令很简单:

咖啡门店跨年商业海报,整体风格简约直接,精准传递咖啡门店温馨、美味且注重品质的品牌形象 ,展现出『你好,2026』的主题。

因为我没有给出具体的细节,因此它会先提供几个方向供我选择。

img

我选择了第一个。

Lovart 很快就用 NanoBanana Pro 生成了一张质量很高的海报,构图和氛围感都相当到位。

img

此时,如果我想把「你好,2026」改成更具体的活动 Slogan「新的一年,从一杯好咖啡开始」。

在过去,这意味着我得把图导入 PS,用仿制图章工具小心翼翼地抹掉原来的字,再找合适的字体,重新排版,调整特效……

一套下来,十几分钟没有了。

但在 Lovart 里,这都不是事。

它有一个功能叫 Text Edit(编辑文字)。

只需点击菜单栏里的「编辑文字」功能,Lovart 就会自动识别图片里的文字,能把这些像素点,变回可编辑的文本。

img

无论是艺术字、手写字还是变形字,你都能像在 Word 里打字一样,直接修改。

改完后,字体原有的风格、质感、光影,都完美保留。

img

案例二:一张图,裂变出一整套社媒素材

一张海报显然不够,我们还需要为小红书、公众号等不同平台制作相应尺寸的传播图。

这时,Edit Elements(编辑元素) 功能就派上用场了。

它可以一键「炸开」整张图片,把前景的咖啡拆分成独立的图层。

图片

接下来,你就可以像玩拼图一样,自由拖动、缩放、替换里面的任何一个元素,快速重组成新的版式,几分钟就能搞定一套适配多平台的宣传图。

img

在调整其中一张图时,我又发现了一个小问题:海报上的咖啡杯是棕色的,但品牌方这次主推的是一款白色包装的新品。

这时候,就轮到 Touch Edit(精准编辑)上场了。

只按住键盘上 Command/Control  ➕ 鼠标左键, 点击那个咖啡杯,然后输入一句自然语言指令,比如「把这个杯子换成白色」。

img

它就能精准地完成修改,而且光影和环境融合得非常自然。

真正做到了「言出法随」。

案例三:让设计走进现实,一键生成场景样机

设计稿做完了,怎么让老板或客户直观感受到它在真实世界里的效果?

Lovart 的 Mockup 功能,就是为此而生的。

你只需点一下,就能把你设计好的海报,一键应用到各种真实的场景里。

比如地铁站的广告牌、商场的电子屏、印在咖啡杯上,或是放在咖啡店的桌面上。

img

它会自动匹配透视、光影和物体表面的材质,生成的效果图几乎以假乱真。

img

过去需要专门找样机素材、用 PS 合成半天才能完成的工作,现在也只是动动手指的事。

不止于平面,轻松拿捏年终汇报 PPT

Lovart 这个「设计 Agent」的能力,还不止于平面设计。

年底最让人头疼的另一件事,就是年终总结 PPT。

Lovart 的 Slides 功能,同样能把这件事变得简单。

你可以直接丢给它几份参考文档,或者只给一个主题,比如「2025 年 AI 大模型的发展历程」。

img

它内置的 Deep Research 能力会自动上网搜集资料、梳理报告大纲,然后生成一份结构清晰、图文并茂、视觉风格统一的完整 PPT。

img

仔细看,内容确实是在线的, 多模态融合、AI Agent、上下文、具身智能这些确实都是今年的技术突破。

另外,最最最关键的是,这份 PPT 不是一堆无法修改的图片。

你可以随时修改里面的文字,甚至结合前面提到的 Text Edit 和 Touch Edit 功能,对某一页的图片和布局进行微调。

img

这种「生成后还能改」的体验,是其他 AI PPT 工具,所无法做到的。

为什么是 Lovart?

回顾整个过程,你会发现,Text EditEdit ElementsTouch EditMockup 再加上 Slides,这几个功能串起来,已经构成了一个闭环、高效的设计工作流。

它真正让 AI 的能力,从「出图」,进化到了「完成设计」。

这或许也解释了,为什么 Lovart 能在短短几个月内就积累了千万级的用户,ARR(年化收入)达到 8000 万美元。

这不是偶然,而是市场对真正解决痛点的产品的直接反馈。

现在,我可以说,Lovart 就是目前体验 NanoBanana Pro 这类顶级模型的最佳方式。

因为它强大的「后期编辑」能力,才真正释放了这些模型的所有潜力。

写在最后

聊了这么多,正好 Lovart 最近也配合元旦和新年节点,推出了一个相当给力的跨年活动。

图片

简单来说,就是「限时五折,一次上车,全年尽情创作」。

活动期间,最高档的会员可以直接享受包括 NanoBanana Pro 在内的多个顶级图片模型 365 天 0 积分无限用,还有多个视频模型也能免费用。

对于我们这些需要频繁和创意内容打交道的人来说,这无疑是一个巨大的福音。

如果你也想在新的一年,让自己的工作和创作效率有一个质的飞跃,不妨亲自体验一下,一个真正的「设计 Agent」到底有多好用。

网址在这里:https://www.lovart.ai/

 

图片

以上,就是本文全部内容,如果觉得这篇文章对你有启发,点赞、比心、分享三连就是对我最大的支持,谢谢~

往期推荐阅读
•  Obsidian 从入门到进阶合集

• AI把我推成"知名"博主后,我发现了一条产业链

• AI写作的真相:你才是那个最重要的模型

• 善用 AI,实际上对人的要求只会越来越高 

• 用 Gemini 解锁 YouTube 新用法,信息获取效率提升 10 倍

• AI 是如何变强的?Jeff Dean 斯坦福分享解读 

• 别再纠结 AI 味,内容创作应该回归第一性原理

• 微信输入法 + LazyTyper,我找到了桌面端输入的最佳方案

• 有了 NotebookLM 后,还需要 Obsidian 吗?

• 你越是会写作,就越能把 AI 用好

我试了 NotebookLM 学习法后,彻底抛弃传统学习方式

NotebookLM 的这个更新,比 Gemini 3 Flash 更让我兴奋

NotebookLM 再次升级,来自谷歌的年终礼物

我用 NotebookLM 解锁 PPT 的 5 种玩法,实现了 PPT 自由

从分钟到秒级,TurboDiffusion 正在改变 AI 视频的创作方式

AI 视频终于进入"秒级时代":TurboDiffusion 到底做对了什么?

AI 视频终于进入"秒级时代":TurboDiffusion 到底做对了什么?

如果你这两年一直在关注 AI 视频生成,一定有一个共同感受:

效果越来越惊艳,但——太慢了。

一条 5~10 秒的视频,动辄几十秒、几分钟,调个 Prompt 就得重新等一轮。
创作效率,成了 AI 视频真正的天花板。

而最近,一个名字在技术圈、开发者社区迅速刷屏——TurboDiffusion
它不是又一个"更大参数的视频模型",而是一个更狠的方向:

让 AI 视频,从分钟级,直接压缩到"秒级"。

图片

一、TurboDiffusion 不是模型,而是"加速引擎"

先说一个很关键的认知转变。

很多人一看到新名字,第一反应是:

"又是一个新视频模型?"

但 TurboDiffusion 的定位完全不同

它本质上是一个 扩散模型推理加速框架,核心目标只有一个:

在几乎不牺牲画质的前提下,把视频生成速度提升 100~200 倍。

也就是说:

  • 它 不和现有视频模型竞争

  • 而是让现有的视频扩散模型 跑得飞快

这一步,非常"工程脑",也非常现实。


二、速度有多夸张?直接给你感受一下

https://aianimation.com/wp-content/uploads/2024/10/Best-video-gen-platform.jpg

在公开测试中,TurboDiffusion 给出的成绩非常直观:

  • 原本需要 2~3 分钟 的视频生成

  • 在单张高端 GPU 上

  • 压缩到 1~2 秒级别

注意,是 ,不是十几秒。

这意味着什么?

  • Prompt 微调不再是"心理折磨"

  • 创作从"等待型"变成"交互型"

  • AI 视频第一次具备了 实时创作体验

这不是参数进步,而是生产方式的变化

图片

三、它为什么能这么快?不是魔法,是思路

TurboDiffusion 的厉害之处,在于它没有押宝单一技巧,而是 一整套组合拳

1️⃣ 少算一点,但算在刀刃上

通过重新设计注意力计算方式,大幅减少无效计算量。

2️⃣ 扩散步数被"蒸馏"了

传统扩散要一步一步"磨画面",
TurboDiffusion 直接把关键步骤压缩,
用更少的步数,得到相近的结果

3️⃣ 工程级别的低精度优化

在几乎不影响画质的前提下,引入 8bit 量化,
让 GPU 吞吐量真正跑起来。

一句话总结就是:

它不是"算得更猛",而是"算得更聪明"。


四、这件事真正值钱的,不是技术本身

https://miro.medium.com/1%2Am7FpUlP0daHTEjoiWrcdvA.png

https://vitrina.ai/wp-content/uploads/2024/06/DALL%C2%B7E-2024-06-21-17.37.54-An-inspiring-image-representing-AI-driven-content-creation-in-the-film-industry.-Picture-a-futuristic-film-studio-with-advanced-AI-technology.-Robot.webp

https://imgv3.fotor.com/images/side/AI-Video-Ad-generator-from-text-and-image.jpg

4

如果你只把 TurboDiffusion 当成一个"技术新闻",那就太可惜了。

它真正撬动的,是 AI 视频的商业形态

对创作者来说

  • 视频生成不再是"批量生产"

  • 而是 实时试错 + 即时调整

  • 这对短视频、动画、分镜创作极其友好

对商业团队来说

  • AI 视频可以真正进入 广告、营销、投放测试

  • 一条广告多个版本,秒级生成、秒级对比

  • 成本结构被彻底改写

对工具生态来说

  • AI 视频第一次有资格进入「交互式工具」

  • 而不是"点完按钮就等结果"

从这个角度看,TurboDiffusion 的意义不在"快",
而在于:

它让 AI 视频,终于像工具了。


五、为什么这可能是 AI 视频的分水岭?

过去一年,AI 视频的问题从来不是"够不够好看",
而是:

  • 太慢

  • 太贵

  • 太不稳定

TurboDiffusion 解决的是最核心的那一个:

时间成本。

当生成速度进入秒级之后,很多原本不成立的场景,突然就成立了:

  • 实时创作

  • 直播生成

  • 交互式视频

  • 工作流自动化

这不是一个模型的胜利,而是 一条路线的胜利



AI 视频,终于开始脱离"炫技阶段",
走向 真正可用、可规模化、可商业化 的阶段了。

而 TurboDiffusion,很可能会被记住为那个
把"等待"从 AI 视频里干掉的关键节点。


如果你觉得这篇文章 对你理解 AI 视频趋势有帮助
欢迎 点赞、在看、转发给身边做内容和做技术的朋友

地址:https://github.com/thu-ml/TurboDiffusion?utm_source

AI知识星球:公众号对话框回复"加入社群",即可自行获取(注:是对话框发送,不是在留言区)


想把AI真正用起来,而不是只停留在资讯?
来【写新AI实战圈】,我们每天都在做实战项目:
从ComfyUI、Agent落地到AI变现,全程案例+工具交付。
和一群真正在用AI赚钱的人,一起冲。


图片

不会n8n也能做自动化!GLM-4。7配合Claude Code,10个工作流模板自动下载生成!

一起来,走进ai新时代。

图片

公众号:元小二学AI 为大家分享最新的Ai工具资讯,关注并设置星标,再也不会错过各种工具信息!

欢迎来到我们这个充满魔法的AI工具小天地!在这里,我们不卖海洋球,只提供你意想不到的免费办公软件。想象一下,有了这些神器,你的工作效率会飙升,就像喝了加速药水一样!我们的目标?让你的工作生活,不再是按部就班的苦差事,而是一场轻松愉快的探险旅程。

尤其是一些特殊的软件,记得低调使用,不要用于商用哦。

朋友们,这是一个喜大普奔的好消息:
你再也不需要花几千块去学n8n了!

今天,我要说一句可能会得罪一大批人的话:那些还在教你手工搭建n8n工作流的培训班,可以直接关门了。

为什么我敢这么说?因为我刚刚用智谱刚发布的GLM-4.7,配合Claude Code,实现了一个AI Skills——只要你说出需求,它就能自动生成完整的n8n工作流JSON文件,导入即用!

我发誓,我没有修改任何一个节点!

一、为什么我要断掉这些培训班的财路?

前几天我分享了两篇关于n8n的文章,直接爆了。这几天加我微信的人超过500个,大部分都是想学n8n的,还有一些让我帮忙定制工作流的。

但我把送上门的钱,全推了。

很多人不理解,觉得我傻。但我的逻辑很简单:

由人类手工搭建工作流的时代,已经结束了。

AI技术的本质就是平权。它存在的意义,就是把那些昂贵的、原本属于少数人的技术壁垒,夷为平地。

之前我就发过预警文章,但很多人不信。今天,我不仅要帮大家省下这笔定制费,我还要把底牌全部亮出来。

二、为什么选择GLM-4.7?

很多人问我:为什么不用Claude或者GPT-4?

Alt text

答案很简单:国产AI真的牛逼了!

我从GLM-4.5时代就开始用了,一路看着它变强。这次发布的GLM-4.7,在Coding(编码)和Reasoning(推理)两个核心能力上,直接霸榜:

  • 代码能力开源第一:在LiveCodeBench v6拿下84.9高分,超越了Claude Sonnet 4.5

  • 工程化落地极强:在SWE-bench Verified达到73.8%解决率,这意味着它不是在做题,而是真能帮你干活

更重要的是:它不封号,稳定得很!

昨天群里还有人吐槽国外大模型账号被封,没解决方案,急得不行。但用GLM-4.7,你完全不用担心这个问题。

Alt text

我对GLM-4.7的评价是:性价比最高、最稳的AI编程解决方案。

三、实战:如何用GLM-4.7生成n8n工作流?

第一步:配置Claude Code

这一步很简单,参考这段代码就行:

mkdir -p ~/.claude && cat > ~/.claude/settings.json <<EOF

{

"env": {

"ANTHROPIC_AUTH_TOKEN""在此处填入您的智谱API_KEY",

"ANTHROPIC_BASE_URL""https://open.bigmodel.cn/api/anthropic",

"ANTHROPIC_DEFAULT_SONNET_MODEL""glm-4.7-coding-preview",

"ANTHROPIC_DEFAULT_OPUS_MODEL""glm-4.7-coding-preview",

"ANTHROPIC_DEFAULT_HAIKU_MODEL""glm-4.7-coding-preview"

}

}

EOF

配置完成后,你会看到Claude Code底层的驱动引擎已经换成了GLM-4.7。

Alt text

第二步:构建核心Skills

很多人用AI生成工作流失败,是因为让AI"凭空想象"。n8n的节点参数非常复杂,凭空生成的JSON往往连导入都会报错。

我的思路完全不同:我不让AI创造,我让它"抄作业"。

这就是Context Learning(上下文学习)的威力。

1. 建立素材库

我让Claude Code直接调用playwright MCP,到n8n官网自动下载10个相关的工作流JSON文件到本地。

请你调用 playwright mcp到https://n8n.io/workflows/ 下载10个用veo3.1生成视频的工作流json到本地文件夹,流程是打开网站后会有一个搜索框,输入相关的关键词后,下面会出现result的部分,选择合适的,点进去会进入工作流的介绍页面,判断合适后,左边会有`usefor free`按钮,点击后会有弹窗,点`copy templateto clipboard[json]`,此时工作流代码就已经在剪贴版了。

接下来,就在本地新建一个json文件把代码粘贴进去即可。注意工作流文件的命名要跟网页上的一致。如果有看到关于use cookies的弹窗,就关掉。

卧槽,牛逼!

GLM-4.7在工具调用上的表现非常稳。它精准识别了网页元素,完成了点击、弹窗处理、复制JSON的全套动作。

9个工作流JSON文件,自动保存到本地文件夹。这个过程完全不需要我动手。
可以尝试用AI生成一段Python或JavaScript的爬虫代码,例如分析以下网页:https://n8n.io/workflows/?q=,并在后面添加搜索词"veo3.1+tiktok"。这个任务难度不高,可以自己尝试实现。

2. 注入指令

素材有了,接下来就是最关键的一步:Prompt Engineering(提示词工程)。

我设计了一个"n8n AI Agent工作流设计专家"指令。它有多牛逼?

  • 深度阅读:先把刚才下载的10个模版全部读一遍,搞清楚别人是怎么处理API鉴权、怎么做循环、怎么处理报错的

  • 逻辑复用:不要自己造轮子,如果参考文件里有写好的HTTP请求节点,直接拿来用

  • 模块化设计:强制要求使用Sticky Notes把工作流分层,阅读性超高

(完整的Prompt太长了,关注公众号「元小二学AI」后台回复「n8n」获取)


3. 配置Skill

在项目文件夹下生成.claude/skills/n8n-gen-skill文件夹,把指令放进去。Claude Code会自动读取。

第三步:测试效果

我输入了一个需求:

"帮我做一个用veo3.1生成tiktok带货视频的n8n工作流,要求每天定时晚上11点跑工作流,先读取我的谷歌表格,把状态为未完成的记录提取出来,里面是我放的产品图、拍摄风格,需要你循环逐个图片作为参考图,连同拍摄风格传给veo3.1来生成视频,把生成好的视频下载后上传到谷歌云盘,最后把视频地址同步回谷歌表格,同时这行标记状态为已完成。"

几分钟后,它给了我两份文件:

第一份:需求说明文档(Markdown)

这简直是乙方的救星!里面详细记录了架构设计、节点配置方案,甚至连Google Sheets的表头结构都定义好了。你直接把这个丢给客户,专业度瞬间拉满。

第二份:n8n工作流JSON

我把生成的JSON文件直接导入n8n。

太牛逼了!!

我发誓我没有修改任何一个节点!这样的工作流,还不是傻瓜线性的,甚至连循环判断都是正确的,真的能省很多事。

四、这意味着什么?

看到这里,你明白我开头为什么敢"断人财路"了吗?

以前你的护城河,是背下了几百个节点的参数,是熬夜试错的经验。

但就在刚刚,GLM-4.7用几分钟的"思考",把这些壁垒瞬间夷为平地。

说实话,这次GLM-4.7真的给了我一种久违的惊艳感。不仅仅是它现在开源第一,而是因为那些纸面的参数,在业务落地中变成了实实在在的提效。

当我把生成的JSON导入n8n,发现连循环逻辑、API鉴权都严丝合缝,不需要我手动改一个标点符号。

这证明了它的思考模式绝不是噱头。它不再是一个只会补全代码的工具,而是一个真正拥有逻辑推理能力、能读懂你业务上下文的架构师。

五、给创业者的建议

朋友们,我想说:

以前,你的上限是你双手的速度;搭配时下最强AI,你的上限仅取决于你的想象力。

那些还在苦苦学习n8n节点参数的同学,赶快停下来吧。把时间花在更有价值的事情上——比如思考业务逻辑,比如理解用户需求。

AI工具的迭代速度,远超你的学习速度。与其追着技术跑,不如让AI成为你的助手。

这件事我让很多人弄了很久,都搞不定。但是换成了GLM-4.7配合Claude Code,一次性通过。

六、结语

人生是一场无限游戏,乾坤未定,你我均是黑马。

不要被所谓的"技术壁垒"吓到,更不要被那些贩卖焦虑的培训班割韭菜。

赶快去试试GLM-4.7吧,我的朋友!相信我,当你看到它自动生成的工作流第一次在n8n里完美运行,你会感受到一种前所未有的畅快。

那种感觉,就像是站在时代的风口,看着旧世界的规则被一点点改写。

而你,就是那个改写规则的人。

多使用AI工具吧,我的朋友!期待你的反馈。如果你觉得教程有难度,记得评论区告诉我,接下来我再针对难点重写展开写写。


关注公众号「元小二学AI」,后台回复「n8n」获取完整Prompt和配置教程。




图片
温馨提示:

公众号修改了推送规则,很多人发现收到的消息不及时,有些软件河蟹了就不能分享。

为了能够第一时间收到消息,不错过好软件,请星标置顶本公众号,以便第一时间获取精选内容!




我们的口号:提前下班


在这里,我们涵盖了八大AI办公软件领域,为你的工作生活提供全方位的加速支持:


文字处理与文档编辑:帮你快速编写和编辑文档,像追风一样高效。

电子表格与数据分析:让数据分析变得轻松,让你成为数据大师。

演示制作:打造引人入胜的演示文稿,让你的汇报光彩夺目。

项目管理与团队协作:提高团队合作效率,让项目管理变得游刃有余。

时间管理与效率工具:助你高效管理每一分每一秒,让时间成为你的朋友。

邮件管理:轻松管理你的电子邮件,让沟通无阻。

文件存储与共享:云端存储,随时随地高效共享。

网络安全与VPN:确保你的在线安全,保护你的每一次网络探索。

我们的口号是:用最少的努力,做最多的事情。在这里,你不仅会找到提高工作效率的秘籍,还会享受到工作的乐趣。加入我们,一起迎接高效、轻松的新工作时代吧!"

。记得关注我们公众号【元小二学AI】"!










AI 设计的下半场,拼的不只是模型,还有工作流

   见字如面,我是艾康。 点击关注 👆防止迷路。   本文字数 2479,阅读大约需 5 分钟 每到年底这段时间,大概是很多创作者和打工人最「分裂」的时刻。 一边要盘算着元旦去哪玩; 一边还要应付年底扑面而来的各种设计需求:跨年活动的海报、年度总结的 PPT、新年祝福的贺...