2025年4月30日星期三

GPT4o生成的烂自拍,反而比我们更真实。

真实是未经表演的存在。

我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。
能有这么长久,现在依然不断冒出着,各种创意。
我相信无数人都在社交平台里,刷到过这些图。
比如京东外卖跟美团外卖干架干的热火朝天。
但是强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍,虽然兴哥看着有点不嘻嘻。
图片
周杰伦和林俊杰、陈奕迅,也来到了广州小蛮腰和上海,摆出了同样的自拍。
图片
还有一张来自中土世界的自拍,C罗和梅西,也到清华一游。
图片
绝命毒师来到了天津。
图片
当然,我最佩服的还是今天刷到的这个小红书。
《45岁,离职北大》,脑洞无敌,数据也直接拉爆,将近12万的赞。
图片
甚至不止是人,猫也行。
图片
这些图,过于真实,不断的在欺骗大家的大脑。
告诉你,这个好像很真实。
真实的就像一个路人,随手用手机拍了一下一样。
我昨晚回家,随手拍了一张。
图片
他们居然也说是AI画的。。。
图片
真的很有意思。
用GPT4o画上面那种自拍效果的图片的Prompt,其实超简单。
就一段话:
请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,阳光或店内灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。主角是_____,背景是_____。
就完事了。
然后直接把这段Prompt,写上你想要的主角和背景,打开Sora,复制过去生成就行,一张栩栩如生的照片,就出来了。
Sora网址:https://sora.chatgpt.com/
之所以不用ChatGPT里面的4o生成,就是单纯的因为,Sora上生图的体验更好,因为本质上模型都是一样的,但是Sora上可以一次生成多张,比例的预设啥的也都在。
比如我就想画马斯克和一个美女一起打游戏的画面。
图片
扔进去,直接生成就行。
图片
一张来自马斯克的超级真实的自拍,就出来了。
这个Prompt,其实最开始的源头已经不知道出自哪了,但是这一轮的爆火,来源于Reddit上,一个叫做ChatGPTJailbreak的论坛。
图片
这个论坛是干啥的呢?
简单来说,就是干一切OpenAI官方不允许的事,俗称,越狱。
在大概两周以前,有一个哥们,在上面发了一个帖子:
图片
然后,火了。。。
这哥们其实是为了越狱,在GPT4o上搞NSFW,这个词我就不解释了,有兴趣的自己去问下GPT。
真的,好像很多东西的火,最开始都是想搞一些这种人类最原始的欲望。
虽然他是为了搞NSFW,但是却意料之外的,得到了一个副产品。
极度具有"真实感"的AI照片。
底下跟贴的网友都干懵逼了。
图片
于是,这段Prompt,被传遍大江南北,传遍全世界。
因为,生成出来的效果,太"真实"了。
那么问题来了,到底,什么是"真实"?
我们再回头来,细细的去看这一段Prompt:

请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,阳光或店内灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。

关键词:平凡无奇,没主体,没构图,快照感,运动模糊,曝光过度,角度尴尬,构图混乱,刻意平庸。

这一大串描述里,没有一个字,是在追求完美的。

反而全部都在强调一件事:

普普通通

但就是这种普普通通,带给了我们无与伦比的真实感。

他就像,你的男朋友女朋友,给你随手一拍,糊成一坨,又丑又尬的照片。

但是,当你看到这玩意,你却会哈哈一笑,然后给他一脚。

普普通通,但却很像身边的平凡。

我们的人生,本来就充满了这种无意义的平凡时刻。

我们过的生活,大多数时候,不是被雕琢过的,不是被修图师精修过的,不是摄影棚里那种灯光打满、皮肤抚平、构图完美的大片。

而是,早高峰地铁里,你都被挤爆了手都抬不起来,但是非要拍一张给朋友分享这个车厢里有多挤的模糊。

是夜市摊边,一手撸串一手颤颤巍巍举起手机拍一桌子的残羹问朋友要不要来下半场的糊图。

是朋友聚会笑到模糊的一瞬间,曝光过度,嘴角拉扯变形的合影。

是过年回家的高速公路服务区,你爸你妈用不熟练的姿势和摄像头不咋好的手机,给你拍的一张头都歪掉的照片。

手抖了。

光过曝了。

构图乱七八糟。

但是这些照片,反而才是我们,最真实的生命切片。

它们不是为了展示而存在的。

它们只是生命路过的证据。

而这一切,恰恰才是人类最熟悉、最习以为常的"真实感"。

于是,当一张照片,展现出这种"不完美"的时候,

图片

我们的大脑会立刻认定:

这好像是真的。

这才是我熟悉的世界。

不是虚假的、精心编排的、为取悦而优化过的。

是生涩的,是笨拙的,是脆弱的,是不经意的。

是活着的。

所以,当这些粗糙的、带着运动模糊、角度尴尬的AI自拍,涌现在屏幕上时,它们在第一时间,精准地命中了我们潜意识里对"真实"的感知模型。

不是因为它们做得好,

恰恰是因为,它们做得"差"。

这个"差",是有灵魂的。

而我们,太久太久,没在互联网上看到这样的"差劲"了。

你想一下,从什么时候开始,我们对社交媒体的照片,默认带着一种不信任?

P图、滤镜、摆拍、精修。

人人在展示自己最好的一面。

而这个最好的一面,是假的。

直到有一天,GPT4o,出于某种阴差阳错,居然画出了一种"普通得不能再普通"的画面。

就像是你无意间打翻桌上的咖啡,滑了一下手机快门,什么都没对准的一张照片。

一点都不华丽,一点都不打磨。

甚至有点蠢,有点糊,有点丑。

但是你看到它的那一秒,你突然感到,自己,好久没见到过这样的东西了。

这种东西,我把它称为,未经表演的存在。

在一切都被剪辑、被打磨、被美化的世界里,未经表演的存在。

反而成了最极致的稀缺品。

这种存在,才是真实。

在911事件中,有一张至今仍然广为流传的照片:《The Falling Man》。

图片

照片里的男人,从高楼坠落,身体笔直,背景是混乱天际线。

摄影师理查德·德鲁拍下这张照片时,没有构图、没有安排,只是一瞬间的本能反应。

而这张"失败的、没来得及对焦的"照片,反而成了911最具冲击力的象征。

因为那种无法修饰的绝望,那种混乱中的冷酷美学,才是真实世界本来的样子。

也正是因为这样,《The Falling Man》那种撕裂感,才让世界记住了一个瞬间。

而不是一段官方新闻稿,不是一张后期润色得滴水不漏的灾难现场大片。

因为真实的生命,压根就不配合任何镜头。

所以啊。

当GPT4o用这样一个奇怪的Prompt,画出了那些歪歪扭扭、模模糊糊的自拍。

我们才会觉得:

啊,这是真的。

因为它太像我们自己了。

我们被教育得太久了。

久到都忘了,活着,可以不需要那么完美。

可以拍糊。

可以曝光。

可以歪掉。

可以平庸。

可以不够好。

可以什么都没有准备好。

这一刻。

也许AI反而帮我们找回了。

我们自己差点丢掉的东西。

那就是。

真实。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克

>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com

Qwen3深夜正式开源,它的AI视频能力如何?

Qwen3的文生图能文生视频能力如何?

相信这两天很多人都收到了通义千问Qwen3模型上线的通知,关于Qwen3模型的评测很多也都出来了,总体来说就是很强!
图片
Qwen3一次开源了8款模型,模型尺寸从0.6B至235B之间,其中最牛逼的旗舰模型才235B,在性能超过很多闭源大厂的大模型的情况下,模型尺寸仅Deepseek R1的三分之一,也就是说如果是本地部署的话,成本也大概只要DeepSeekR1的三分之一.
图片
Qwen3-235B-A22B 性能强大、开源、算力要求低,面对有这等好事,估计很多预算不高的小企业老板要笑醒了。
图片
一、如何使用Qwen3
首先,Qwen3是免费的。
我们可以通过两种方法免费使用它。
1、通过通义千问网址(https://www.tongyi.com/)点击右侧的"Qwen3",然后在千问大模型处选择Qwen3模型即可。
图片
图片
2、通过网址(chat.qwen.ai)访问,在大模型处选择Qwen3模型。
图片
从这两个网址都可以使用Qwen3模型,根据自己的喜好进行选择。
二、Qwen3的文生图能力如何
1、图像生成能力测试
我们之前介绍过谷歌的imageFx文生图(告别AI换脸怪异感!一个绝招,轻松打造高品质人物一致性AI视频!),imageFx的文生图真实感非常强,今天我们用同样的提示词来看下Qwen3的文生图效果如何
图片
下面是Qwen3和imageFX的细节对比,我个人觉得Qwen3的生图能力也是相当不错的,真实感也比较强,不过Qwen3每次只能生成一张图片。
图片
(2)人物一致性测试
在原有提示词的基础上,增加一段人物喝咖啡的提示词,得到了新图片,Qwen3生成的图片和之前的图片相比变化比较大,无法保持图片一致性,但谷歌的imageFX因为可以锁定种子数,在保持人物的一致性比较好。
imageFX使用方法请见告别AI换脸怪异感!一个绝招,轻松打造高品质人物一致性AI视频!
图片
(3)卡通人物测试
将之前的人物提示词给kimi,让kimi把提示词改成吉卜力风格的,我们便得到了一个吉卜利风格的提示词。
图片
把提示词分别给Qwen3和imageFX,看下出图效果。
下面是Qwen3的出图效果
图片
下面是imageFx的出图效果
图片
从画面质感上来看,我觉得Qwen3g还是略逊一筹,不过imageFX的画面效果有些偏3D风格。
图片

接下来又给人物增添了两个场景词,分别是人物站在花丛边向屏幕招手和手里拿着棒棒糖
Qwen3生成的人物向屏幕招手的画面中出现了4指情况,而且个人感觉,相对于一个小女孩,这只手的比例有些偏大。
图片
下图的提示词是人物手里拿着棒糖,可Qwen3在生成图片时,我抽了3次卡也没有出现棒棒糖。
imageFx生成图片的总体风格比Qwen3还是要精细不少的,画面层次感强,细节丰富,光线感也比较强,对提示词的的理解表达的也比较准确。
图片
总体来说,Qwen3在生成写实人物时已经非常真实了,不需要抽卡,一次就能生成效果不错的图片,如果不仔细看,甚至看不出来AI味。
但动漫风格的可能还需要再提升一下。
三、Qwen3的文生视频能力如何
Qwen3只能文生视频,还无法图生视频,所以暂时无法实现视频中的人物一致性。
所以我们要用整段提示词让Qwen3生成视频,怎么说呢,我觉得这视频质量还凑合着用吧,反正不要钱,大不了多抽几次卡,总能抽到自己满意的效果。
图片
图片
总之,Qwen3的文生视频能力还有待提升,相信不久的将来肯定会大有提升的。
不过目前如果你想做一个人物一致性的AI视频,可以看下我前面的文章:
用FramPack制作AI视频,时长突破120秒,人物高一致性,6G可用
一次性生成120秒的AI长视频,6G显存就能使用,完全开源免费,FramePack王一般的存在
最快的免费开源视频生成模型,LTXVideo只要十几秒就能生成丝滑AI视频,Comfyui官方原生支持
告别AI换脸怪异感!一个绝招,轻松打造高品质人物一致性AI视频!
Comfyui制作AI视频,支持文生视频、图生视频、视频生视频,万相2.1本地部署详细方法

END




感谢您的阅读,麻烦点个赞+在看吧!

五一活动惊喜不断!GPT月卡额外赠送7天!ClaudeMax、Grok最低8折起!

活动内容ChatGPT Plus活动:购买月会员,再送7天会员!购买季会员,再送20天会员!购买年会员,再送30天会员!


ChatGPT Image 2025年4月29日 13_16_56

活动内容

ChatGPT Plus活动:

  • 购买月会员,再送7天会员!
  • 购买季会员,再送20天会员!
  • 购买年会员,再送30天会员!

ClaudeMax、SuperGrok活动:

优惠券类型
优惠码
优惠内容
月卡优惠券WUYI_MONTH
购买月卡立享9折优惠
季卡优惠券WUYI_SEASON
购买季卡立享85折优惠
年卡优惠券WUYI_YEAR
购买年卡立享8折优惠
PixPin_2025-04-29_13-15-22
PixPin_2025-04-29_13-15-22

官网地址:

https://agi.maynor1024.live/list/#/

活动说明

  • 时长:购买会员,系统自动赠送相应天数
  • 优惠券先到先兑换,手慢无!(限前10名
  • 有效期2025年4月29日00:00 — 2025年5月1日24:00
  • 特别说明:Claude Max由于价格昂贵不额外赠送时长,有任何疑问可联系微信客服 coder-maynor

image-20250429132116640
image-20250429132116640

🔥 活动限时,抓紧行动!🔥
扫码立即参与,解锁AI高级体验!


还在羡慕别人用 GPT4o 生成的“烂自拍”?免费 AI 绘画平台,让你轻松拥有!

还在羡慕别人用 GPT4o 生成的"烂自拍"?免费 AI 绘画平台,让你轻松拥有!

还在羡慕别人用 GPT4o 生成的"烂自拍"?免费 AI 绘画平台,让你轻松拥有!

你是不是也在社交平台上刷到过那些以假乱真的 AI 自拍?比如京东和美团"握手言和",刘强东和王兴在上海外滩友好自拍的场景,尽管王兴看起来有些不情愿。

京东外卖跟美团外卖干架干的热火朝天,强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍
京东外卖跟美团外卖干架干的热火朝天,强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍

又或者是周杰伦、林俊杰、陈奕迅齐聚广州小蛮腰和上海,摆出同款自拍姿势。

周杰伦和林俊杰、陈奕迅,也来到了广州小蛮腰和上海,摆出了同样的自拍
周杰伦和林俊杰、陈奕迅,也来到了广州小蛮腰和上海,摆出了同样的自拍

甚至还有 C 罗和梅西现身清华园的"中土世界自拍"。

一张来自中土世界的自拍,C罗和梅西,也到清华一游
一张来自中土世界的自拍,C罗和梅西,也到清华一游

以及"绝命毒师"空降天津的画面。

绝命毒师来到了天津
绝命毒师来到了天津

这些逼真到足以乱真的图片,不断地挑战着我们的认知。而我最佩服的,莫过于今天刷到的这张小红书图片——《45岁,离职北大》,脑洞清奇,数据惊人,点赞数近 12 万。

《45岁,离职北大》,脑洞无敌,数据也直接拉爆,将近12万的赞
《45岁,离职北大》,脑洞无敌,数据也直接拉爆,将近12万的赞

甚至连猫咪也能生成这样的自拍。

甚至不止是人,猫也行
甚至不止是人,猫也行

这些图片实在是太过真实,让人难辨真假。现在,有一个免费的网站可以让你轻松生成这些图片!

网站地址:https://agi.maynor1024.live/

如何使用?

image-20250430171657001
image-20250430171657001
  1. 注册一个账号。
  2. 点击"绘画平台"。
  3. 输入以下提示词:

请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,阳光或店内灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。主角是_____,背景是_____。

image-20250430171628453
image-20250430171628453

然后你就可以生成类似以下的图片了:

然后就可以生成以下这张图了
然后就可以生成以下这张图了

你也可以进行其他尝试,这里就不一一演示了。平台刚上线,功能还在不断完善中,敬请期待更多惊喜!


开源:美观且功能强大的在线设计工具

开源:美观且功能强大的在线设计工具源代码https://www.gitpp.com/labelking/pro 开源:美观且功能强大的在线设计工具 源代码 https://www.gitpp.com/labelking/projects0601402 1,一款美观且功能强大的...