一起来,走进ai新时代。
朋友们,这是一个让人五味杂陈的故事。
半年前,当OpenAI发布GPT-4o的时候,整个X和各种群里讨论的全是OpenAI。那时候我们说:"1.5 Pro被Sora淹没,2.5 Pro被4o淹没。"OpenAI意气风发,谁能想到,半年后风水轮流转,现在属于天天被Google按在地上摩擦的局面。
等等党这次输了!OpenAI憋了半年只憋出个"1.5"
这次OpenAI终于在Google的Banana淫威之下,把他们的图片生成模型掏出来了。但注意,不是传闻中的GPT Image 2.0,而是用了小版本号升级——1.5。
我对这个命名策略的评价是:怕被Google打脸。
确实有理由怕。我花了一个通宵把GPT Image 1.5测了个遍,跟Nano Banana Pro做了详细对比,结果让我不得不说:OpenAI这次真的拼尽全力了,但还是没能打败Banana Pro。
一、文字准确性:GPT的致命软肋
文字准确性绝对是现在多模态AI绘图模型大家最关注的。我先测了个最基础的:
帮我画一张科莫多龙的科普图解图片。
结果呢?
Banana Pro:中文基本没错。
GPT Image 1.5:中文基本都烂成一塌糊涂了。
再来一个:
生成一张 2026 年中国放假安排的信息图,全部使用中文,4K画质,9:16
Banana Pro:中文基本没错。
GPT Image 1.5:中文有点歪了,而且我只是要放假安排,怎么连日历也放上来了。
朋友们,这差距不是一点半点。在信息准确性上,尤其是中文字上,GPT Image 1.5跟Banana Pro有非常明显的差距。
二、画图理解能力:各有千秋。
我用了一个Prompt:
9:16竖屏鱼眼自拍,画面中有一位超写实风格的女性,与哆啦A梦、鸣人、大雄、五条悟、宝可梦小智合影。我们都带着夸张搞笑的表情微笑。场景是一个明亮的白色调小客厅。高角度拍摄,极端鱼眼镜头效果。动漫角色以写实、电影感的光影与风格化写实融合呈现。
语义理解上,两家确实都很强,提到的所有元素几乎全部实现了。
GPT:人物更油腻,不过女主笑得更自然一点
Banana Pro:动漫人物还是动漫风格,女主好像笑得好僵硬啊!
在图片理解上,两个模型都很强,不过画面还是有点差异,image的人物会更油腻,会有一些ai的感觉。而banana的更有真实性。
三、改图能力:与基础能力匹配。
先简单修改衣服颜色。
原图是这样的,改成黑色的衣服:
GPT:它的黑色更加合理,尤其下面的黑色衣服也保持了透视,而且按照原图露出了一点肚。
Banana Pro:基本一致,就是下面的透视衣服变成纯黑了。
另外,修改英文字体都没问题的,中文就不要去尝试了:
四、写在最后:Google的恐怖进化速度
花了一个通宵测完,我的结论是:
GPT Image 1.5不算差,但肯定也不能说特别好。跟Banana Pro比,在很多地方还是有不足的。
但更让我震撼的是什么?
OpenAI从3月份发布,憋了半年,才憋出来这个1.5版本。
而Google呢?
Gemini 2.5的画图,花了3个月进化到Banana
Banana又花了3个月,进化成Banana Pro
朋友们,这家公司的进化速度太恐怖了。Google,不愧是现如今AI的王。
这次,该轮到OpenAI奋起直追了。
五、我的感悟
这让我想起自己的创业经历。有时候你拼尽全力,憋了很久的大招,结果发现竞争对手已经迭代三次了。这种感觉,真的很无力。
但人生是一场无限游戏。OpenAI有实力,有资源,有团队。这次落后不代表永远落后。就像我在《刀锋战士》里看到的那句话:"乾坤未定,你我均是黑马。"
大家尝试之后,觉得怎样,留言区期待你的作品。
公众号修改了推送规则,很多人发现收到的消息不及时,有些软件河蟹了就不能分享。
没有评论:
发表评论