别只盯着 Nano Banana 了,GPT-Image-2 悄悄上线,生图圈又卷起来了

别只盯着 Nano Banana 了,GPT-Image-2 悄悄上线,生图圈又卷起来了

我半夜刷着 X(原推特),看这帮大佬放出的测试图,感觉这行真是不给人喘息的机会。

几个月前,谷歌的 Nano Banana 2(也就是 Gemini 3.1 Flash Image)刚把大家震撼了一把——价格砍半,质量逼近 Pro 版,直接在 Arena 榜单登顶。大家还在讨论这是不是 2026 年最强的生图模型,OpenAI 就不声不响地掀桌子了。

如果你最近在用 ChatGPT Plus 或 Pro,可能会发现画图功能变强了。OpenAI 没发通稿,也没开个发布会。但从 4 月初 LM Arena 平台上短暂闪现的三个匿名模型(代号 maskingtape-alpha 等),再到这两天 X 上满天飞的实测对比,基本坐实了一件事:GPT-Image-2 已经开启灰度测试。

我翻了翻目前外网的几十个评测帖子,把真实情况给大家盘一盘。

终于不再生成“外星文字”了

过去几年,AI 画图有个老大难问题。你让它画个赛博朋克城市没问题,但你让它在霓虹灯上写个“Open”或者“咖啡”,它能给你写出各种缺胳膊少腿的外星文。

其实在之前 Flowith 博客的评测里,上一代的 GPT Image 1 在文字排版上就已经比很多模型强了。而这次泄露的 GPT-Image-2,直接把这个优势拉满了。

根据 36kr 报道的泄露测试,新模型在文字渲染上碾压了老对手 Midjourney。它不仅能准确拼写长串英文,甚至连中文字符也能清晰渲染。X 上的博主 @johnAGI168 晒了一组图,生成的 UI 界面、浏览器窗口和带大段文字的电影海报,排版严丝合缝,字体风格完全贴合背景。文字排版不再是抽卡游戏了。

连画分镜和漫画也被它学会了

说到分镜和角色一致性,这原本是 Nano Banana 系列的绝对统治区。但现在 ChatGPT 也来抢地盘了。

日本科技媒体 ASCII 做了一个很有意思的测试。他们把一个原创虚拟角色的“三面图”扔给 ChatGPT 的新模型,让它顺着这套设定生成一个故事板。一分钟后,GPT-Image-2 不仅画出了画风统一的分镜,还在旁边配上了合理的日文设定说明。

测试者干脆让它直接画一卷右到左阅读的日式漫画。除了页数稍微有点错乱,整体的漫画分镜逻辑和日文台词几乎没有语法错误。这在以前是只有 Nano Banana 才能搞定的活儿。

压力给到了 Nano Banana 这边

在 GPT-Image-2 还没大规模铺开前,科技媒体 Digit 刚用 10 个极端刁钻的提示词,对上一代的 GPT-Image 1.5 和 Nano Banana Pro 进行了一次“贴身肉搏”。

当时的测试结果是:双方打成了平手。老将 GPT 1.5 在“文字排版”和“艺术风格”上稳稳压制对手;而 Nano Banana Pro 则在“极致微距”、“光学物理”和“照片真实感”上赢回了排面。可以说,当时两家还是各有千秋。

但现在情况变了。根据 36kr 披露的早期测试报告,新一代的 GPT-Image-2 在真实感、文字渲染和世界知识三个维度上,已经同时超越了 Nano Banana Pro。这意味着 Nano Banana 刚刚建立的真实感护城河,正面临被全面反超的危险。

让人捉摸不透的版权审核

说完了优点,得聊聊 OpenAI 祖传的毛病——令人迷惑的审查机制。

之前很多画师吐槽,GPT-Image-2 的安全限制比上一代更紧了。比如你不能生成带有暴力倾向的画面(比如枪战或挥剑),也不能生成稍微有些暴露的着装。

在版权隔离上,官方的态度本来是很强硬的。按照之前部分媒体的测试,像《龙珠》、《高达》或者《哆啦A梦》这种知名 IP,名字只要输进去就会被直接拒绝。

但现实就很魔幻了。你在 X 上随便一刷,就能看到有大佬(比如 @Adam38363368936)直接用 GPT-Image-2 生成了毫无违和感的《哆啦A梦》同人漫画。这种“薛定谔的审核”,有人说是因为加上特定词缀就能骗过系统,也有人说是灰度测试期间的漏洞。反正现在的状态就是:官方说不行,但网友们玩得很嗨。大家在商用的时候,还是得多留个心眼。

以后大概率得混着用才行

下个月(2026年5月),OpenAI 就要正式关停老一代的 DALL-E 2 和 3 了。

文本生图模型进化到现在这个阶段,单纯比拼“谁画得好看”已经没有意义。不管是 API 价格被砍下一半的 Nano Banana 2,还是悄悄把文字排版做到极致的 GPT-Image-2,大家都在往具体的工作流里钻。

如果你是 UI 设计师,或者需要做带大量文字的海报,GPT 是你的首选;如果你是摄影师或者概念艺术家,需要极致的材质质感,Nano Banana 系列依然是很好的补充。

就像 GPT Proto 这样的聚合平台最近很火一样,成年人不做选择。未来的常态可能是:用 GPT 打草稿做排版,再丢给 Nano Banana 去渲染真实材质。

生图圈子消停了没几个月,现在又卷起来了。作为用户,我们看戏就好。


参考链接:

  1. 10轮极限生图测试对比 (Digit)
  2. GPT Image 2 泄露实测报道 (36kr)
  3. 文字渲染能力深度对比 (Flowith Blog)
  4. ChatGPT 画像生成超 Nano Banana?漫画实测 (Yahoo News/ASCII)
← 返回博客列表