别只盯着 Nano Banana 了，GPT-Image-2 悄悄上线，生图圈又卷起来了

我半夜刷着 X（原推特），看这帮大佬放出的测试图，感觉这行真是不给人喘息的机会。

几个月前，谷歌的 Nano Banana 2（也就是 Gemini 3.1 Flash Image）刚把大家震撼了一把——价格砍半，质量逼近 Pro 版，直接在 Arena 榜单登顶。大家还在讨论这是不是 2026 年最强的生图模型，OpenAI 就不声不响地掀桌子了。

如果你最近在用 ChatGPT Plus 或 Pro，可能会发现画图功能变强了。OpenAI 没发通稿，也没开个发布会。但从 4 月初 LM Arena 平台上短暂闪现的三个匿名模型（代号 maskingtape-alpha 等），再到这两天 X 上满天飞的实测对比，基本坐实了一件事：GPT-Image-2 已经开启灰度测试。

我翻了翻目前外网的几十个评测帖子，把真实情况给大家盘一盘。

终于不再生成“外星文字”了

过去几年，AI 画图有个老大难问题。你让它画个赛博朋克城市没问题，但你让它在霓虹灯上写个“Open”或者“咖啡”，它能给你写出各种缺胳膊少腿的外星文。

其实在之前 Flowith 博客的评测里，上一代的 GPT Image 1 在文字排版上就已经比很多模型强了。而这次泄露的 GPT-Image-2，直接把这个优势拉满了。

根据 36kr 报道的泄露测试，新模型在文字渲染上碾压了老对手 Midjourney。它不仅能准确拼写长串英文，甚至连中文字符也能清晰渲染。X 上的博主 @johnAGI168 晒了一组图，生成的 UI 界面、浏览器窗口和带大段文字的电影海报，排版严丝合缝，字体风格完全贴合背景。文字排版不再是抽卡游戏了。

连画分镜和漫画也被它学会了

说到分镜和角色一致性，这原本是 Nano Banana 系列的绝对统治区。但现在 ChatGPT 也来抢地盘了。

日本科技媒体 ASCII 做了一个很有意思的测试。他们把一个原创虚拟角色的“三面图”扔给 ChatGPT 的新模型，让它顺着这套设定生成一个故事板。一分钟后，GPT-Image-2 不仅画出了画风统一的分镜，还在旁边配上了合理的日文设定说明。

测试者干脆让它直接画一卷右到左阅读的日式漫画。除了页数稍微有点错乱，整体的漫画分镜逻辑和日文台词几乎没有语法错误。这在以前是只有 Nano Banana 才能搞定的活儿。

压力给到了 Nano Banana 这边

在 GPT-Image-2 还没大规模铺开前，科技媒体 Digit 刚用 10 个极端刁钻的提示词，对上一代的 GPT-Image 1.5 和 Nano Banana Pro 进行了一次“贴身肉搏”。

当时的测试结果是：双方打成了平手。老将 GPT 1.5 在“文字排版”和“艺术风格”上稳稳压制对手；而 Nano Banana Pro 则在“极致微距”、“光学物理”和“照片真实感”上赢回了排面。可以说，当时两家还是各有千秋。

但现在情况变了。根据 36kr 披露的早期测试报告，新一代的 GPT-Image-2 在真实感、文字渲染和世界知识三个维度上，已经同时超越了 Nano Banana Pro。这意味着 Nano Banana 刚刚建立的真实感护城河，正面临被全面反超的危险。

让人捉摸不透的版权审核

说完了优点，得聊聊 OpenAI 祖传的毛病——令人迷惑的审查机制。

之前很多画师吐槽，GPT-Image-2 的安全限制比上一代更紧了。比如你不能生成带有暴力倾向的画面（比如枪战或挥剑），也不能生成稍微有些暴露的着装。

在版权隔离上，官方的态度本来是很强硬的。按照之前部分媒体的测试，像《龙珠》、《高达》或者《哆啦A梦》这种知名 IP，名字只要输进去就会被直接拒绝。

但现实就很魔幻了。你在 X 上随便一刷，就能看到有大佬（比如 @Adam38363368936）直接用 GPT-Image-2 生成了毫无违和感的《哆啦A梦》同人漫画。这种“薛定谔的审核”，有人说是因为加上特定词缀就能骗过系统，也有人说是灰度测试期间的漏洞。反正现在的状态就是：官方说不行，但网友们玩得很嗨。大家在商用的时候，还是得多留个心眼。

以后大概率得混着用才行

下个月（2026年5月），OpenAI 就要正式关停老一代的 DALL-E 2 和 3 了。

文本生图模型进化到现在这个阶段，单纯比拼“谁画得好看”已经没有意义。不管是 API 价格被砍下一半的 Nano Banana 2，还是悄悄把文字排版做到极致的 GPT-Image-2，大家都在往具体的工作流里钻。

如果你是 UI 设计师，或者需要做带大量文字的海报，GPT 是你的首选；如果你是摄影师或者概念艺术家，需要极致的材质质感，Nano Banana 系列依然是很好的补充。

就像 GPT Proto 这样的聚合平台最近很火一样，成年人不做选择。未来的常态可能是：用 GPT 打草稿做排版，再丢给 Nano Banana 去渲染真实材质。

生图圈子消停了没几个月，现在又卷起来了。作为用户，我们看戏就好。

参考链接：