别只盯着 Nano Banana 了,GPT-Image-2 悄悄上线,生图圈又卷起来了
我半夜刷着 X(原推特),看这帮大佬放出的测试图,感觉这行真是不给人喘息的机会。
几个月前,谷歌的 Nano Banana 2(也就是 Gemini 3.1 Flash Image)刚把大家震撼了一把——价格砍半,质量逼近 Pro 版,直接在 Arena 榜单登顶。大家还在讨论这是不是 2026 年最强的生图模型,OpenAI 就不声不响地掀桌子了。
如果你最近在用 ChatGPT Plus 或 Pro,可能会发现画图功能变强了。OpenAI 没发通稿,也没开个发布会。但从 4 月初 LM Arena 平台上短暂闪现的三个匿名模型(代号 maskingtape-alpha 等),再到这两天 X 上满天飞的实测对比,基本坐实了一件事:GPT-Image-2 已经开启灰度测试。
我翻了翻目前外网的几十个评测帖子,把真实情况给大家盘一盘。
终于不再生成“外星文字”了
过去几年,AI 画图有个老大难问题。你让它画个赛博朋克城市没问题,但你让它在霓虹灯上写个“Open”或者“咖啡”,它能给你写出各种缺胳膊少腿的外星文。
其实在之前 Flowith 博客的评测里,上一代的 GPT Image 1 在文字排版上就已经比很多模型强了。而这次泄露的 GPT-Image-2,直接把这个优势拉满了。
根据 36kr 报道的泄露测试,新模型在文字渲染上碾压了老对手 Midjourney。它不仅能准确拼写长串英文,甚至连中文字符也能清晰渲染。X 上的博主 @johnAGI168 晒了一组图,生成的 UI 界面、浏览器窗口和带大段文字的电影海报,排版严丝合缝,字体风格完全贴合背景。文字排版不再是抽卡游戏了。
连画分镜和漫画也被它学会了
说到分镜和角色一致性,这原本是 Nano Banana 系列的绝对统治区。但现在 ChatGPT 也来抢地盘了。
日本科技媒体 ASCII 做了一个很有意思的测试。他们把一个原创虚拟角色的“三面图”扔给 ChatGPT 的新模型,让它顺着这套设定生成一个故事板。一分钟后,GPT-Image-2 不仅画出了画风统一的分镜,还在旁边配上了合理的日文设定说明。
测试者干脆让它直接画一卷右到左阅读的日式漫画。除了页数稍微有点错乱,整体的漫画分镜逻辑和日文台词几乎没有语法错误。这在以前是只有 Nano Banana 才能搞定的活儿。
压力给到了 Nano Banana 这边
在 GPT-Image-2 还没大规模铺开前,科技媒体 Digit 刚用 10 个极端刁钻的提示词,对上一代的 GPT-Image 1.5 和 Nano Banana Pro 进行了一次“贴身肉搏”。
当时的测试结果是:双方打成了平手。老将 GPT 1.5 在“文字排版”和“艺术风格”上稳稳压制对手;而 Nano Banana Pro 则在“极致微距”、“光学物理”和“照片真实感”上赢回了排面。可以说,当时两家还是各有千秋。
但现在情况变了。根据 36kr 披露的早期测试报告,新一代的 GPT-Image-2 在真实感、文字渲染和世界知识三个维度上,已经同时超越了 Nano Banana Pro。这意味着 Nano Banana 刚刚建立的真实感护城河,正面临被全面反超的危险。
让人捉摸不透的版权审核
说完了优点,得聊聊 OpenAI 祖传的毛病——令人迷惑的审查机制。
之前很多画师吐槽,GPT-Image-2 的安全限制比上一代更紧了。比如你不能生成带有暴力倾向的画面(比如枪战或挥剑),也不能生成稍微有些暴露的着装。
在版权隔离上,官方的态度本来是很强硬的。按照之前部分媒体的测试,像《龙珠》、《高达》或者《哆啦A梦》这种知名 IP,名字只要输进去就会被直接拒绝。
但现实就很魔幻了。你在 X 上随便一刷,就能看到有大佬(比如 @Adam38363368936)直接用 GPT-Image-2 生成了毫无违和感的《哆啦A梦》同人漫画。这种“薛定谔的审核”,有人说是因为加上特定词缀就能骗过系统,也有人说是灰度测试期间的漏洞。反正现在的状态就是:官方说不行,但网友们玩得很嗨。大家在商用的时候,还是得多留个心眼。
以后大概率得混着用才行
下个月(2026年5月),OpenAI 就要正式关停老一代的 DALL-E 2 和 3 了。
文本生图模型进化到现在这个阶段,单纯比拼“谁画得好看”已经没有意义。不管是 API 价格被砍下一半的 Nano Banana 2,还是悄悄把文字排版做到极致的 GPT-Image-2,大家都在往具体的工作流里钻。
如果你是 UI 设计师,或者需要做带大量文字的海报,GPT 是你的首选;如果你是摄影师或者概念艺术家,需要极致的材质质感,Nano Banana 系列依然是很好的补充。
就像 GPT Proto 这样的聚合平台最近很火一样,成年人不做选择。未来的常态可能是:用 GPT 打草稿做排版,再丢给 Nano Banana 去渲染真实材质。
生图圈子消停了没几个月,现在又卷起来了。作为用户,我们看戏就好。
参考链接: