【导读】 毫无征兆!OpenAI在深夜直接扔出两枚深水炸弹:GPT-5.4 Mini 和 GPT-5.4 Nano 正式解禁。这两款主打“极致速度”与“白菜价格”的轻量级模型,不仅在代码测试中直逼满血版,更成为了当下最火AI框架「龙虾」的完美燃料。大模型落地战,彻底变天了!
没有任何长篇大论的预热,OpenAI再次上演了拿手的“半夜偷袭”。
就在刚才,**GPT-5.4双子星(Mini和Nano)**正式向全球开发者开放。
这次的升级逻辑简单粗暴:把成本打穿,把速度拉爆,让AI真正成为不知疲倦的“赛博黑工”。
越级挑战:小模型爆发出旗舰级战力
大家最关心的,无疑是这两只“小钢炮”到底能不能干活。
咱们直接看最硬核的 SWE-Bench Pro(真实代码修复) 测试数据:
- GPT-5.4 Mini 狂砍 54.4% 的准确率,距离满血版老大哥 GPT-5.4 的 57.7% 仅一步之遥!
- 就连体型最小、最廉价的 Nano,也打出了 52.4% 的惊人战绩,把上一代 GPT-5 Mini(45.7%)按在地上摩擦。
这意味着什么?
这意味着,对于80%的日常代码修改、前端生成和Bug排查任务,你再也不需要花高价去请旗舰模型出山了。Mini 和 Nano 完全可以做到“平替”,并且运行速度直接飙升了整整两倍!
而在博士级科学推理(GPQA Diamond)中,Mini 更是拿到了 88% 的逆天高分。谁说小模型就没有高智商?
专为Agent而生:「龙虾」玩家狂喜
过去几个月里,以「龙虾(OpenClaw)」为代表的自动化 Agent 框架彻底火出圈。但随之而来的痛点是:24小时永动运行的 AI,每天吃掉的 Token 费用极其高昂。
而 GPT-5.4 Mini 和 Nano 的出现,简直就是为这个生态量身定制的“绝佳饲料”。
在复杂工具调用榜单(Toolathlon)上,GPT-5.4 Mini 拿下了 42.9% 的得分,全面碾压前代的 26.9%。
不少连夜测试的开发者在推特和 GitHub 上集体高潮:
“这玩意儿太疯狂了!用它来跑多智能体系统,不仅延迟低到可以忽略不计,而且调用 Codex 的配额只占 GPT-5.4 的 30%!” “简直香爆了,这才是大规模工业化落地的终极答案!”
翻车预警:短板依然存在
当然,疯狂的狂欢之下,也有人被泼了冷水。
在考验AI操作电脑的综合榜单 OSWorld-Verified 中,Mini 表现依然稳健(72.1%),但最小的 Nano 却意外遭遇了滑铁卢,仅得 39.0%,甚至不如上一代的成绩。
这给我们敲响了警钟: 当模型被极致压缩后,在面对高门槛的复杂视觉推理(比如看屏幕截图找细微按钮)时,依然会出现严重的“能力断层”。
如果你指望用最便宜的 Nano 去处理极其复杂的跨文件长代码重构,或是让它精准操作密密麻麻的 UI 界面,错误率依然会教你做人。
结语
GPT-5.4 Mini 和 Nano 的登场,彻底宣告了这样一个事实:大模型的下半场,不再是单纯拼谁的参数大,而是拼谁能在极低成本下,稳定地输出生产力。
属于多智能体和廉价算力的狂飙时代,真正到来了。
参考链接: