就在刚刚！OpenAI深夜突袭发布GPT-5.4 Mini与Nano，性能逼近旗舰，大模型价格战彻底终结？

【导读】 毫无征兆！OpenAI在深夜直接扔出两枚深水炸弹：GPT-5.4 Mini 和 GPT-5.4 Nano 正式解禁。这两款主打“极致速度”与“白菜价格”的轻量级模型，不仅在代码测试中直逼满血版，更成为了当下最火AI框架「龙虾」的完美燃料。大模型落地战，彻底变天了！

没有任何长篇大论的预热，OpenAI再次上演了拿手的“半夜偷袭”。

就在刚才，**GPT-5.4双子星（Mini和Nano）**正式向全球开发者开放。

这次的升级逻辑简单粗暴：把成本打穿，把速度拉爆，让AI真正成为不知疲倦的“赛博黑工”。

大家最关心的，无疑是这两只“小钢炮”到底能不能干活。

咱们直接看最硬核的 SWE-Bench Pro（真实代码修复） 测试数据：

这意味着什么？

这意味着，对于80%的日常代码修改、前端生成和Bug排查任务，你再也不需要花高价去请旗舰模型出山了。Mini 和 Nano 完全可以做到“平替”，并且运行速度直接飙升了整整两倍！

而在博士级科学推理（GPQA Diamond）中，Mini 更是拿到了 88% 的逆天高分。谁说小模型就没有高智商？

过去几个月里，以「龙虾（OpenClaw）」为代表的自动化 Agent 框架彻底火出圈。但随之而来的痛点是：24小时永动运行的 AI，每天吃掉的 Token 费用极其高昂。

而 GPT-5.4 Mini 和 Nano 的出现，简直就是为这个生态量身定制的“绝佳饲料”。

在复杂工具调用榜单（Toolathlon）上，GPT-5.4 Mini 拿下了 42.9% 的得分，全面碾压前代的 26.9%。

不少连夜测试的开发者在推特和 GitHub 上集体高潮：

“这玩意儿太疯狂了！用它来跑多智能体系统，不仅延迟低到可以忽略不计，而且调用 Codex 的配额只占 GPT-5.4 的 30%！” “简直香爆了，这才是大规模工业化落地的终极答案！”

当然，疯狂的狂欢之下，也有人被泼了冷水。

在考验AI操作电脑的综合榜单 OSWorld-Verified 中，Mini 表现依然稳健（72.1%），但最小的 Nano 却意外遭遇了滑铁卢，仅得 39.0%，甚至不如上一代的成绩。

这给我们敲响了警钟：当模型被极致压缩后，在面对高门槛的复杂视觉推理（比如看屏幕截图找细微按钮）时，依然会出现严重的“能力断层”。

如果你指望用最便宜的 Nano 去处理极其复杂的跨文件长代码重构，或是让它精准操作密密麻麻的 UI 界面，错误率依然会教你做人。

GPT-5.4 Mini 和 Nano 的登场，彻底宣告了这样一个事实：大模型的下半场，不再是单纯拼谁的参数大，而是拼谁能在极低成本下，稳定地输出生产力。

属于多智能体和廉价算力的狂飙时代，真正到来了。

参考链接：