🚨 昨晚 OpenAI 没睡,GPT-5.4 突袭发布!这波“电脑操控”真的要变天了
家人们,原以为前天发布的 GPT-5.3 已经是大招了,没想到那只是道开胃菜。
就在刚刚(3月5日),OpenAI 没有任何预警,直接甩出了王炸——GPT-5.4 正式发布。不是泄露,不是 PPT,是实打实的上线!
这波操作属实把我看呆了。前脚还在讨论 5.3 的性能,后脚 5.4 就直接骑脸输出。官方博客直接把它定义为“最强生产力模型”。
📦 核心功能:这次真的“长手”了
如果不看参数,你可能觉得这只是个版本号的微调。但仔细看那个核心功能,你会发现事情并不简单。
1. 原生“电脑操控” (Computer Use) —— 真正的 Agent 来了
这是本次更新的最大亮点,没有之一。 以前我们用 Claude 的 Computer Use,虽然惊艳但总感觉有点“卡顿”,而且还得自己折腾环境。但 GPT-5.4 这次是原生集成。
这意味着什么? 它在 OSWorld 计算机操作基准测试中拿下了 75% 的高分。它能像人一样控制鼠标、敲键盘、打开 Excel 做表、去网页上抓数据、甚至帮你操作复杂的企业软件。 更有趣的是,官方还在强调一个新指标叫 GDPval(基于真实经济任务的评估),GPT-5.4 在这上面表现相当炸裂。
一句话总结: 以前的 AI 是给你“出主意”,现在的 AI 是直接帮你“干活”。SaaS 软件的老板们昨晚估计都没睡好——如果 AI 能直接操作界面,谁还愿意学那些复杂的软件操作?
2. 智商暴涨:两大版本同发
这次 OpenAI 很鸡贼,发布了两个版本(或者说是两种模式):
- GPT-5.4 Thinking:专门负责“慢思考”,逻辑推理能力拉满,适合搞科研、写复杂代码。
- GPT-5.4 Pro:企业级高配版,主打“最大化严谨性”,适合金融建模、法律审查等高风险任务。
值得一提的是,OpenAI 这次似乎引入了一个“实时路由”机制,普通用户使用时,系统会根据问题的难易程度自动在“快思考”和“慢思考”之间切换,既保证了速度又兼顾了智商。
在 MMMU-Pro(多模态理解)上,它拿到了 81.2%,基本坐稳了目前的王座。
3. 100万 Token 上下文
虽然之前传闻是 200万,但官方目前给出的预览版是 100万 Token。 即便如此,这也足够把几十本技术手册或者整个项目的代码库丢进去了。配合它的“电脑操控”能力,它甚至可以读完你的需求文档,然后直接在你的 IDE 里帮你把代码写了(甚至帮你把 Git 提交都做了)。
💰 价格战?GPT-5.4 居然比 Claude 便宜?
这部分可能才是企业用户最关心的。我扒了一下最新的 API 价格(每百万 Token):
| 模型 | 输入价格 | 输出价格 | 备注 |
|---|---|---|---|
| GPT-5.4 | $2.50 | $15.00 | 性价比中单(含Thinking模式?) |
| Claude Opus 4.6 | $5.00 | $25.00 | 还是贵族 |
| Gemini 3.1 Pro | $2.00 | $12.00 | 谷歌依然卷 |
你看,OpenAI 这次并没有定一个天价,反而卡在了 Gemini 和 Claude 中间。 比 Claude Opus 4.6 便宜了一半,而且这次 GPT-5.4 似乎采用了自动路由机制,不需要你手动切模型,它自己知道什么时候该“快思考”什么时候该“慢思考”,这相当于花中端的钱享受高端的服务。 虽然企业级的 GPT-5.4 Pro 版本价格可能更高(目前传闻高达 $30/$180),但对于绝大多数普通开发者来说,$2.50 的起步价已经非常良心了。
🍉 社区吃瓜:为什么这么急?
这次发布的时间点非常微妙。 稍微关注点科技圈八卦的朋友可能知道,最近 OpenAI 因为接了五角大楼的单子,在海外遭到了不小的抵制,很多人都在带头卸载 ChatGPT,转投 Claude 的怀抱。
X(推特)上就有网友 @TechInsider 辣评:
"GPT-5.4 这哪是发布产品啊,这是在‘救火’!Claude 刚抢走一批用户,OpenAI 就急着用核弹级更新把大家拽回来。"
还有开发者 @CodeMonkey 吐槽:
"昨天我刚给 GPT-5.3 适配好我的应用,今天告诉我过时了?OpenAI 你们发版是按小时算的吗?"
确实,GPT-5.3 和 5.4 之间仅仅隔了不到 24 小时。这种更新频率,在整个 AI 发展史上都罕见。很难不让人怀疑,这是 OpenAI 压箱底的存货,为了挽回口碑被迫提前“放大招”。
🤔 实际上手体验如何?
目前 GPT-5.4 Thinking 和 Pro 版本已经向 Plus 和 Team 用户开放了。 我简单试了一下它的 Excel 自动化处理能力。以前需要写 Python 脚本才能搞定的复杂数据清洗,现在直接告诉它:“帮我把这个表格里的异常数据剔除,然后按季度生成透视表”,它就能直接控制 Excel 软件帮你完成。 这种看着光标自己动的科幻感,真的只有亲自试过才知道有多震撼。
结语
不管 OpenAI 这波是不是“被逼急了”,对我们用户来说绝对是利好。 GPT-5.4 的“电脑操控”能力,标志着 AI 从“生成内容”正式迈向了“执行任务”的时代。以后你的工位上,可能真的要多一位“看不见的同事”了。
趁着现在服务器还没被挤爆,赶紧去试试吧!
数据来源与参考: