DeepSeek V4预览版发布,真正值得看什么

DeepSeek V4预览版发布,真正值得看什么

【导读】4 月 24 日,DeepSeek 放出了 V4 系列预览版,也同步更新了 API。消息一出,讨论很快热起来了。有人盯着 1M 上下文和 1.6T 参数量,觉得开源模型又被往前推了一截;也有人更关心价格、真实工程表现和第三方评测,想知道这次到底是不是一次真正有分量的升级。

我翻了官方模型卡、API 文档和首轮讨论后,比较明确的感觉是:DeepSeek V4 预览版确实有东西,但现在最值得聊的,不是“它是不是已经全面赢了”,而是它把开源模型的竞争重新拉回到了一个很难忽视的位置。

DeepSeek 这次到底发了什么

先把官方确认的信息摆清楚。

这次放出来的是 DeepSeek-V4 系列预览版,不是一款模型,而是两款:

  • DeepSeek-V4-Pro:1.6T 总参数,49B 激活参数
  • DeepSeek-V4-Flash:284B 总参数,13B 激活参数

两者都是 MoE 架构,都支持 1M 上下文,也都已经开放权重,同时能通过 DeepSeek API 调用。

如果只看产品层,这次最容易被忽略的一点反而很关键:DeepSeek 没有把 V4 做成单一旗舰,而是做成了更清楚的双线产品。Pro 负责能力上限,Flash 负责成本和吞吐。

按照官方 API 定价,V4-Flash 是每百万输入 0.14 美元、输出 0.28 美元;V4-Pro 是每百万输入 1.74 美元、输出 3.48 美元。放到今天这个市场里看,尤其是跟闭源头部模型比,这个价格带来的压力不会小。

另一个实用更新是,DeepSeek 把“思考强度”也产品化了。官方给了三档模式:Non-thinkThink HighThink Max。说白了,就是用户可以自己决定这个模型是要快点出活,还是多想一会儿再答。

这次技术升级,核心不在“更大”,而在“更敢把长上下文做成默认配置”

如果只看参数,V4-Pro 当然够大。但这次最值得注意的,不只是从 V3.2 往上堆到了 1.6T,而是 DeepSeek 试图把“百万上下文”从 PPT 指标,往真实可用的工程能力上拽。

官方模型卡里最关键的有三点。第一是新的混合注意力架构,把 Compressed Sparse AttentionHeavily Compressed Attention 组合在一起。按照 DeepSeek 的说法,在 1M 上下文下,V4-Pro 单 token 推理 FLOPs 只要 V3.2 的 27%,KV Cache 只要 10%。这个数字当然还要等第三方验证,但方向很明确,它想解决的不是“能不能宣称 1M”,而是“1M 会不会贵到根本没人用”。

第二是 mHC,也就是 Manifold-Constrained Hyper-Connections,本质上是为超大模型训练稳定性服务。第三是 Muon Optimizer,对应训练效率和收敛问题。这说明 DeepSeek 这次不是只在后训练上修修补补,而是从架构和训练层面一起动了手。

还有一个细节也要说清楚:现在外面很多二手解读,喜欢顺手把 V4 说成“原生多模态大一统模型”。但至少从这次公开出来的预览版模型信息看,它当前公开形态还是 text-generation。所以更稳妥的说法应该是,这次能确认的核心卖点,还是长上下文、推理模式和 agent/coding 导向增强。

首轮热议,基本集中在这几件事

真正吓人的,不是 Pro,而可能是 Flash

很多人第一眼会被 1.6T 吸过去,但社区里反复被拿出来讨论的,反而是 Flash。原因很简单:它便宜得离谱,而且从官方表里看,很多 benchmark 跟 Pro 的差距并没有大到夸张。比如 SWE-Bench Verified,Flash 是 79.0,Pro 是 80.6;LiveCodeBench,Flash 是 91.6,Pro 是 93.5。真到落地选型时,很多团队看的往往不是“最强”,而是“这点差距值不值十倍以上价差”。

这也是为什么我觉得 V4 这次真正有冲击力的地方,不只是 Pro 去冲榜,而是 Flash 很可能直接去卷市场。

它确实很强,但没有强到“表格横扫一切”

这一点必须讲,不然文章就容易写飘。DeepSeek 自己放出的对比表里,V4-Pro 在不少项目上确实很能打,尤其是代码、部分数学和 agent 任务。但它并不是每项都第一。比如 MMLU-Pro 上,它和 GPT-5.4 持平,但低于 Opus 4.6 Max 和 Gemini 3.1 Pro;Terminal Bench 2.0 上也没有压过 GPT-5.4;SWE-Pro 甚至不是最领先的那个。

换句话说,V4 预览版可以说是“开源阵营里非常硬的一次更新”,但现在就把它写成“全面吊打闭源前沿模型”,那就是往标题党去了。争议最大的地方也在这儿:支持者看到的是“开源终于又往前迈了一步”,质疑者盯着的是“这些成绩有多少能被第三方复现”。

真正被反复转发的,是“开源 + 低价 + 1M 上下文”这个组合

单独看其中任何一项,都不算新闻。模型强,别人也强;上下文长,别人也能给;便宜,行业里也不是第一次打价格战。真正让 DeepSeek V4 重新有存在感的,是这三件事被它同时打包出来了。

而且它不是停在“论文好看”这一步,API 已经同步上线,旧的 deepseek-chatdeepseek-reasoner 未来还会映射到 deepseek-v4-flash。这意味着它不是只想在开源社区刷口碑,而是想把产品、API 和开发者迁移路径一起铺出来。这不是摆样子,是在认真做产品。

我觉得这次最值得注意的,不是热搜感,而是产品感

看完这一轮资料,我对 DeepSeek V4 预览版的判断大概是这样:它不是那种“全世界一夜洗牌”的发布,但也绝对不是普通迭代。更像是 DeepSeek 用一种很成熟的产品思路,重新告诉市场一件事:开源模型不只是在追性能,也开始认真处理价格、上下文和 agent 工作流这些更落地的事。

而且这次它没有把话说得太满。外界注意到,DeepSeek 自己在一些地方反而写得挺克制,甚至承认和最前沿闭源模型还有几个月差距。你可以说这是策略,也可以说这是少见的诚实,但至少它没有把自己包装成一个没有死角的“神模”。

当然,预览版终究是预览版。接下来几天更关键的不是官方继续发多少海报,而是三件事:第一,第三方 benchmark 会不会基本验证它现在的说法;第二,真实开发场景里,Flash 会不会因为价格和速度直接变成最常被调用的那款;第三,1M 上下文这件事,到底是“真能上生产”,还是“账单一出来大家又退回 128K”。如果这三件事里有两件成立,那 DeepSeek V4 这一枪就算打中了。

写在最后

这轮热议,表面看是在吵 DeepSeek V4 到底强不强,实际上大家吵的是另一件更现实的事:开源模型是不是又一次逼近了“够强、够便宜、够能干活”那个临界点。

我觉得答案至少已经不是“还早”,但要说“已经到了”,也还差最后几步。

DeepSeek V4 预览版真正有意思的地方,就在这个不上不下的时刻。它已经强到不能再被当成陪跑,也还没有强到让争议消失。于是讨论才会这么热。因为大家都看出来了,下一轮模型竞争,可能真不只是比谁更聪明,而是比谁更像一个能被长期接入工作流的系统。


参考链接

  1. DeepSeek-V4-Pro 模型卡:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
  2. DeepSeek-V4-Flash 模型卡:https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash
  3. DeepSeek API 定价页:https://api-docs.deepseek.com/quick_start/pricing
  4. DeepSeek API 模型列表:https://api-docs.deepseek.com/api/list-models
  5. 社区首轮讨论 1:https://news.ycombinator.com/item?id=47885003
  6. 社区首轮讨论 2:https://news.ycombinator.com/item?id=47885230
  7. 外媒报道 1:https://www.reuters.com/world/china/deepseeks-v4-model-will-run-huawei-chips-information-reports-2026-04-03/
  8. 外媒报道 2(含 Yifan Zhang 的 X 预热帖):https://cntechpost.com/2026/04/20/deepseek-v4-launch-expected-this-week-following-researchers-tweet/
  9. Yifan Zhang 在 X 的预热帖:https://x.com/yifan_zhang_/status/2045670523938521138
  10. X 搜索入口(DeepSeek V4):https://x.com/search?q=DeepSeek%20V4&src=typed_query
  11. 外媒解读:https://thenextweb.com/news/deepseek-v4-pro-flash-launch-open-source
← 返回博客列表