DeepSeek V4预览版发布，真正值得看什么

【导读】4 月 24 日，DeepSeek 放出了 V4 系列预览版，也同步更新了 API。消息一出，讨论很快热起来了。有人盯着 1M 上下文和 1.6T 参数量，觉得开源模型又被往前推了一截；也有人更关心价格、真实工程表现和第三方评测，想知道这次到底是不是一次真正有分量的升级。

我翻了官方模型卡、API 文档和首轮讨论后，比较明确的感觉是：DeepSeek V4 预览版确实有东西，但现在最值得聊的，不是“它是不是已经全面赢了”，而是它把开源模型的竞争重新拉回到了一个很难忽视的位置。

DeepSeek 这次到底发了什么

先把官方确认的信息摆清楚。

这次放出来的是 DeepSeek-V4 系列预览版，不是一款模型，而是两款：

DeepSeek-V4-Pro：1.6T 总参数，49B 激活参数
DeepSeek-V4-Flash：284B 总参数，13B 激活参数

两者都是 MoE 架构，都支持 1M 上下文，也都已经开放权重，同时能通过 DeepSeek API 调用。

如果只看产品层，这次最容易被忽略的一点反而很关键：DeepSeek 没有把 V4 做成单一旗舰，而是做成了更清楚的双线产品。Pro 负责能力上限，Flash 负责成本和吞吐。

按照官方 API 定价，V4-Flash 是每百万输入 0.14 美元、输出 0.28 美元；V4-Pro 是每百万输入 1.74 美元、输出 3.48 美元。放到今天这个市场里看，尤其是跟闭源头部模型比，这个价格带来的压力不会小。

另一个实用更新是，DeepSeek 把“思考强度”也产品化了。官方给了三档模式：Non-think、Think High、Think Max。说白了，就是用户可以自己决定这个模型是要快点出活，还是多想一会儿再答。

这次技术升级，核心不在“更大”，而在“更敢把长上下文做成默认配置”

如果只看参数，V4-Pro 当然够大。但这次最值得注意的，不只是从 V3.2 往上堆到了 1.6T，而是 DeepSeek 试图把“百万上下文”从 PPT 指标，往真实可用的工程能力上拽。

官方模型卡里最关键的有三点。第一是新的混合注意力架构，把 Compressed Sparse Attention 和 Heavily Compressed Attention 组合在一起。按照 DeepSeek 的说法，在 1M 上下文下，V4-Pro 单 token 推理 FLOPs 只要 V3.2 的 27%，KV Cache 只要 10%。这个数字当然还要等第三方验证，但方向很明确，它想解决的不是“能不能宣称 1M”，而是“1M 会不会贵到根本没人用”。

第二是 mHC，也就是 Manifold-Constrained Hyper-Connections，本质上是为超大模型训练稳定性服务。第三是 Muon Optimizer，对应训练效率和收敛问题。这说明 DeepSeek 这次不是只在后训练上修修补补，而是从架构和训练层面一起动了手。

还有一个细节也要说清楚：现在外面很多二手解读，喜欢顺手把 V4 说成“原生多模态大一统模型”。但至少从这次公开出来的预览版模型信息看，它当前公开形态还是 text-generation。所以更稳妥的说法应该是，这次能确认的核心卖点，还是长上下文、推理模式和 agent/coding 导向增强。

首轮热议，基本集中在这几件事

真正吓人的，不是 Pro，而可能是 Flash

很多人第一眼会被 1.6T 吸过去，但社区里反复被拿出来讨论的，反而是 Flash。原因很简单：它便宜得离谱，而且从官方表里看，很多 benchmark 跟 Pro 的差距并没有大到夸张。比如 SWE-Bench Verified，Flash 是 79.0，Pro 是 80.6；LiveCodeBench，Flash 是 91.6，Pro 是 93.5。真到落地选型时，很多团队看的往往不是“最强”，而是“这点差距值不值十倍以上价差”。

这也是为什么我觉得 V4 这次真正有冲击力的地方，不只是 Pro 去冲榜，而是 Flash 很可能直接去卷市场。

它确实很强，但没有强到“表格横扫一切”

这一点必须讲，不然文章就容易写飘。DeepSeek 自己放出的对比表里，V4-Pro 在不少项目上确实很能打，尤其是代码、部分数学和 agent 任务。但它并不是每项都第一。比如 MMLU-Pro 上，它和 GPT-5.4 持平，但低于 Opus 4.6 Max 和 Gemini 3.1 Pro；Terminal Bench 2.0 上也没有压过 GPT-5.4；SWE-Pro 甚至不是最领先的那个。

换句话说，V4 预览版可以说是“开源阵营里非常硬的一次更新”，但现在就把它写成“全面吊打闭源前沿模型”，那就是往标题党去了。争议最大的地方也在这儿：支持者看到的是“开源终于又往前迈了一步”，质疑者盯着的是“这些成绩有多少能被第三方复现”。

真正被反复转发的，是“开源 + 低价 + 1M 上下文”这个组合

单独看其中任何一项，都不算新闻。模型强，别人也强；上下文长，别人也能给；便宜，行业里也不是第一次打价格战。真正让 DeepSeek V4 重新有存在感的，是这三件事被它同时打包出来了。

而且它不是停在“论文好看”这一步，API 已经同步上线，旧的 deepseek-chat 和 deepseek-reasoner 未来还会映射到 deepseek-v4-flash。这意味着它不是只想在开源社区刷口碑，而是想把产品、API 和开发者迁移路径一起铺出来。这不是摆样子，是在认真做产品。

我觉得这次最值得注意的，不是热搜感，而是产品感

看完这一轮资料，我对 DeepSeek V4 预览版的判断大概是这样：它不是那种“全世界一夜洗牌”的发布，但也绝对不是普通迭代。更像是 DeepSeek 用一种很成熟的产品思路，重新告诉市场一件事：开源模型不只是在追性能，也开始认真处理价格、上下文和 agent 工作流这些更落地的事。

而且这次它没有把话说得太满。外界注意到，DeepSeek 自己在一些地方反而写得挺克制，甚至承认和最前沿闭源模型还有几个月差距。你可以说这是策略，也可以说这是少见的诚实，但至少它没有把自己包装成一个没有死角的“神模”。

当然，预览版终究是预览版。接下来几天更关键的不是官方继续发多少海报，而是三件事：第一，第三方 benchmark 会不会基本验证它现在的说法；第二，真实开发场景里，Flash 会不会因为价格和速度直接变成最常被调用的那款；第三，1M 上下文这件事，到底是“真能上生产”，还是“账单一出来大家又退回 128K”。如果这三件事里有两件成立，那 DeepSeek V4 这一枪就算打中了。

写在最后

这轮热议，表面看是在吵 DeepSeek V4 到底强不强，实际上大家吵的是另一件更现实的事：开源模型是不是又一次逼近了“够强、够便宜、够能干活”那个临界点。

我觉得答案至少已经不是“还早”，但要说“已经到了”，也还差最后几步。

DeepSeek V4 预览版真正有意思的地方，就在这个不上不下的时刻。它已经强到不能再被当成陪跑，也还没有强到让争议消失。于是讨论才会这么热。因为大家都看出来了，下一轮模型竞争，可能真不只是比谁更聪明，而是比谁更像一个能被长期接入工作流的系统。

参考链接：

DeepSeek-V4-Pro 模型卡：https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
DeepSeek-V4-Flash 模型卡：https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash
DeepSeek API 定价页：https://api-docs.deepseek.com/quick_start/pricing
DeepSeek API 模型列表：https://api-docs.deepseek.com/api/list-models
社区首轮讨论 1：https://news.ycombinator.com/item?id=47885003
社区首轮讨论 2：https://news.ycombinator.com/item?id=47885230
外媒报道 1：https://www.reuters.com/world/china/deepseeks-v4-model-will-run-huawei-chips-information-reports-2026-04-03/
外媒报道 2（含 Yifan Zhang 的 X 预热帖）：https://cntechpost.com/2026/04/20/deepseek-v4-launch-expected-this-week-following-researchers-tweet/
Yifan Zhang 在 X 的预热帖：https://x.com/yifan_zhang_/status/2045670523938521138
X 搜索入口（DeepSeek V4）：https://x.com/search?q=DeepSeek%20V4&src=typed_query
外媒解读：https://thenextweb.com/news/deepseek-v4-pro-flash-launch-open-source