DeepSeek V4一发,为什么大家先盯上了Flash
DeepSeek V4 预览版出来之后,很多人第一眼会被 1.6T 总参数和 1M 上下文吸走注意力。
可这两天讨论最凶的,真不一定是 Pro。
反而是 Flash。
这事挺有意思。它说明大家现在看模型,已经不只是看“谁更强”,而是在看“谁更像一个真能跑进场景里的东西”。
DeepSeek V4 这次发的,不是一款,而是两款
先把信息摆清楚。
这次公开的是:
DeepSeek-V4-Pro:1.6T 总参数,49B 激活参数DeepSeek-V4-Flash:284B 总参数,13B 激活参数
两者都是 MoE 架构,都支持 1M 上下文,都已经开放权重,也都能通过 API 调用。
光看这个组合,你就能感觉出来,DeepSeek 这次不是只想秀一下实力,而是开始认真做产品线了。
一个负责能力上限,一个负责价格和吞吐。
这和过去那种“先发一个最强版,剩下的以后再说”不太一样。
为什么大家先盯上了 Flash
原因特别现实:它太便宜了。
官方定价是这样的:
V4-Flash:输入每百万 token0.14美元,输出0.28美元V4-Pro:输入每百万 token1.74美元,输出3.48美元
这个差距一摆出来,很多人脑子里冒出来的第一个问题根本不是“Pro 有多猛”,而是“Flash 到底够不够用”。
因为真到落地的时候,团队买的往往不是最强,而是最划算。
尤其是在现在这个阶段,模型竞争已经不是单纯拼跑分了,而是开始拼:
- 能不能接进现有系统
- 成本能不能接受
- 高并发时会不会太贵
- 真正跑起来之后返工多不多
一旦从这个角度看,Flash 的存在感立刻就不一样了。
Pro 当然强,但这次最有冲击力的可能不是它
V4-Pro 强不强?当然强。
从官方 benchmark 看,它在代码、部分数学和 agent 任务上确实已经到了非常靠前的位置。像 LiveCodeBench、Codeforces、SWE-Bench Verified 这些指标,都能看出它不是随便涨了一点点。
但问题也在这儿。
它强,大家预期本来就高。一个旗舰模型很强,很多人会觉得“合理”。
真正让人重新算账的,是 Flash 这种东西。
因为它不像是拿来挂海报的,更像是拿来跑业务的。
如果 Flash 在真实任务里能撑住大部分场景,那它对市场的影响,未必会比 Pro 小。
这次 V4 最该看的,其实是“1M 上下文到底有没有往可用走”
现在长上下文已经不是新鲜词了,很多模型都能报大数字。
可大家越来越清楚一件事:报得出来,不代表用得起。
DeepSeek 这次在模型卡里强调的重点,是长上下文效率。按官方说法,V4-Pro 在 1M 上下文下,单 token 推理 FLOPs 只要 V3.2 的 27%,KV Cache 只要 10%。
这个数字后面当然还要看第三方验证,但它至少说明了一个方向:DeepSeek 不是只想说“我也有 1M”,而是想把 1M 做成一个更像默认能力的东西。
这件事一旦成立,影响其实不小。因为真实任务里最麻烦的,不是模型少写一段代码,而是它总得让你自己拆上下文。文档、日志、历史记录、调用链、配置说明一多,很多模型就开始吃不消。
所以这轮 V4 真正值钱的,不只是参数,而是它在试图回答一个更难的问题:长上下文到底能不能变成真的工作能力。
当然,也别吹过头
DeepSeek V4 这次热度高,不代表它已经没有争议。
首先,它并不是所有项目都第一。官方表格里,有些 benchmark 它很强,有些也没有绝对领先。所以现在就把它写成“全面掀翻闭源前沿模型”,多少还是有点早。
其次,1M 上下文到底值不值那个成本,还得看真实场景。很多人现在最关心的,不是它能不能挂这个数字,而是账单和效果能不能对得上。
最后,官方成绩最终还是要等更多第三方体验来兜底。模型发布当天,表格永远最好看,真正的分水岭往往出现在发布后一周。
这次讨论最说明问题的地方
如果一定要说这轮热议说明了什么,我觉得答案挺简单:大模型竞争,真的越来越不像“智商竞赛”了。
现在大家看的,是谁更像一个能进场景、能接流程、能按成本跑起来的系统。
DeepSeek V4 这次最有意思的地方,也就在这儿。它不是只给了一个更强的模型,而是把能力、价格、产品线和迁移路径一起摆出来了。
这就让讨论一下子从“它有多猛”变成了“它会不会真的跑起来”。
最后
DeepSeek V4 一发,为什么大家先盯上了 Flash?
因为它让人看到了一种更现实的可能:开源模型的下一轮竞争,未必是谁把天花板抬得最高,而是谁先把“够强、够便宜、够能干活”这三件事凑齐。
如果 Flash 真能跑进更多任务里,那 DeepSeek V4 这次最厉害的地方,可能不是 Pro 帮它赢了面子,而是 Flash 帮它拿了市场。
参考链接
- DeepSeek-V4-Pro 模型卡: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
- DeepSeek-V4-Flash 模型卡: https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash
- DeepSeek Models & Pricing: https://api-docs.deepseek.com/quick_start/pricing
- DeepSeek Thinking Mode: https://api-docs.deepseek.com/guides/thinking_mode
- 社区首轮讨论 1: https://news.ycombinator.com/item?id=47885003
- 社区首轮讨论 2: https://news.ycombinator.com/item?id=47885230
- Reuters 报道: https://www.reuters.com/world/china/deepseeks-v4-model-will-run-huawei-chips-information-reports-2026-04-03/