Anthropic 指控中国 AI 公司蒸馏 Claude,DeepSeek 月之暗面 MiniMax 到底谁有理?

Anthropic 指控中国 AI 公司蒸馏 Claude,DeepSeek 月之暗面 MiniMax 到底谁有理?

摘要:2026 年 2 月,Anthropic 发布报告指控 DeepSeek、月之暗面和 MiniMax 对 Claude 模型进行知识蒸馏攻击。马斯克随即怒斥"贼喊捉贼"。AI 模型蒸馏到底合不合法?本文从技术、法律、行业双标三个角度分析这场争议。

2 月 23 号,Anthropic 发了一篇长文,指名道姓说 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 三家中国 AI 公司对 Claude 进行了"工业级蒸馏攻击"。声称它们创建了大约 2.4 万个假账号,跟 Claude 交互了 1600 万次,目的是把 Claude 的推理和编程能力给"偷"走。

消息出来之后,马斯克第一个跳出来骂 Anthropic"贼喊捉贼"。他的逻辑很简单:Anthropic 自己 2025 年 9 月才因为未经授权使用盗版书籍等数据训练模型,赔了 15 亿美元和解金。你自己偷别人的数据训练模型,现在反过来告别人蒸馏你的输出?

说实话,这件事我想了好几天,越想越觉得复杂。

AI 知识蒸馏到底算不算"偷"技术?

先说技术层面。知识蒸馏(Knowledge Distillation)是 Geoffrey Hinton 在 2015 年发表的论文里就系统阐述过的技术,让大模型(教师模型)去教小模型(学生模型),通过输出来传递能力。Google、Meta、OpenAI 自己都在用。这个技术本身没有原罪。

问题出在"怎么蒸"。Anthropic 的指控重点是:这些公司用了假账号,绕过地区限制,违反了服务条款。从合同法角度看,违反 ToS 确实站不住脚。但违反 ToS 和"偷"是两码事。你去餐厅吃饭,菜端上来了,你拍了张照发朋友圈,餐厅能说你偷了他的配方吗?

更麻烦的是法律上的灰色地带。AI 模型的输出目前在多数司法管辖区不受版权保护。你问 Claude 一个问题,它给你一个回答,这个回答严格意义上不属于 Anthropic 的"作品"。蒸馏迁移的是功能逻辑,不是训练数据本身,更接近反向工程而不是复制。

Anthropic 的双标问题绕不过去

马斯克的嘲讽虽然刻薄,但确实点到了要害。

整个大模型行业建立在一个基础之上:大规模使用互联网公开数据进行训练。OpenAI 用了 Reddit 的帖子、Stack Overflow 的代码、无数人的博客文章。Anthropic 用了图书馆里的书。Google 用了整个互联网。这些数据的原始创作者大多没有被征求过意见,也没有拿到一分钱。

现在这些公司转过头来说"你不能用我的模型输出来训练你的模型",逻辑上确实说不通。如果"合理使用"能保护你拿别人的数据训练模型,那同样的法律逻辑是不是也应该保护别人蒸馏你的输出?伯克利法学院有一篇分析文章专门讨论了这个问题,标题就叫"创新困境:OpenAI 诉 DeepSeek 案中的 AI 蒸馏"。结论是目前法律框架下,蒸馏的合法性边界相当模糊。

DeepSeek、月之暗面、MiniMax 的蒸馏操作细节

话说回来,2.4 万个假账号、1600 万次交互,这个规模确实不小。如果属实,至少说明这些公司知道自己在做的事情不太光明正大,否则为什么要用假账号?正常的学术研究或者技术开发,用真实身份去调用 API 就行了。

Anthropic 的报告里还提到了一些细节:这些账号使用了分布式 IP 地址,通过所谓的"九头蛇集群"架构同时管理 2 万多个账号来规避检测。这种操作方式确实看起来不太体面。

其中 MiniMax 的交互量最大,约 1300 万次;月之暗面次之,约 340 万次;DeepSeek 最少,约 15 万次,但据说针对性最强,专门瞄准 Claude 的推理能力和思维链输出。

Anthropic 和 OpenAI 接连指控的时机

这件事发生的时间点值得玩味。正好赶上美国国内讨论是否放松对华 AI 芯片出口管制,而 DeepSeek 的 R1 模型刚在全球引起轰动。Anthropic 在声明里把蒸馏和出口管制直接挂钩,说限制芯片获取不仅能限制中国公司直接训练大模型,也能限制它们蒸馏的规模。

这个论证思路本身就值得警惕。一家商业公司把自己的商业利益包装成国家安全议题,然后去游说政策,这在硅谷不是新鲜事,但每次看到还是让人不舒服。

而且 OpenAI 在 2 月 12 号就已经先跑去国会告了一状,说 DeepSeek 蒸馏了他们的模型。Anthropic 在 11 天后跟进。两家公司前后脚出手,你信是巧合吗?

我的看法

Anthropic 对服务条款被违反的指控可能是事实,但把它上升到"工业级攻击"和"国家安全威胁"的高度,商业纠纷武器化的意味太重了。

你能用别人的公开数据训练模型,别人能不能用你的公开 API 输出来蒸馏?没有人能给出一个干净利落的答案。

中国公司这边,如果确实用了假账号大规模违反 ToS,也没什么好洗的。月之暗面的 Kimi K2.5 发布后收入暴涨,说明不蒸馏一样能做出好产品。何必呢。

这场争议可能倒逼行业把 API 输出的产权归属和蒸馏边界给理清楚。理清楚之前,吵架不会停。

常见问题

Q:什么是 AI 知识蒸馏? 知识蒸馏是用一个大模型(教师模型)的输出来训练一个小模型(学生模型),让小模型学会大模型的能力。Geoffrey Hinton 在 2015 年系统阐述了这一技术,Google、Meta、OpenAI 都在使用。

Q:Anthropic 指控了哪三家中国公司? DeepSeek(深度求索)、月之暗面(Moonshot AI/Kimi)和 MiniMax。Anthropic 称三家公司共创建约 2.4 万个假账号,与 Claude 交互 1600 万次。

Q:AI 模型蒸馏合法吗? 目前没有定论。AI 模型输出在多数国家不受版权保护,但违反服务条款属于合同违约。蒸馏的法律边界还处于灰色地带。

Q:马斯克为什么骂 Anthropic 贼喊捉贼? 因为 Anthropic 在 2025 年 9 月因使用盗版书籍等未授权数据训练 Claude,支付了 15 亿美元和解金。马斯克认为 Anthropic 自己也靠未授权数据起家,指控别人蒸馏属于双标。


参考来源:CNBC、Fortune、The Verge、CNN、南华早报、新京报、路透社、伯克利法学院

← 返回博客列表