Anthropic 说中国 AI 公司蒸馏偷了 Claude 的技术,到底怎么回事?
摘要:Anthropic 指控 DeepSeek、月之暗面、MiniMax 三家中国公司通过 2.4 万假账号蒸馏 Claude 模型。什么是 AI 蒸馏?蒸馏合法吗?马斯克为什么说 Anthropic 贼喊捉贼?一文看懂这场争议。
美国 AI 公司 Anthropic 最近搞了个大新闻。2 月 23 日,它发了一份报告,直接点名三家中国公司——DeepSeek(深度求索)、月之暗面和 MiniMax,说它们"偷"了自己旗下 AI 模型 Claude 的能力。
具体怎么"偷"的呢?Anthropic 说这三家公司注册了大约 2.4 万个假账号,然后跟 Claude 聊了 1600 万次,把 Claude 的回答记录下来,用这些数据去训练自家的模型。这个操作在业内叫"蒸馏"。
什么是 AI 知识蒸馏
打个比方,你是个厨师学徒,跑到米其林餐厅去点了 1600 万道菜,把每道菜的味道、摆盘、食材都详细记下来,然后回去照着做。你没偷它的配方本,也没进它的厨房,但你通过大量品尝学会了它做菜的门道。
AI 蒸馏差不多就是这么回事。用一个强大模型的输出来训练另一个模型。这个技术 2015 年就有了,Google 和 Meta 自己也在用。
马斯克怒斥 Anthropic 贼喊捉贼
消息一出,马斯克在 X 平台上嘲讽 Anthropic"贼喊捉贼"。
马斯克的意思是:Anthropic 自己训练 Claude 的时候,用了大量网上的文章、书籍、代码,很多都没经过原作者同意。去年 9 月,Anthropic 还因为用了盗版书籍训练模型,赔了 15 亿美元和解金。
你自己拿别人的东西训练模型,现在别人用你模型的输出来学,你就说人家偷?这个道理确实有点说不通。
DeepSeek、月之暗面、MiniMax 的蒸馏数据
按 Anthropic 报告里的数据:
- MiniMax 交互量最大,大约 1300 万次
- 月之暗面次之,约 340 万次
- DeepSeek 最少,只有约 15 万次,但据说最有针对性,专门挑推理和编程相关的问题问
Anthropic 还说这些公司使用了很专业的手段来避免被发现,比如通过分散在各地的 IP 地址同时操控大量账号。
AI 蒸馏合法吗
说实话,法律上目前没有定论。
AI 模型输出的内容,在大多数国家现在不受版权保护。你问 Claude 一个问题,它给你一个回答,这个回答不算 Anthropic 的"作品"。所以从版权角度看,蒸馏可能并不违法。
Anthropic 能抓住的点是"违反服务条款"——注册假账号、绕过地区限制,这些确实不合规。但违反服务条款跟"盗窃技术"是两回事,前者是民事违约,后者是知识产权侵权。
OpenAI 也指控 DeepSeek 蒸馏
其实 Anthropic 不是第一个。OpenAI 在 2 月 12 日就向美国国会提交了备忘录,说 DeepSeek 蒸馏了它的模型。两家美国头部 AI 公司前后脚发起指控,时间上也挺耐人寻味的。
而且这个时间点正好是美国在讨论要不要放松对中国的 AI 芯片出口管制。Anthropic 在报告里明确把蒸馏和出口管制联系在一起,说限制芯片供应也能限制蒸馏规模。一家做 AI 的商业公司,把自己的商业利益和国家安全绑在一起,这个操作在硅谷很常见,但每次看到还是觉得微妙。
中国公司怎么回应
截至目前,三家被点名的公司都没有公开回应。
不过从市场看,这些公司日子过得不错。月之暗面的 Kimi K2.5 今年发布后收入创了新高,MiniMax 估值也在涨。不回应本身就是一种回应。
这件事说明什么
AI 行业现在的状态就是规则还没建好,大家已经在场上踢球了。谁的数据能用、蒸馏合不合法、跨国 AI 服务怎么管,没有清晰的答案。
Anthropic 告状也好,马斯克嘲讽也好,每个人都在挑对自己有利的说法。规则不清楚的时候就是这样。
常见问题
Q:什么是 AI 蒸馏? 就是用一个强大 AI 模型的回答去训练另一个较小的 AI 模型,让小模型学会大模型的能力。打个比方,就是去米其林餐厅把菜全尝一遍然后回去自己做。
Q:蒸馏和模型训练有什么区别? 普通训练是用原始数据(文本、代码等)训练模型。蒸馏是用另一个已有模型的输出作为训练数据。蒸馏更像是"拜师学艺"而不是"从零自学"。
Q:Anthropic 指控了哪些中国公司? DeepSeek(深度求索)、月之暗面(做 Kimi 的公司)和 MiniMax。
Q:马斯克为什么反对 Anthropic? 因为 Anthropic 自己 2025 年赔了 15 亿美元,原因是用盗版书籍训练 Claude。马斯克认为这是双标。
参考来源:CNBC、Fortune、新京报、CNN、路透社