跳转到内容
Anthropic指控阿里蒸馏Claude——2.5万个账户、2880万次调用、凌晨2-5点
·行业动态

Anthropic指控阿里蒸馏Claude——2.5万个账户、2880万次调用、凌晨2-5点

返回博客
金柘
#Anthropic#阿里#知识产权#蒸馏#AI法律

看Bloomberg这篇报道时,我第一反应是看时间戳——不是4月1号。

6月24日,Anthropic正式致函美国政府,指控阿里巴巴对Claude模型进行了大规模"对抗性蒸馏"。2.5万个账户。2880万次调用。17个不同的ASN。调用集中在凌晨2点到5点,间隔精确控制在300-500毫秒。

这不是个人开发者薅API羊毛。这是工业化级别的蒸馏行动。

事件

据Bloomberg 6月24日独家报道,Anthropic致函美国政府,指控阿里巴巴在2024年4月至6月期间,通过约2.5万个账户大规模"对抗性蒸馏"Claude模型,总计2880万次API调用。阿里使用了17个不同的ASN(自治系统号),IP分布在多个地区。调用集中在凌晨2-5点,间隔精确控制在300-500毫秒。

阿里回应:"我们严格遵守各模型服务商的用户协议,从未进行任何被禁止的数据获取行为。"

关键数据

  • 被指控账户数量:约2.5万个
  • API调用次数:2880万次
  • 时间跨度:2024年4-6月
  • 操作时间:凌晨2-5点
  • 调用间隔:300-500毫秒
  • ASN数量:17个
  • 数据来源:Bloomberg 6/24独家报道

为什么值得关注

这是AI行业第一次有顶级模型公司通过政府渠道,正式指控另一家科技巨头的模型蒸馏行为。在此之前,蒸馏处于"法律真空"——服务条款禁止,但法律上没有明确罪名。

Anthropic的指控分两层:一是违反服务条款(民事),二是"对抗性蒸馏"可能构成某种形式的知识产权侵权(需要法院判断)。

蒸馏本身不违法。你在美国法律里找不到"蒸馏罪"。OpenAI、Anthropic的服务条款禁止蒸馏,但那只是合同层面。Anthropic把这个案子推到了必须立法的临界点——它可能成为AI知识产权法律框架的首个标杆案例。

我的快评

短期内不会有结果。法律案件拖2-3年是常态。但三个连锁反应已经开始:

第一,模型公司的安全团队会大规模升级反滥用系统。如果你现在用中国IP调美国API,审查会比以前严得多。

第二,开源模型的战略价值进一步上升。蒸馏闭源模型有法律风险,蒸馏开源模型没有。对LLaMA、Qwen、DeepSeek是直接利好。

第三,AI知识产权法律框架会加速建立。现在还是丛林法则——Anthropic vs 阿里可能是第一个写进教科书的案例。

对我做API中转站来说,中性偏利好——更多开发者会需要一个合规的中间层来隔离风险。但也意味着我要更仔细审查异常用量,防止有人通过我们平台做违规蒸馏。

延伸思考

你怎么证明"蒸馏"? Anthropic说阿里蒸馏了Claude——但证法是"2.5万个账户、凌晨2-5点、毫秒级间隔"。这些证据证明的是"异常使用模式",不是"蒸馏行为本身"。理论上这2880万次调用可以是在做压测、做安全审计、做对比评测。Anthropic有没有技术手段证明对方确实把输出用作训练数据——还是全靠行为模式推断?如果是后者,这案子的证据链完整吗?

蒸馏和"被启发"的边界在哪? 如果阿里研究员用了Claude来理解某个技术概念,然后把这套理解用于自己的模型设计——这算蒸馏吗?看了Claude的回答、手动记笔记、用笔记改进模型,和写脚本自动化调用2880万次——法律上区别在哪?前者是"学习",后者是"侵权"——但中间那条线谁来画?

后果

如果Anthropic胜诉,所有依赖蒸馏训练的大模型公司都需要重新审视训练数据来源。蒸馏可能从"灰色地带"变成法律红线。开源模型的战略地位会大幅跃升——蒸馏开源模型没有法律风险。API平台的反滥用审核将成为标配而非差异化功能。


本文数据来源于互联网公开信息(Bloomberg 6/24报道),仅供行业趋势参考。