kaka1 发表于 2026-4-1 02:27:59

claude用盗版书籍训练数据国人不说话

本帖最后由 kaka1 于 2026-4-1 02:44 编辑

但是为什么DeepSeek蒸馏其他模型的数据会招很多国人骂呢?


2025年9月,Anthropic刚因版权官司和一群作者达成15亿美元和解。原告指控Anthropic从LibGen、Pirate Library等盗版网站下载了数百万本版权书,用来训练Claude。和解后Anthropic要删除这些数据并赔钱,但当时估值已超1800亿美元,这点罚款对它来说九牛一毛。马斯克多次嘲讽的就是这个“前科”。

Anthropic指控三家中国AI公司(DeepSeek、Moonshot AI/月之暗面、MiniMax)对Claude进行了“工业级蒸馏攻击”。
他们通过约24,000个虚假账号,生成了超过1600万次对话,系统性地提取Claude的核心能力,然后用这些输出数据去训练自己的模型。
Anthropic认为这违反了服务条款和地区访问限制,还上升到了“风险”高度——因为蒸馏出来的模型没有Claude的安全防护,可能被用于网络攻击、生物武器或监控等。





Anthropic自己一边到处指控别人“蒸馏”它的Claude模型,一边却被马斯克直接一针见血地戳穿了“双标”:你自己当年不也靠“偷”数据起家吗?现在别人偷你的,你急了?

马斯克原贴:https://x.com/elonmusk/status/2026012296607154494

claude原贴地址:https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks


toot 发表于 2026-4-1 03:13:21

谁家 AI 不是从互联网找数据?别人是从各种网站找数据,DS 是蒸馏 GPT 的数据,初期 DS 它告诉自己就是 chatgpt

byg 发表于 2026-4-1 08:40:52

翻译:大家快看别人也在吃石,我吃点怎么了!

rqp 发表于 2026-4-1 10:24:40

;P;P;P

qunsx 发表于 2026-4-1 10:51:25

其实基本所有AI模型都会有下载并且学习盗版书籍吧

williamc2 发表于 2026-4-1 11:00:21

yc010t

FreeDog 发表于 2026-4-1 15:08:35

所以,被告了,赔钱,有什么不合理?

kaka1 发表于 2026-4-1 17:00:50

byg 发表于 2026-4-1 08:40
翻译:大家快看别人也在吃石,我吃点怎么了!

都是吃屎
所以都是垃圾

kaka1 发表于 2026-4-1 17:03:49

FreeDog 发表于 2026-4-1 15:08
所以,被告了,赔钱,有什么不合理?

典型的允许州官放火 不许百姓点灯一个道理
页: [1]
查看完整版本: claude用盗版书籍训练数据国人不说话