claude用盗版书籍训练数据国人不说话-美国VPS综合讨论-全球主机交流论坛

kaka1 发表于 2026-4-1 02:27:59

claude用盗版书籍训练数据国人不说话

本帖最后由 kaka1 于 2026-4-1 02:44 编辑

但是为什么DeepSeek蒸馏其他模型的数据会招很多国人骂呢？

2025年9月，Anthropic刚因版权官司和一群作者达成15亿美元和解。原告指控Anthropic从LibGen、Pirate Library等盗版网站下载了数百万本版权书，用来训练Claude。和解后Anthropic要删除这些数据并赔钱，但当时估值已超1800亿美元，这点罚款对它来说九牛一毛。马斯克多次嘲讽的就是这个“前科”。

Anthropic指控三家中国AI公司（DeepSeek、Moonshot AI/月之暗面、MiniMax）对Claude进行了“工业级蒸馏攻击”。
他们通过约24,000个虚假账号，生成了超过1600万次对话，系统性地提取Claude的核心能力，然后用这些输出数据去训练自己的模型。
Anthropic认为这违反了服务条款和地区访问限制，还上升到了“风险”高度——因为蒸馏出来的模型没有Claude的安全防护，可能被用于网络攻击、生物武器或监控等。

Anthropic自己一边到处指控别人“蒸馏”它的Claude模型，一边却被马斯克直接一针见血地戳穿了“双标”：你自己当年不也靠“偷”数据起家吗？现在别人偷你的，你急了？

马斯克原贴：https://x.com/elonmusk/status/2026012296607154494

claude原贴地址：https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks

toot 发表于 2026-4-1 03:13:21

谁家 AI 不是从互联网找数据？别人是从各种网站找数据，DS 是蒸馏 GPT 的数据，初期 DS 它告诉自己就是 chatgpt

byg 发表于 2026-4-1 08:40:52

翻译：大家快看别人也在吃石，我吃点怎么了！

rqp 发表于 2026-4-1 10:24:40

;P;P;P

qunsx 发表于 2026-4-1 10:51:25

其实基本所有AI模型都会有下载并且学习盗版书籍吧

williamc2 发表于 2026-4-1 11:00:21

yc010t

FreeDog 发表于 2026-4-1 15:08:35

所以，被告了，赔钱，有什么不合理？

kaka1 发表于 2026-4-1 17:00:50

byg 发表于 2026-4-1 08:40
翻译：大家快看别人也在吃石，我吃点怎么了！

都是吃屎
所以都是垃圾

kaka1 发表于 2026-4-1 17:03:49

FreeDog 发表于 2026-4-1 15:08
所以，被告了，赔钱，有什么不合理？

典型的允许州官放火不许百姓点灯一个道理

页: [1]

全球主机交流论坛's Archiver

claude用盗版书籍训练数据国人不说话