claude用盗版书籍训练数据国人不说话
本帖最后由 kaka1 于 2026-4-1 02:44 编辑但是为什么DeepSeek蒸馏其他模型的数据会招很多国人骂呢?
2025年9月,Anthropic刚因版权官司和一群作者达成15亿美元和解。原告指控Anthropic从LibGen、Pirate Library等盗版网站下载了数百万本版权书,用来训练Claude。和解后Anthropic要删除这些数据并赔钱,但当时估值已超1800亿美元,这点罚款对它来说九牛一毛。马斯克多次嘲讽的就是这个“前科”。
Anthropic指控三家中国AI公司(DeepSeek、Moonshot AI/月之暗面、MiniMax)对Claude进行了“工业级蒸馏攻击”。
他们通过约24,000个虚假账号,生成了超过1600万次对话,系统性地提取Claude的核心能力,然后用这些输出数据去训练自己的模型。
Anthropic认为这违反了服务条款和地区访问限制,还上升到了“风险”高度——因为蒸馏出来的模型没有Claude的安全防护,可能被用于网络攻击、生物武器或监控等。
Anthropic自己一边到处指控别人“蒸馏”它的Claude模型,一边却被马斯克直接一针见血地戳穿了“双标”:你自己当年不也靠“偷”数据起家吗?现在别人偷你的,你急了?
马斯克原贴:https://x.com/elonmusk/status/2026012296607154494
claude原贴地址:https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks
谁家 AI 不是从互联网找数据?别人是从各种网站找数据,DS 是蒸馏 GPT 的数据,初期 DS 它告诉自己就是 chatgpt 翻译:大家快看别人也在吃石,我吃点怎么了! ;P;P;P 其实基本所有AI模型都会有下载并且学习盗版书籍吧 yc010t 所以,被告了,赔钱,有什么不合理? byg 发表于 2026-4-1 08:40
翻译:大家快看别人也在吃石,我吃点怎么了!
都是吃屎
所以都是垃圾 FreeDog 发表于 2026-4-1 15:08
所以,被告了,赔钱,有什么不合理?
典型的允许州官放火 不许百姓点灯一个道理
页:
[1]