区小号报道:
人工智能公司 Anthropic 在有关人工智能公司如何使用受版权保护的材料来训练其模型的版权纠纷中赢得了关键的法律胜利,但这场斗争远未结束。
美国地区法官威廉·阿尔苏普 (William Alsup) 发现 Anthropic 使用受版权保护的书籍来训练其人工智能聊天机器人克劳德根据美国版权法,这属于“合理使用”,裁决周一晚些时候。
美国地区法官威廉·阿尔苏普 (William Alsup) 在裁决中表示:“就像任何渴望成为作家的读者一样,Anthropic 的法学硕士课程的培训目的不是为了赶超、复制或取代作品,而是为了突破困境,创造出一些不同的东西。”
但法官还指责这家由亚马逊和谷歌支持的公司建立并维护了一个庞大的盗版书籍“中央图书馆”,称其这一行为明显侵犯了版权。
版权法中“无豁免”
该案于去年 8 月由作家 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 提起,被指控人类使用从 Library Genesis 和 Pirate Library Mirror 等臭名昭著的网站下载的数百万本盗版书籍来构建 Claude。
该诉讼寻求赔偿和永久禁令,指控 Anthropic“通过窃取数十万本受版权保护的书籍建立了价值数十亿美元的业务”,以训练其人工智能模型系列 Claude。
阿尔苏普表示,人工智能训练可以“极具变革性”,并指出克劳德的成果并不是复制或重新整理作者的作品,而是生成与原文“正交”的新文本。
法庭记录显示,Anthropic 下载了至少 700 万本盗版书籍,包括每位作者的作品副本,以组建其图书馆。
内部电子邮件显示,Anthropic 的联合创始人试图避免授权书籍的“法律/实践/商业障碍”,而员工们则将目标描述为创建一个“世界上所有书籍”的数字收藏,并“永久”保存。
“然而,版权法并没有为人工智能公司提供任何豁免,”阿尔苏普说,并指出,如果允许维护一个永久的被盗作品库——即使只有一部分用于培训——也会“摧毁学术出版市场”。
威廉·阿尔苏普 (William Alsup) 法官的裁决是美国联邦法院首次做出的实质性裁决,该裁决直接分析并适用合理使用原则,具体针对使用受版权保护的材料来训练生成式人工智能模型。
法院区分了直接用于人工智能训练的副本(被视为合理使用)和保留的盗版副本,现在将受到进一步的法律诉讼,包括潜在的损害赔偿。
人工智能版权案件
虽然已经提起了多起诉讼(包括针对 OpenAI、元 等公司的备受瞩目的案件),但这些案件仍处于早期阶段,驳回动议尚待审理或调查仍在进行中。
OpenAI 和 Meta两家公司都面临着来自作者团体的诉讼,指控他们的版权作品在未经同意的情况下被利用来训练 ChatGPT 和 LLaMA 等大型语言模型。
《纽约时报》起诉OpenAI和微软2023 年,指控他们未经许可使用数百万份《纽约时报》文章来开发人工智能工具。
Reddit 最近还起诉了 Anthropic,指控其破坏了 Reddit 平台尽管声称已经停止训练,但还是进行了超过 100,000 次训练克劳德。