原创作者们对人工智能的反击

发布于2024年1月16日2024年1月16日作者:盛雪儿

【川透社全译报道】人工智能的发展离不开大量的数据训练，而这些数据来源可能涉及到版权问题。科技巨头们在人工智能训练中涉嫌使用受版权保护的材料，引发了一系列法律纠纷。人工智能在发展过程中面临的版权问题挑战…

科技巨头们正因为在训练人工智能模型中使用受版权保护的材料被告上法庭

人工智能领域的前沿性发展是否建立在大规模侵权的基础上？本文发现在美国有九起针对人工智能公司的单独集体诉讼，包括OpenAI、Meta和谷歌母公司Alphabet。其中一起是盖蒂图片社（Getty Images)起诉Stability AI，该案正在伦敦高等法院审理。

尽管每个案件的具体情况各不相同，但侵犯版权的控诉都有一个共同的指向：原告称人工智能公司通过从互联网上获取数据，如整本书或艺术品，来训练他们的模型，侵犯了版权。

这些原创作品的作者们希望得到相应侵权的补偿，而人工智能公司非常不愿意支付这笔费用。“将实际或潜在的版权责任成本强加于人工智能模型的创建者身上，会扼杀或严重阻碍其发展，”科技投资公司安德森·霍洛维茨 (Andreessen Horowitz) 在 11 月向美国版权局提交的一份文件中写道，该公司持有大量人工智能公司的股份。

事发至今，法院也介入了案件的调查审理。在此类集体诉讼中，原告是人数庞大的群体，如这次诉讼中那些原创作品的作者们。由于该事件的走向可能会产生广泛的社会影响，所以双方代表律师必须先仔细陈述各自的论点。然后，原告之间将进行反复陈述，输出各种不同的论点，而被告将试图通过以前的案件或现有法律驳回这些论点。

“在集体诉讼中，人们会因为激动说出很多无厘头的话。”亚特兰大埃默里大学的马修·萨格（Matthew Sag)说:“不要去纠结太多问题，只管发表为你好的观点，只说那些你能用事实证明的话。”

但同时，萨格表示我们几乎不可能在短时间内看到此类案件得到解决。“集体诉讼的处理向来都是很慢的。变快的唯一方式就是败诉。”一项类似的法律诉讼——针对谷歌图书数字化项目侵犯版权的诉讼——花了近十年，最终还是以被告胜诉得以解决。

我们可以从盖蒂图片社与Stability AI的诉讼中了解到后者正在英国进行人工智能模型的试验。库盖蒂图片社声称，总部位于伦敦的Stability AI通过使用盖蒂的素材训练其人工智能图像生成器Stability Diffusion，侵犯了自己公司的版权。

有关Stability AI辩护的公开信息很少。该公司确实试图驳回诉讼，声称其模型的训练不是在英国完成的，但高等法院在12月驳回了这一说法。伦敦高林威尔金森律师事务所人工智能法负责人马特·赫维(Matt Hervey)表示，双方一直在定期参加听证会，以决定案件的走向，该案件应在2024年下半年结束。高林威尔金森律师事务所没有参与诉讼。

如果案子进入审判阶段，Stability AI可能会发现，与美国相比，在伦敦作为被告想要胜诉更困难。“在伦敦管辖范围内，允许在他人原创性作品上进行人工智能训练的情况很少。”赫维说。

如果盖提赢了，这可能会鼓励其他索赔者试图向人工智能公司寻求赔偿，但他们可能很难找到被告。“这些人工智能公司大多来自美国西海岸，”赫维说。

这些诉讼案件中的任何处理结果都会让一些人工智能公司的“管辖权”发生改变。根据诉讼结果，他们会精心挑选在政策上对自己有利的国家训练他们的模型。对Stability AI的裁决以及英国目前的监管和法律环境可能会说服这些公司选择在美国等法律体系对自己公司发展更好的地方进行人工智能培训。【全文完】

来源：《新科学家》2023年12月30日刊 | 作者：不详
原文标题：Creators fight back against AI