OpenAI回应被纽约时报起诉：使用公开素材训练合理，单一数据源不重要

访客 2024-01-09 12:20:57 9087 抢沙发

默认

AI（人工智能）新锐巨头OpenAI再次回应被《纽约时报》起诉事宜。

当地时间1月8日，OpenAI通过官网发布一份声明称，《纽约时报》的诉讼毫无根据，且没有讲述完整的事实。

2023年12月27日，《纽约时报》以侵犯版权为由起诉OpenAI和微软，成为了第一家起诉这两家公司侵犯其文字作品版权的美国大型媒体。《纽约时报》指出，被告应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。此外，《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。

在最新的声明中，OpenAI认为《纽约时报》并未讲述全部的事实。OpenAI提到，通过2023年12月19日的最后一次沟通，公司与《纽约时报》的讨论似乎取得了建设性进展，但纽约时报12月27日提起诉讼，令公司感到惊讶和失望。

此次声明并非OpenAI第一次公开回应被起诉事宜。当地时间1月4日，OpenAI的知识产权和内容首席汤姆·鲁宾（Tom Rubin）曾在一个采访中回应被《纽约时报》起诉，称感到“惊讶”，因为在《纽约时报》起诉公司之前，双方正处于“非常积极和富有成效的谈判中”。

在最新的声明中，OpenAI还提到双方沟通的一个细节：《纽约时报》提到，看到了一些内容的反刍，公司承诺调查和解决这些问题，但一再拒绝分享任何示例。

OpenAI强调，《纽约时报》的诉讼毫无根据，尽管如此，公司仍然希望与其建立建设性的合作伙伴关系，并尊重其悠久的历史。关于与新闻机构的合作。OpenAI还提到，公司与数十家以及新闻/媒体联盟等行业组织联系沟通，以探索机会，讨论他们的担忧并提供解决方案，公司的目标是支持健康的新闻生态系统，成为良好的合作伙伴，创造互利的机会。

对于使用公开的互联网材料训练AI模型，OpenAI认为，这种合理使用得到了长期存在，并有广泛的先例支持。这一原则对创造者公平，对创新者必要。尽管如此，公司还为出版商提供了一个简单的选择退出流程，以防止公司的工具访问纽约时报这样的网站。

反刍（Regurgitation）是指特定内容在大模型的训练数据中多次出现。对此，OpenAI强调，这是一种罕见的失败，公司采取了措施来限制并非故意的记忆，并防止大模型输出中的反刍现象。同时，OpenAI强调，故意操纵其大模型进行反刍，并不是对技术的适当使用，也违反了使用条款。

“由于大模型是从人类知识的巨大集合中学习，因此任何一个部门都只是整体训练数据的一小部分，任何单一数据源，包括《纽约时报》，对于大模型的预期学习并不重要。”OpenAI表示。

标签：纽约时报公司