Adobe、AI学習データに作者の作品を不正利用したとして集団訴訟の提案を受ける

-

Adobe、AI学習データに作者の作品を不正利用したとして集団訴訟の提案を受ける

Adobeといえば、近年AI技術に力を入れており、AIを活用したメディア生成スイートである「Firefly」をはじめ、多くのAIサービスをローンチしてきました。しかし、そのAIへの積極的な取り組みが、今度は思わぬ形でAdobeを悩ませているようです。なんと、同社がAIモデルの学習データに著作権で保護された作品を不正利用したとして、集団訴訟の提案を受けたとのこです。

訴訟の概要

この訴訟は、オレゴン州の作家であるエリザベス・リヨン氏が提起したもので、Adobeが同社のAIモデル「SlimLM」の学習に、多数の書籍の不正コピー品を使用したと主張しています。リヨン氏自身も、自分が書いた作品がAdobeのプログラムの基盤となったデータセットの一部として利用されたと証言しています。

SlimLMとは?

AdobeはSlimLMを「モバイルデバイスでの文書支援タスクに最適化された小型言語モデルシリーズ」と説明しています。このモデルは、2023年6月にCerebrasが公開した「SlimPajama」という、 deduplicated(重複排除済み)で多岐にわたるデータセットで事前学習されたとのこと。

しかし、リヨン氏の訴状によると、Adobeが使用したSlimPajamaデータセットは、「RedPajama」データセットのコピーであり、その中にはBooks3という、191,000冊もの書籍を含む巨大なコレクションが含まれています。そして、このBooks3にはリヨン氏を含むクラスメンバーの著作物が含まれていると訴状は主張しています。

AIと著作権問題

AIの学習データにおける著作権侵害は、今や珍しいことではありません。AIアルゴリズムは大量のデータセットで学習しますが、その中には不正にコピーされた素材が含まれているケースがあるのです。過去には、AppleやSalesforceも同様の訴訟を起こされており、Anthropicは著作物の不正利用で作者に15億ドルを支払うことで和解しています。

これらの訴訟は、AI開発における著作権問題の重要性を示しており、今後のAI業界の発展において、クリエイターの権利保護とAI技術の進歩のバランスをどう取るかが、大きな課題となりそうです。

合わせて読みたい  ChatGPTが “OS” になる。新機能「Apps in ChatGPT」発表で、アプリの使い方が根底から変わる

カテゴリー

Related Stories