先週、 著者ギルドは、世界最大の生成 AI 企業のいくつかのリーダーに公開書簡を送りました。 ジョージ・サンダース氏やマーガレット・アトウッド氏などの著名な作家を含む9,000人以上の作家の署名で、アルファベット、オープンAI、メタ、マイクロソフトなどに対し、「AIのトレーニングに著作権で保護された素材を使用することについて同意とクレジットを取得し、作家に公正な補償をする」よう求めた。 この嘆願は、生成 AI システムのトレーニングにおいて自分たちの作品が果たした役割に対するクレジットと報酬を確保しようとするクリエイターらによる一連の取り組みの最新のものにすぎない。
大規模言語モデル (LLM) やその他の生成 AI システムに使用されるトレーニング データは秘密に保たれています。 しかし、これらのシステムが使用されるほど、より多くの作家やビジュアル アーティストが自分の作品とこれらのシステムの出力との類似点に気づくようになります。 多くの人が、生成AI企業に対し、自社のデータソースを明らかにし、著作者組合と同様に、著作物が使用された者に補償するよう求めている。 嘆願の中には公開書簡やソーシャルメディアへの投稿も含まれますが、訴訟になるものも増えています。
ここで著作権法が重要な役割を果たします。 しかし、それは、インターネットによって一変した世界における雇用や報酬をめぐる長年の懸念であれ、プライバシーや個人の、そして著作権のない特性に関する新たな懸念であれ、アーティストの不安の全容に取り組むには不十分なツールである。 これらの多くについて、著作権が提供できる答えは限られています。 「AI が生み出す社会のほぼあらゆる側面には、多くの疑問が生じています」と、テクノロジー ブログの編集者であるマイク・マスニック氏は言います。 テックダート。 「しかし、著作権に対処するツールとして著作権に焦点を絞るのは、本当に見当違いだと思います。」
最も注目度の高い こうした最近の訴訟のうち、コメディアンのサラ・シルバーマン氏は、今月初めに他の4人の著者とともに、2件の別々の申請書でOpenAIを訴え、同社が大人気のChatGPTシステムを彼らの作品に合わせて無許可でトレーニングしたと主張して、OpenAIを訴えた。 どちらの集団訴訟も独占禁止法訴訟を専門とするジョセフ・サベリ法律事務所によって起こされた。 当事務所はアーティストの代理人も務めています 訴訟を起こす Stability AI、Midjourney、DeviantArt も同様の理由です。 先週、この事件の公聴会で、米国地方裁判所のウィリアム・オリック判事は、次のように述べた。 解雇するかもしれない 訴状の大部分は、これらのシステムは「50億枚の圧縮画像」で訓練されていたため、関与したアーティストは著作権侵害の主張について「より多くの事実を提供する」必要があると述べている。
シルバーマン事件では、とりわけ、OpenAIがコメディアンの回想録をスクレイピングした可能性があると主張している。 おねしょをする人、海賊版の電子書籍や学術論文を大量に保管する「シャドウ ライブラリ」を経由します。 エモリー大学の法学教授マシュー・サグ氏は、裁判所がシルバーマン氏と原告仲間に有利な判決を下した場合、この判決はAIモデルのトレーニングに使用されるデータセットを法律がどのように見るかについて新たな前例を設ける可能性があると述べた。 具体的には、企業が自社のモデルが著作権で保護された素材をスクレイピングする場合にフェアユースを主張できるかどうかを判断するのに役立つ可能性がある。 「私はこの問題について結果を問うつもりはない」とサグ氏はシルバーマン氏の訴訟について語る。 「しかし、これまでに提起されたすべての訴訟の中で最も説得力のあるもののようです。」 OpenAIはコメントの要請に応じなかった。
これらの事件の中心には、LLM が作者の保護された作品を「コピー」したという同じ一般理論があるとサグ氏は説明します。 しかし、サグが証言で説明したように、 米国上院小委員会 今月初めに聞いたところによると、GPT-3.5 や GPT-4 のようなモデルは、従来の意味での動作を「コピー」するものではありません。 ダイジェスト より適切な動詞は、トレーニング データを消化してその機能を実行すること、つまりシーケンス内の最適な次の単語を予測することです。 サグ氏は上院証言で「LLMを修道院の筆記者のように訓練データをコピーすると考えるよりも、学生のように訓練データから学習すると考える方が理にかなっている」と述べた。