Google は、テキストの説明から音楽を生成できる AI を作成しましたが、公開しません • TechCrunch

Google の印象的な新しい AI システムは、テキストの説明があれば、あらゆるジャンルの音楽を生成できます。しかし、同社はリスクを恐れて、それをリリースする当面の計画はありません。

呼ばれた MusicML、Google は確かに歌の最初のジェネレーティブ AI システムではありません。他にも、音楽を視覚化して作曲する AI Riffusion、Google 独自の AudioML、OpenAI の Jukebox である Dance Diffusion などの試みがあります。しかし、技術的な制限と限られたトレーニングデータのため、特に複雑な曲や忠実度の高い曲を作成できた人はいません。

MusicML はおそらく最初の可能性です。

学術論文で詳述論文今週、MusicML は、ラベル付けされていない音楽のデータセットでトレーニングされ、作成者が言うように、「非常に複雑」(たとえば、「印象的なサックスソロとソロシンガーを含む魅惑的なジャズソング」または「低いベースと強いキックを備えた 90 年代のベルリンテクノ」その曲は驚くべきことに、人間のアーティストが作曲したように聞こえます。

確かに、どのように誇張するのは難しい良いループ内にミュージシャンや楽器奏者がいない場合、サンプルのサウンドが得られます。いくらか長く曲がりくねった説明が入力された場合でも、MusicML は楽器のリフ、メロディー、ムードなどのニュアンスを捉えることができます。

たとえば、以下のサンプルのキャプションには、「宇宙で迷子になるような体験を誘発する」というビットが含まれており、確かにその面で (少なくとも私の耳には) 伝わってきます。

これは、「アーケードゲームのメインサウンドトラック」という文で始まる説明から生成された別のサンプルです。もっともらしいですね？

MusicLM の機能は、曲の短いクリップを生成するだけではありません。 Google の研究者は、ハミング、歌、口笛、楽器での演奏など、既存のメロディーに基づいてシステムを構築できることを示しています。さらに、MusicLM は、順番に書かれたいくつかの説明 (たとえば、「瞑想する時間」、「起床する時間」、「走る時間」、「100% を与える時間」) を取り、一種の旋律的な「物語」または物語を作成することができます。長さは数分にも及び、映画のサウンドトラックにぴったりです。

以下を参照してください。これは、「ビデオゲームで再生された電子音楽」、「川のそばで再生された瞑想の歌」、「火」、「花火」のシーケンスからのものです。

それは、MusicLM が完璧であることを示唆しているわけではありません。一部のサンプルには歪んだ品質があり、トレーニングプロセスの避けられない副作用です。また、MusicLM は合唱ハーモニーを含むボーカルを技術的に生成できますが、ほとんどの場合、多くのことが望まれます。「歌詞」のほとんどは、いくつかのアーティストの融合のように聞こえる合成された声によって歌われ、ほとんど一貫性がないものから純粋な意味不明なものまでさまざまです。

それでも、Google の研究者は、トレーニングデータから生成された曲に著作権で保護された素材を組み込む不幸な傾向など、MusicML のようなシステムによってもたらされる多くの倫理的課題に注目しています。実験中に、彼らは、システムが生成した音楽の約 1% が、システムがトレーニングした曲から直接複製されていることを発見しました。これは明らかに、現在の状態で MusicML をリリースすることを思いとどまらせるのに十分なしきい値です。

「ユースケースに関連する創造的なコンテンツの潜在的な不正使用のリスクを認識しています」と論文の共著者は書いています. 「私たちは、音楽生成に関連するこれらのリスクに取り組む上で、より多くの将来の作業の必要性を強く強調します.」

MusicML やそのようなシステムがいつの日か利用可能になると仮定すると、重大な法的問題が表面化することは避けられないように思われます。より単純な AI システムの周りではありますが、彼らはすでに持っています。 2020 年、Jay-Z のレコードレーベルは、AI を使用して Jay-Z が Billy Joel の「We Did n’t Start the Fire」などの曲のカバーを作成したとして、YouTube チャンネルの Vocal Synthesis に対して著作権侵害の警告を申し立てました。最初に動画を削除した後、YouTube は動画を元に戻し、削除要求が「不完全」であることを発見しました。しかし、ディープフェイクの音楽はいまだに法的根拠が曖昧です。

あ白書現在、Music Publishers Association の法務インターンである Eric Sunray が執筆したこの論文は、MusicML のような AI 音楽ジェネレーターは、トレーニング中に取り込んだ作品からコヒーレントなオーディオのタペストリーを作成することで音楽の著作権を侵害し、それによって米国著作権法の複製権を侵害していると主張しています。」ジュークボックスのリリース後、批評家は、著作権で保護された音楽素材で AI モデルをトレーニングすることがフェアユースに該当するかどうかについても疑問を呈しています。画像、コード、およびテキストを生成する AI システムで使用されるトレーニングデータについても、同様の懸念が提起されています。これらのデータは、多くの場合、作成者の知らないうちに Web からスクレイピングされます。

ユーザーの観点から、Waxy の Andy Baio 推測する AI システムによって生成された音楽は二次的著作物と見なされ、その場合、オリジナルの要素のみが著作権によって保護されます。もちろん、そのような音楽で何が「オリジナル」と見なされるかは不明です。この音楽を商業的に使用することは、未知の海に入るということです。生成された音楽が、パロディやコメンタリーなど、フェアユースで保護されている目的で使用される場合は、より単純な問題ですが、Baio 氏は、裁判所がケースバイベースの判断を下す必要があると予想しています。

問題が明確になるまでそう長くはかからないかもしれません。裁判所を通過するいくつかの訴訟は、音楽を生成する AI に影響を与える可能性があります。その中には、知らないうちに、または同意なしに AI システムをトレーニングするために作品が使用されているアーティストの権利に関するものも含まれます。

コメントする コメントをキャンセル

コメントするコメントをキャンセル