Google に負けないよう、Meta は独自の AI を活用した音楽ジェネレーターをリリースしました。そして、Google とは異なり、それをオープンソース化しました。
呼ばれた ミュージックジェネMeta の音楽生成ツール。デモが見つかります。 ここ、テキストの説明(例:「バックグラウンドで重いドラムとシンセパッドを使用した、80 年代のドライブするポップソング」)を、多少なりとも約 12 秒の音声に変換できます。 MusicGen はオプションで、既存の曲などの参照オーディオを使用して「操作」することができ、その場合、説明とメロディーの両方に従おうとします。
Meta氏によると、MusicGenは20,000時間の音楽でトレーニングされており、その中には10,000の「高品質」ライセンス音楽トラックと、ShutterStockと大規模なストックメディアライブラリであるPond5からの390,000の楽器のみのトラックが含まれているという。 同社はモデルのトレーニングに使用したコードを提供していないが、 もっている 適切なハードウェア (主に約 16 GB のメモリを搭載した GPU) を持っている人なら誰でも実行できる、事前トレーニングされたモデルを利用可能にしました。
では、MusicGen はどのように機能するのでしょうか? まあ、私はこう言いますが、確かに人間のミュージシャンを職から追い出すほどの能力ではありません。 その曲は、少なくとも「アンビエント チップチューン ミュージック」のような基本的なプロンプトとしてはかなりメロディックで、私の耳には、Google の AI 音楽ジェネレーターである MusicLM の結果と同等 (わずかに優れているとは言わないまでも) です。 しかし、彼らは賞を受賞することはありません。
MusicGen からの「ジャズ エレベーター ミュージック」の出力は次のとおりです。
MusicLM の見解は次のとおりです。
次に、MusicGen をループさせようとして、より複雑なプロンプトを出しました。「オーガニック サンプルを使用したローファイ スロー BPM エレクトロ チル」。 MusicGen は驚くべきことに音楽の一貫性の点で MusicLM を上回り、簡単に定着するものを生み出しました。 ロフィガール。
MusicGen のサンプルは次のとおりです。
そして、ここにMusicLMがあります:
少し趣向を変えて、両方のツールを使用して、ジョージ ガーシュイン スタイルのピアノ小曲を生成してみました。 「試した」と言ったのは、音楽生成ツールに関する著作権問題を未然に防ぐために、Google が特定のアーティストへの言及をブロックするフィルターを MusicLM の公開バージョンに実装したからです。
MusicGen にはそのようなフィルターはありません。 しかし、「ガーシュイン風のバックグラウンドピアノ音楽」の結果には、まだ不十分な点が残されていたと言わざるを得ません。
ジェネレーティブ ミュージックは明らかに向上しています (Riffusion、Dance Diffusion、OpenAI のジュークボックスを参照)。 しかし、重大な倫理的および法的問題はまだ解決されていません。 MusicGen のような AI は、既存の音楽から「学習」して同様の効果を生み出しますが、これはすべてのアーティスト (または生成 AI ユーザー) にとって快適なわけではありません。
ますます、 自家製トラック 生成 AI を使用して、本物として、または少なくとも十分に近いものとして偽装できる馴染みのある音を呼び起こすものは、急速に広まっています。 音楽レーベルは、知的財産上の懸念を理由に、すぐにストリーミング パートナーに警告を発しました。 一般的 勝利した。 しかし、「ディープフェイク」音楽がアーティスト、レーベル、その他の権利所有者の著作権を侵害しているかどうかについては、まだ明確になっていません。
この問題に関する指針が示されるのもそう遠くないかもしれない。 法廷で係争中のいくつかの訴訟は、音楽生成AIに関係する可能性が高く、その中には、アーティストの知識や同意なしにAIシステムのトレーニングに作品が使用されるアーティストの権利に関する訴訟も含まれる。
一方、Metaは、MusicGenの使用方法に制限を課していないが、MusicGenがトレーニングされたすべての音楽は、Shutterstockとの契約を含む「権利所有者との法的合意によってカバーされている」と述べている。