AIはテキストの説明から逆算して一貫した曲を生成できるでしょうか? それが前提です 音楽LM、Googleが昨日I/Oカンファレンスのキックオフ中にリリースしたAIを活用した音楽作成ツール。
MusicLM は、さまざまなスタイルで新しい音楽を作成する方法を学習するために数十万時間のオーディオでトレーニングされており、Google の AI Test Kitchen アプリからプレビューで利用できます。 私も数人の同僚と同様に、ここ 1 日ほどこれを使って遊んでいます。
評決? MusicLM がミュージシャンの仕事をすぐに引き受けてくれるわけではないとだけ言っておきましょう。
Test Kitchen で MusicLM を使用するのは非常に簡単です。 アクセスが承認されると、テキスト ボックスが表示され、そこに曲の説明を好きなだけ詳細に入力して、システムに 2 つのバージョンの曲を生成させることができます。 どちらもダウンロードしてオフラインで聴くことができますが、Google では、AI のパフォーマンスを向上させるために、どちらかのトラックを「高評価」することを推奨しています。
私がリリース前の1月に初めてMusicLMを取り上げたとき、私はこのシステムの曲は人間のアーティストが作曲するような音だと書きましたが、必ずしも音楽的に独創性や一貫性があるわけではありませんでした。 今年初めに採取されたサンプルに関して深刻な選り抜きが行われていたことは明らかであるため、これらの言葉を完全に支持しているとは言えません。
私が MusicLM で生成したほとんどの曲は、良く言えばまずまずに聞こえるが、悪く言えば 4 歳の子供が夢中になっているようなものである。 DAW。 私は主に EDM にこだわり、構造と認識できる(そして理想的には心地よい)メロディーを備えたものを生み出そうと努めてきました。 しかし、どんなにまともであっても、たとえ良いものであっても! — MusicLM の曲の始まりが聞こえると、非常に明白で音楽的に不快な方法で壊れる瞬間が来ます。
たとえば、このサンプルは、「ダンスに適した、明るく陽気で風通しの良いスタイルの EDM ソング」というプロンプトを使用して生成されたものです。 頭を揺さぶるようなベースラインと古典的なダフト・パンクのシングルの要素を備えたこの曲は、有望な始まりだ。 しかし、トラックの中盤に近づくと、コースから大きく逸れ、実質的には別のジャンルになります。
こちらは、よりシンプルなプロンプトからのピアノソロです。「ロマンチックで感情的なピアノ音楽」です。 お気づきかと思いますが、各パートのサウンドは良く、素晴らしいものであり、少なくとも指の動きに関しては例外的です。 しかし、その後、ピアニストはマニアに取り憑かれたような気分になります。 その後、音符がごちゃ混ぜになり、オリジナルの線に沿っているにもかかわらず、まるで新しい楽譜から来たかのように、曲は根本的に異なる方向性を帯びます。
私は AI がより基本的な構造の曲のほうがやりやすいかもしれないと考えて、試しに MusicLM のチップチューンを試してみました。 サイコロはありません。 結果 (下) は、キャッチーな部分もありましたが、他のサンプルと同様にランダムに終わりました。
プラスの面としては、MusicLM は全体として、OpenAI が数年前に AI 音楽ジェネレーターを開発しようとして試みた Jukebox よりもはるかに優れた仕事をしています。 MusicLM とは対照的に、Jukebox が作成した曲には、繰り返し行われるコーラスなどの典型的な音楽要素が欠けていて、多くの場合、次の内容が含まれていました。 ナンセンスな歌詞。 MusicLM が制作した曲にはアーティファクトも少なく、忠実度に関しては一般的にステップアップしているように感じられます。
Dance Diffusion の登場は、DALL-E 2 の背後にあるサンフランシスコを拠点とする研究所である OpenAI が、ジュークボックスと呼ばれる音楽生成に関する壮大な実験を詳細に発表してから数年後に起こりました。 ジャンル、アーティスト、歌詞の一部が与えられると、ジュークボックスはボーカルを備えた比較的一貫した音楽を生成できます。 しかし、ジュークボックスが作成した曲には、繰り返し行われるコーラスのような大きな音楽構造が欠けており、多くの場合、 ナンセンスな歌詞。
さらに、プロンプト側の人為的な制限のおかげで、MusicLM の有用性は少し制限されています。 アーティストやボーカルをフィーチャーした音楽は生成されません。 スタイル 特定のミュージシャンの。 「バリー・マニロウのセリフに沿って」のようなプロンプトを入力してみると、エラー メッセージだけが表示されます。
理由はおそらく合法的です。 結局のところ、ディープフェイク音楽は曖昧な法的根拠に基づいており、音楽業界の一部はMusicLMのようなAI音楽ジェネレーターが音楽著作権を侵害していると主張している。 この問題がある程度明確になるまで、そう長くはかからないかもしれない。法廷で進行中のいくつかの訴訟は、音楽生成 AI に関係する可能性が高く、その中には、アーティストの権利なしに AI システムをトレーニングするために作品が使用されるアーティストの権利に関するものも含まれる。知識または同意。 時が教えてくれる。