あなたが持っているかもしれません ここ数週間、AI で作成されたいくつかの印象的なビデオ ミームに気付きました。 ハリーポッター バレンシアガのコマーシャルとして再考 そして悪夢のような映像 スパゲッティを食べるウィル・スミス どちらも最近バイラルになりました。 これらは、ビデオを作成する AI の能力がいかに急速に進歩しているか、また、テクノロジーの一部の使用がいかに問題を抱えているかを浮き彫りにしています。
これらのビデオは、AI 画像作成ツールが昨年普及した瞬間を思い出させます。当時、Craiyon (以前は DALL-E Mini として知られていた) のようなプログラムにより、粗野でしばしばシュールな、 ガソリンスタンドを強盗する赤ちゃんの監視映像、 ダース・ベイダーの法廷スケッチ、 と クレヨンを食べるイーロン・マスク.
Craiyon は、慎重に制限されていた ダルイー2 ChatGPT の背後にある会社である OpenAI の画像ジェネレーター。 このツールは、AI がテキスト プロンプトを受け取り、実際の写真や人間が描いたイラストのように見えるものに変換する能力を示した最初のツールでした。 それ以来、DALL-E は誰にでも開かれたものになり、 途中 と ドリームスタジオ 同様のツールを開発して磨きをかけた結果、キーボードを数回タップするだけで、複雑でリアルな画像を比較的簡単に作成できるようになりました。
エンジニアがこれらの画像ジェネレーターの背後にあるアルゴリズムのノブとレバーを微調整し、より多くのトレーニング データを追加し、すべてを実行するためにより多くの GPU チップを購入したため、これらの画像作成ツールは現実を偽造するのに非常に優れたものになりました。 奇妙な AI 画像専用の subreddit からいくつかの例を取得するには、以下をご覧ください。 ゲイプライドパレードでのアレックス・ジョーンズ または ヤードセールでの契約の箱.
このテクノロジーとその洗練度への広範なアクセスにより、オンライン画像の見方を再考せざるを得なくなりました。先月、ドナルド・トランプの逮捕を示すと称する AI 作成の画像が口コミで広まったことで強調されました。 この事件により、Midjourney はサービスの無料トライアルを提供しないことを発表しました。この修正により、一部のチープスケートの悪意のある攻撃者を抑止する可能性がありますが、より広範な問題には手つかずのままです。
WIRED の Amanda Hoover が今週書いているように、アルゴリズムは、プロンプトから説得力のあるビデオを生成するのに依然として苦労しています。 多くの個々のフレームを作成するには計算コストがかかります。また、今日のジッタリングとスパッタリングのビデオが示すように、アルゴリズムがそれらの間の十分な一貫性を維持して意味のあるビデオを生成することは困難です。
しかし、AI ツールは、ビデオの編集において、はるかに熟達しています。 バレンシアガのミームと、参照しているバージョン 友達 と 不良になる、いくつかの異なる AI ツールを組み合わせて作成されました。最初に静止画像を生成し、次に簡単なアニメーション効果を追加しました。 しかし、最終結果は依然として印象的です。
滑走路MLプロの画像とビデオの作成と編集のための AI ツールを開発しているスタートアップである は、今週、 新しいより効率的な技術 ビデオにスタイルの変更を適用するため。 これを使用して、既存のビデオから「雲景」の中を歩いている猫のレオナの夢のような映像をわずか数分で作成しました。
さまざまな機械学習技術によって、新しい可能性が開かれます。 という会社 ルマ AIたとえば、ニューラル ラディアンス フィールドとして知られる技術を使用して、2D 写真を詳細な 3D シーンに変換しています。 会社のアプリにいくつかのスナップショットをフィードすると、 完全にインタラクティブな 3D シーン で遊ぶ。
これらのクリップは、私たちが AI ビデオ作成の変曲点にいることを示唆しています。 AI 画像生成と同様に、ミームの急増に続いて、AI ビデオの品質と制御性が大幅に向上し、あらゆる場所にテクノロジーが組み込まれる可能性があります。 AI は、一部の作家にとってミューズになる可能性があります。 滑走路のツールは 視覚効果アーティストが使用 オスカー受賞作に取り組んでいます すべてを一度にどこでも. ダーレン・アロノフスキー監督 クジラ、 黒い白鳥、 と 円周率 また〜だ ランウェイのファン.
しかし、Midjourney と Dream Studio の画像が AI ビデオがどこに向かっているのかを理解するには、現在どれほど高度な画像であるか、また、本物のクリップと偽のクリップを区別することがどれほど困難になるかを見るだけで十分です。 もちろん、人々はすでに既存のテクノロジーでビデオを操作できますが、それでも比較的高価であり、実行するのは困難です.
ジェネレーティブ AI の急速な進歩は、ソーシャル メディアが兵器化され、ディープフェイクがプロパガンダのおもちゃになっている時代に危険であることが証明される可能性があります。 Jason Parham が WIRED に今週書いたように、ジェネレーティブ AI が醜いステレオタイプをどのように取り戻し、再利用できるかを真剣に検討する必要があります。
今のところ、ビデオ クリップを信頼するという本能はほとんど信頼できますが、私たちが目にする映像が以前よりも信頼性や真実性を失うのにそれほど時間はかからないかもしれません。