ジェネレーティブ AI の登場 ビデオ用。 新しいウェブサイト、 クイックビデオは、いくつかのジェネレーティブ AI システムを 1 つのツールに組み合わせて、短い形式の YouTube、Instagram TikTok、および Snapchat ビデオを自動的に作成します。 QuickVid は、わずか 1 語で、ライブラリから背景ビデオを選択し、スクリプトとキーワードを作成し、DALL-E 2 によって生成された画像をオーバーレイし、YouTube の著作権使用料無料の音楽ライブラリから合成ナレーションと背景音楽を追加します。
QuickVid の作成者である Daniel Habib は、作成者がファンからの「増え続ける」需要に対応できるようにするためにサービスを構築していると述べています。
「高品質のコンテンツをすばやく簡単に作成するためのツールをクリエイターに提供することで、QuickVid はクリエイターがコンテンツのアウトプットを増やし、燃え尽き症候群のリスクを軽減するのに役立ちます」と Habib は TechCrunch の電子メール インタビューで語った。 「私たちの目標は、AI の進歩を活用して、お気に入りのクリエイターが視聴者の要求に対応できるようにすることです。」
しかし、QuickVid のようなツールは、使い方によっては、すでに混雑しているチャンネルにスパムや重複したコンテンツを氾濫させる恐れがあります。 また、コスト (月額 10 ドル) や原則のためにツールを使用しないことを選択したクリエイターからの反発に直面する可能性もありますが、AI によって生成された多数の新しいビデオと競合しなければならない可能性があります。
ビデオを追いかける
以前は Facebook Live およびビデオ インフラストラクチャの Meta で働いていた独学の開発者である Habib が数週間で構築した QuickVid は、12 月 27 日に開始されました。 1 月 — ただし、QuickVid は、キャプションやアバターなど、典型的な情報を提供する YouTube Short または TikTok ビデオを構成するコンポーネントを組み合わせることができます。
使い方は簡単です。 まず、ユーザーは、作成したいビデオの主題を説明するプロンプトを入力します。 QuickVid はプロンプトを使用してスクリプトを生成し、GPT-3 の生成テキスト機能を活用します。 スクリプトから自動的に抽出されたキーワードまたは手動で入力されたキーワードから、QuickVid はロイヤリティ フリーのストック メディア ライブラリ Pexels から背景動画を選択し、DALL-E 2 を使用してオーバーレイ画像を生成します。次に、Google Cloud のテキスト読み上げ API を介してナレーションを出力します。 — Habib は、ユーザーがすぐに自分の声を複製できるようになると述べています — これらすべての要素をビデオに結合する前に。
プロンプト「Cats」で作成されたこのビデオを参照してください。
またはこれ:
QuickVid は、ジェネレーティブ AI の可能性の限界を押し広げているわけではありません。 Meta と Google はどちらも、テキスト プロンプトがあれば完全にオリジナルのクリップを生成できる AI システムを紹介しています。 しかし、QuickVid は既存の AI を融合させて、B ロールの多い短編ビデオの繰り返しのテンプレート化された形式を活用し、フッテージ自体を生成しなければならないという問題を回避します。
「成功しているクリエーターは非常に質の高いバーを持っており、自分の声でないと思われるコンテンツを公開することに関心がありません」と Habib 氏は言います。 「これが私たちが注目しているユースケースです。」
そうだとすれば、QuickVid のビデオは一般的に、品質の点で賛否両論です。 バックグラウンド ビデオは、少しランダムであるか、トピックに接しているだけである傾向があります。これは、QuickVid が現在 Pexels カタログに限定されていることを考えると驚くことではありません。 一方、DALL-E 2 で生成された画像は、文字化けやプロポーションのずれなど、今日のテキストから画像への技術の限界を示しています。
私のフィードバックに応えて、Habib は、QuickVid は「毎日テストされ、いじられている」と述べました。
著作権の問題
Habib によると、QuickVid ユーザーは自分が作成したコンテンツを商業的に使用する権利を保持し、YouTube などのプラットフォームで収益化する許可を持っています。 しかし、AI によって生成されたコンテンツに関する著作権の状況は… 少なくとも現時点では曖昧です。 最近、米国特許商標庁 (USPTO) は 移動した AI が生成したコミックの著作権保護を取り消す。
USPTO の決定が QuickVid にどのように影響するかについて尋ねられたとき、Habib 氏は、それは AI によって生成された製品の「特許性」にのみ関係し、コンテンツを使用して収益化するクリエイターの権利には関係ないと考えていると述べました。 彼が指摘したように、クリエーターは動画の特許を提出することはあまりなく、通常はクリエーター経済に傾倒し、他のクリエーターがクリップを再利用して自分のリーチを拡大できるようにしています.
「クリエイターは、チャンネルの成長に役立つ高品質のコンテンツを自分の声で発信することに関心があります」と Habib 氏は言います。
差し迫ったもう 1 つの法的な問題は、QuickVid の DALL-E 2 統合に影響を与える可能性があります。ひいては、画像オーバーレイを生成するサイトの機能にも影響を与える可能性があります。 Microsoft、GitHub、OpenAI が 訴えられた コード生成システムである Copilot が、クレジットを提供せずにライセンス コードのセクションを逆流させることを許可したことで、著作権法に違反したとして彼らを告発する集団訴訟で。 (Copilot は、Microsoft が所有する OpenAI と GitHub によって共同開発されました。) この事例は、DALL-E 2 のようなジェネレーティブ アート AI に影響を与えます。同様に、DALL-E 2 は、トレーニングされたデータ セットからコピー アンド ペーストすることが判明しています (つまり、画像)。
Habib は心配していません。ジェネレーティブ AI の魔神は瓶から出たと主張しています。 「別の訴訟が起こり、OpenAI が明日姿を消した場合、QuickVid を強化できる代替手段がいくつかあります」と彼は、オープンソースの DALL-E 2 に似たシステム Stable Diffusion に言及して述べました。 QuickVid は、アバター画像を生成するための Stable Diffusion を既にテストしています。
モデレートとスパム
法的なジレンマは別として、QuickVid はすぐにモデレーションの問題を抱えているかもしれません。 OpenAI はそれらを防ぐためのフィルターと技術を実装していますが、ジェネレーティブ AI にはよく知られた毒性と事実の正確性の問題があります。 GPT-3スパウト 誤報、特に最近の出来事については、その知識ベースの境界を超えています。 そして、GPT-3 の微調整された子孫である ChatGPT は、 示した 性差別的で人種差別的な言葉を使うこと。
これは特に、QuickVid を使用して情報ビデオを作成する人にとっては気になることです。 簡単なテストで、パートナー (特にこの分野では私よりもはるかに創造的) に不快なプロンプトをいくつか入力して、QuickVid が生成するものを確認してもらいました。 QuickVid の功績として、「ユダヤ人の新世界秩序」や「9/11 陰謀論」などの明らかに問題のあるプロンプトは、有毒なスクリプトを生成しませんでした。 しかし、「学生を教化する批判的な人種理論」については、QuickVid は、批判的な人種理論が学童の洗脳に使用される可能性があることをほのめかすビデオを作成しました。
見る:
Habib 氏は、モデレーション作業のほとんどを OpenAI のフィルターに依存していると述べ、QuickVid によって作成されたすべてのビデオを手動で確認して、「すべてが法律の範囲内にある」ことを確認することはユーザーの義務であると主張しています。
「原則として、人々は自分自身を表現し、好きなコンテンツを作成できるべきだと思います」と Habib 氏は言います。
これには明らかにスパム コンテンツが含まれています。 Habib は、QuickVid ではなく、動画プラットフォームのアルゴリズムが動画の品質を判断するのに最適な位置にあり、低品質のコンテンツを作成する人は「自分の評判を傷つけているだけ」であると主張しています。 風評被害は、人々が QuickVid を使って大規模なスパム キャンペーンを作成する意欲を自然に失わせるだろう、と彼は言います。
「人々があなたの動画を見たくない場合、YouTube などのプラットフォームで配信を受けることはできません」と彼は付け加えました。 「低品質のコンテンツを作成すると、人々はあなたのチャンネルを否定的に見るようになります。」
しかし、2019 年に Grover と呼ばれる AI システムを使用してマーケティング資料のサイト全体を生成した Fractl のような広告代理店を見ることは有益です。 で インタビュー Fractl のパートナーである Kristin Tynski 氏は、The Verge で、ジェネレーティブ AI が「想像できるあらゆるニッチにまたがるコンピューター生成コンテンツの大規模な津波」を可能にすることを予見していると述べました。
いずれにせよ、TikTok や YouTube などのビデオ共有プラットフォームは、AI によって生成されたコンテンツを大規模にモデレートすることと戦う必要はありませんでした。 ディープフェイク — 既存の人物を他人の似顔絵に置き換える合成動画 — は、ディープフェイクの映像を簡単に作成できるツールによって、数年前に YouTube などのプラットフォームに導入され始めました。 しかし、今日の最も説得力のあるディープフェイクとは異なり、QuickVid が作成するビデオの種類は、明らかに AI によって生成されたものではありません。
AI が生成したテキストに関する Google 検索のポリシーは、ビデオ ドメインに何が来るかのプレビューかもしれません。 Google は、検索ランキングに関して、合成テキストを人間が作成したテキストと異なる方法で扱うことはありませんが、 行動する 「ユーザーの役に立たず、検索ランキングを操作することを意図した」コンテンツについて。 これには、「[doesn’t] 十分な価値を追加する」だけでなく、純粋に自動化されたプロセスを通じて生成されたコンテンツも、QuickVid に適用される可能性があります。
言い換えれば、AI によって生成された動画は、プラットフォームから完全に禁止されることはなく、単にビジネスを行うためのコストになる可能性があります。 それは、TikTok のようなプラットフォームが新しいホームになりつつあると信じている専門家の懸念を和らげることはできそうにありません。 誤解を招く しかし、ハビブがインタビューで述べたように、「ジェネレーティブ AI 革命を止めることはできません」。