ジェネレーティブ AI が突如としてあらゆる場所に出現。 この 1 年間、OpenAI や Stability AI などのグループによって導入されたテキストから画像へのアルゴリズムの進歩のおかげで、AI によって生成された印象的なアートワークを展示する人々を見たことがあるでしょう。 スタートアップの急増は現在、この新しいクラスの言語モデルのアプリケーションを考案しようとしています。この言語モデルでは、単純な人間の入力に基づいてマシンが新しいテキスト、画像、およびビデオを作成できます。
それらの1つは モビオは、ジェネレーティブ AI と GAN などの他の機械学習フレームワークを活用して、話す人間のアバターをフィーチャーしたビデオを作成する 2 年前のスタートアップです。 このプラットフォームは、Canva スタイルのドラッグ アンド ドロップ インターフェイスを備えたマーケターを狙っています。 ユーザーはまず、ショッピング サイトのテーマや日本への旅行のテーマなど、さまざまなテンプレートから選択します。 次に、ハイパーリアリスティックなアバターを動画の「代弁者」として追加し、テキスト入力によって音声を生成します。 AI人間の衣装、顔、声をワンクリックで入れ替えることができます。
現在、Movio のユーザー ベースは数十万人弱で、有料顧客は 1,000 人近くに達しています。 IDG、Sequoia Capital China、最近では Baidu Ventures などの投資家から、これまでに約 900 万ドルの資金を調達しています。 Xu は、2 人がカーネギー メロン大学で勉強していたときに、ByteDance と音楽ソーシャル ネットワーク Smule のベテランである共同設立者で CFO の Liang Wang に会いました。
昨年、シュールリアルと呼ばれていた Movio がどのようにしてディープフェイクの素晴らしいユースケースを獲得したかを取り上げました。 当時、同社は深センに本拠を置いていました。このハードウェアは、活気に満ちた輸出主導の電子商取引産業でも知られています。Amazon の売り手のほとんどは大都市出身です。 マーチャントは、Movio を使用して合成人間がナレーションを付けたプロモーション ビデオを作成し、実際のモデルを雇う必要をなくしていました。
Movio は最近、共同創設者兼 CEO であるロサンゼルスに引っ越しました。 ジョシュ・シュー 以前は Snap エンジニアとして 6 年間働いていました。 それは、このスタートアップが、仕事を支援するために AI ツールを使い始めようとしているマーケターの波を捉えたいと考えているからです。
「私たちは Jasper と Copy.ai と同じようにビデオ制作を行っています」と Xu は TechCrunch に語り、今日のトップ AI コンテンツ ヘルパーの 2 つに言及しました。 「動画は強力です。マーケティング担当者がプレーン テキストではなく人間のアバターを使ってメールを送信できるとしたら、想像してみてください。」
Movio は今のところトーキング ヘッドを合成することしかできませんが、そのアルゴリズムが全身の動きを生成できる未来に向かって取り組んでおり、これにより同社は「オールインワンの AI ビデオ制作プラットフォーム」という目標に近づくことができます。 」
Xu 氏によると、このスタートアップは、ユーザーが送信したスクリプトと相関するビデオの長さに応じてユーザーに料金を請求し、カスタマイズされた顔を使用する人にはプレミアム料金を請求します。 Movio はサードパーティの Web サイトにも API を公開しており、その中にはそのエンジンを使用してポップアップ カスタマー サポート アバターを作成しているサイトもあります。
「AI によって生成されたビデオは、AIGC 内の小さなセグメントにすぎません。 [AI generated content] 業界。 私たちは、テキストから画像への変換がどれだけできるかを見てきました。テキストからビデオへの変換は、準備が整ったときにさらに大きな混乱をもたらすことを期待しています」と Xu 氏は述べています。