イスラエルのAI企業 やりましたDeep Nostalgia などのプロジェクトにテクノロジーを提供した がローンチされます 新しいプラットフォーム ユーザーは単一の画像とテキストをアップロードしてビデオを生成できます。 この新しいサイトと呼ばれる クリエイティブ リアリティ プラットフォーム、同社は、企業のトレーニングと教育、企業からの内部および外部のコミュニケーション、製品マーケティングと販売などのセクターをターゲットにしています。
プラットフォームの使い方は非常に簡単です。ユーザーは、プレゼンターの画像をアップロードするか、事前に作成されたプレゼンターから 1 つを選択して、ビデオ作成プロセスを開始できます。 有料ユーザーは、デフォルトよりも表情や手の動きが優れているため、より「表現力豊かな」プレミアム プレゼンターにアクセスできます。 その後、ユーザーはスクリプトからテキストを入力するか、誰かのスピーチのオーディオ クリップをアップロードするだけです。 ユーザーは、言語 (プラットフォームは 119 の言語をサポート)、声、陽気な、悲しい、興奮する、フレンドリーなどのスタイルを選択できます。
同社の AI ベースのアルゴリズムは、これらのパラメーターに基づいてビデオを生成します。 その後、ユーザーはビデオをどこにでも配信できます。 同社は、アルゴリズムがクリップを生成するのにビデオの長さの半分しかかからないと主張していますが、私たちのテストでは、1 分間のビデオを生成するのに数分かかりました. これは、選択したプレゼンターのタイプと言語によって異なる場合があります。
「COVID-19 のパンデミックにより、世界中でデジタル コンテンツのニーズが加速しています。 組織にとって大きな問題は、教育コンテンツの作成です。 ドキュメントを読んだり、プレゼンテーションを行ったりすることは、退屈で退屈な場合があります。 さらに、俳優を雇ったり、教育用ビデオを作成したりするために、何千ドルも費やす必要があります。 そのため、AI を使用してプレゼンターとチューターを作成し、人間を再現し、コンテンツをより魅力的で効果的なものにしています」と、D-ID の CEO である Gill Perry 氏は TechCrunch のインタビューで語っています。
Perry は、CEO から従業員への多言語メッセージから、組織のユーザーへのパーソナライズされた願いまで、このテクノロジの多くの使用例を指摘しました。
D-ID は、一般公開前にバグを解決するために、8 月中旬にテスト用のスタジオを立ち上げました。 そして、その主な焦点はあらゆる規模の企業に対応することですが、同社は 多くの関心 クリエイターから プラットフォームで。
不快なディープフェイク動画の作成は危険です。 そのため、イスラエルの会社は、悪口や人種差別的な発言のフィルタリングや、有名人の顔の使用を避けるための画像認識などのガードレールを設置しました。 それは Microsoft Azure テキスト モデレート API ビデオスクリプトから性的な発言や攻撃的な言葉を取り除く。 D-ID によると、プラットフォームの使用条件では、ユーザーが政治的な動画を作成することは禁止されています。 これらの規則に違反した場合、会社は違反者のアカウントを停止し、ビデオをライブラリから削除することができます。
D-ID は 3 月に Macquarie Capital が主導したシリーズ B 資金調達で 2,500 万ドルを調達し、これまでに合計 4,700 万ドルを調達しました。 これまで、同社は自社の API を使用してコンテンツを作成する他社に依存していました。Deep Nostalgia はその典型的な例で、Modelez、Warner Bros.、インドを拠点とするショート ビデオ アプリの Josh などのクライアントがいます。 現在、同社は、このセルフサービス プラットフォームと共に PowerPoint プラグインを立ち上げることで、収益を生み出す製品を拡大しています。 プラグインはインタラクティブなプレゼンターをデッキに追加するので、ユーザーはスライドを読み上げるだけでは済みません。 セルフサービス プラットフォームと同様に、さまざまなアバター、声、言語から選択できます。 しかし、現時点では、カスタム プレゼンターを用意する規定はありません。
開始時に、ユーザーは 14 日間の試用アカウントに無料でサインアップし、AI によって生成された 720p ビデオを最大 5 分間作成できます。 その後、月額 49 ドルを支払うと、AI が生成した 15 分間のフル HD ビデオ、PowerPoint プラグイン、メール サポートにアクセスできます。
ユーザーは、自分のオーディオ クリップをアップロードして、ボイス クローンを作成することもできます。 さらに、同社は、ユーザーが自分の映像をアップロードして、AI をより表現力豊かに訓練し、ビデオの人物をよりよく模倣できるようにするツールの開発に取り組んでいます。 これらの機能はすべて、会社のエンタープライズ層に限定されます。
同社は Rephrase.ai や ソウルマシーンズ AI 生成ビデオの分野では、単一の画像から高品質のビデオを生成すると主張している企業はほとんどないと主張しています。
ペリー氏は、D-ID は企業研修、コミュニケーション、マーケティング ビデオに限定することを目指していないと述べました。 また、リアルタイムのビデオ通話の翻訳とプレゼンターのクローンを容易にするという野心も持っています。これにより、オーディオを口述している間、ユーザーの代わりにアバターがビデオに表示されます。
同社はまた、web3/メタバース開発の主要プレーヤーになることも検討しています。 「私たちは単一の画像からビデオを生成する専門知識を持っています。 メタバース用のデジタル アバターを作成する方法を考えています」と Perry 氏は述べています。