ダメだは、AIを動画編集に実用化するスタートアップで、一般公開前からすでに需要を創出している。 Y Combinator が支援するこの会社は、AI を活用して YouTube コンテンツから短編ビデオを作成する自社製品を何百人ものビデオ クリエーターにテストさせています。 順番待ちリスト 発売前に20,000以上あるという。 Dumme の約束は、独自の AI モデルと既存の AI モデルの両方を組み合わせて使用することで、編集時間を節約できるだけでなく、より単純な仕事を任されることが多い契約 (人間) 労働者よりも優れた仕事ができることです。 YouTube ショート、TikTok、Instagram リールなどの短編プラットフォームで公開するために長編コンテンツをカットするなどのビデオ編集の仕事。
2022 年 1 月に設立され、スタートアップ アクセラレーター Y Combinator の 2022 年冬季プログラムに参加している Dumme の共同創設者兼 CEO メルワン・ドライ 彼は当初、ビデオ用の検索エンジンの構築に注力していたと述べました。 しかし約 6 か月前、開発チームは、ビデオ クリップを編集するために開発していたものと同じ AI モデルを再利用する方が、より良い製品になる可能性があることに気づきました。
共同創設者が参加 ウィル・ダールストロム (CPO)と ジョーダン・ブラナン (CTO) 全員が AI のバックグラウンドを持つ Drai 氏は、アプリがバイラルになってサーバーがクラッシュした後、Dumme が適切な製品市場に適合した可能性があることに気づきました。
「私たちはそれが大きな注目を集めるなどとはまったく期待していなかったので、ただ何かを世に出しただけです」とドライは説明します。 「その後、何が起こったのかというと、一晩中目が覚めるとサーバーが過負荷になっており、実際には何も機能していなかったということです。 そこで私たちはすべてを削除し、実際にある種の待機リストを作成しました」と彼は続けます。 「翌朝、目が覚めるとそこにはおそらく 5,000 人がいたでしょう。これは興味深いことでした。」
その後チームは、TikTok クリエイターが製品に関する短いビデオを投稿したことを発見し、そのビデオによりサイトに大量のトラフィックが送信されました。
「実際、それから気持ちが落ち着くことはありませんでした」とドライは言う。
「ダミー」と発音されるこの製品は、ビデオ編集に伴う作業の簡素化と高速化を目的としており、クリエイターにとって魅力的でした。
Dumme の使用は、名前が示すとおり簡単です。 まず、ユーザーが YouTube ビデオのリンクを貼り付け、「生成」をクリックすると、AI が取り込んだコンテンツのハイライトを紹介する短いビデオを多数出力します。 同社は、コンテンツのモデレーションを外部委託するために、生のビデオ映像をサポートするのではなく、ソースとして YouTube を使用していると述べています。つまり、YouTube で許可されている場合は、Dumme でも許可されています。
処理時間と結果として得られるクリップの数は、元のビデオの長さによって異なります。
しかし、一例として、1 時間のビデオ ポッドキャストの処理には約 20 分かかり、約 5 分後にクリップの受信が開始されるとドライ氏は言います。 完了すると、クリエイターはデフォルトで 60 秒未満のビデオ クリップをダウンロードし、YouTube ショートなどの短編コンテンツをサポートするプラットフォームだけでなく、リールや TikTok などの他のプラットフォームにアップロードできます。
もちろん、これがバックエンドでどのように機能するかは、はるかに複雑です。 同社によれば、最初は、Dumme はメタデータを介してソースビデオから可能な限り多くのことを学習するとのこと。 次に、ビデオを文字に起こし、話されている内容の意味を理解しようとすると同時に、フレームを見て話している人の感情を解読しようとします。 これらの結果は相互に関連付けられ、ビデオのどの部分がクリッピングに値するかを判断する言語モデルに渡されます。 その後、アクティブなスピーカーを追跡し、トリミングを処理する別のモデルに引き渡されます。
Dumme 氏によると、GPT-4 や Whisper の微調整バージョンなどの既存の AI モデルや、ビデオ フレーム内でアクティブな発言者を追跡するモデルなど、社内で構築したその他のモデルと連携しているとのことです。 そのモデルの 1 つは、視聴者を引き込むための優れたオープニング フックとは何かを学習するために、多数の YouTube ショートでもトレーニングされています。また、まだ公開されていませんが、チームはオープンソース モデルも実験中です。 ラヴィラ ビデオのコンテキストをより深く理解するために Facebook Research から提供されました。
AI の作業は GPU クラウド プロバイダーで行われます コアウィーブAWS ではなく、より手頃な価格であるため、と同社は述べています。
Dumme は話し言葉を処理する AI に依存しているため、この技術は長いゲームプレイ ビデオなど、人々が話していないものには適していません。 ドライ氏によると、このスタートアップは当初、YouTube クリエイター、ポッドキャスター、代理店をターゲットにしているが、後者が製品を収益化する最善の策であると彼らは信じているという。
ドライ氏の説明によると、代理店は今日、この種の作業を外部委託することが多く、結果は行き当たりばったりです。
「彼らは、独自のコンテンツを編集するために、安価な管轄区域の請負業者にお金を払っているだけです。 そして問題は、実際にはまだかなり高価で、時間がかかることです。数分ではなく、数週間かかります」と彼は言います。
実際に人々を失業させるテクノロジーを開発することについてどう思うか尋ねられたところ、ドライ氏は心配していなかった。
「私の考え方としては、最終的には…これは数学教師がこうするつもりだと言っているようなものだと思います」 [be put] 電卓というものがあるから仕事がなくなる…」と彼は説明する。 「人々は順応していきます。 それから、電卓について教える人もいるでしょう? したがって、これに適応するだけの問題だと思います」とドライは言います。
現在検討されている価格設定には、企業が動画処理 1 分あたり 0.40 ドルを支払う段階が含まれていますが、小規模クリエイターは代わりに、月あたり 10 時間のコンテンツを上限とする月額サブスクリプションを選択することもできます。 (これらの数値は変更される可能性があります。) テスト中、製品は無料で使用できました。
初期のユーザーは、ビデオ ポッドキャストからクリップを生成してショート動画に公開したり、他の新しいビデオをカットしてバック カタログを調べたりするなど、さまざまな編集に Dumme を使用してきました。
この製品は、開発会社 Jellysmack の製品を含む、市場の他の AI テクノロジーと競争力があるようです。 活用する AI は、長い YouTube 動画をカットし、サイズ変更し、特定のプラットフォーム向けに最適化することで、短い動画に変換します。これは 2021 Kamua の成果です 取得。 同様の作業を行う他のツールには、次のようなものがあります。 Vidyo.ai、 詳細、 チューブバディ、 ワイズカット その他。 Dumme がどの程度成功するか失敗するかは、仕事の質とコストの点で競合他社を上回るかどうかにかかっていますが、その指標はまだ決まっていません。
しかし、投資家の中にはDummeに賭けている人もいる。 立ち上げに先立ち、このスタートアップはY Combinator、Caffeinated Capital、Max and Nellie Levchin (SciFi VC経由)、Suhail Doshi、Nico Chinot、Protocol Labs、Chris Puscasiu、その他のエンジェルから340万ドルのシードラウンドを調達した。
関心とかなりの待機リストを考慮して、ダンメ氏は毎週約 500 人の採用を目標にしていると述べています。 TechCrunch読者は招待コードを使用して列をジャンプできます テッククランチ スロットがなくなるまで。