合成音声技術のスタートアップ マーフ 文字通り、あらゆる規模のコンテンツ クリエーターに声を与えます。 現在、20 言語にわたる 120 を超える人間と同等の AI 音声のライブラリを持つ Murf は、Matrix パートナーが主導するシリーズ A で 1,000 万ドルの資金を調達したことを本日発表しました。 参加者は、リピーターの Elevation Funds と、Ola の創設者である Ankit Bhai のようないくつかの著名なエンジェル投資家からのものでした。 ディズニー ストリーミング製品のシニア バイス プレジデント。 マッド・ストリート・ダップの創始者、アシュウィニ・アソカン。 Drip Capital の創設者である Pushkar Mukewar 氏
2020 年 10 月に IIT-Kharagpur の学校の友人である Sneha Roy、Ankur Edkie、Divyanshu Pandey によって設立された Murf の以前の資金調達発表は、Elevation Cash とエンジェル投資家が主導する 150 万ドルのシードであり、才能の採用、製品イノベーション、ユーザー獲得への投資を支援しました。 Murf 氏によると、シード ラウンド以降、ARR は 26 倍に成長し、さまざまな話し方やトーンで 100 万件以上のボイスオーバー プロジェクトを合成しました。
マーフのテクノロジーがどのように使用されたかの例としては、AI アート モデル、ディープ フェイク プログラム、マーフ スタジオの AI ボイスを使用して映画全体を作成するテクノロジー起業家およびアーティストが挙げられます。 マーフの声のコレクションを使用してテレビ シリーズを作成したエンターテイメント アニメーション エージェンシー。 マーフの AI の声でファンタジー フィクションのオーディオブックを作成する著者。 また、マーフの AI 音声を使用してラップ ビデオを作成した YouTube インフルエンサーもいます。
Murf の CEO である Edkie 氏は、TechCrunch に、Murf の創設チームは過去にさまざまな分野で働いていたにもかかわらず、高品質のボイスオーバーを作成するという問題に直面したと語った. これには、製品デモの作成と更新、ラジオおよびビデオ広告の録音が含まれます。 彼は、パンデミックが「マルチメディアの作成を後押しし、スケーラブルなオーディオ コンテンツの需要が急速に高まっていた」と付け加えました。
Murf のクライアントは、広告、オーディオブック、説明ビデオ、e ラーニングなど、さまざまな方法でそれを使用しています。 その SaaS プラットフォームである Murf.ai は、クライアントがあらゆる商用目的で高品質で自然な音声のナレーションを簡単に作成できるようにするために開発されました。 同社のクライアントは、個人のコンテンツ クリエーターから SMBS や企業までさまざまな規模で、教育、企業、ヘルスケア、メディアとエンターテイメント、マーケティング、広告、ポッドキャスティング、カスタマー サポートなどの分野で働いています。
Edkie 氏は TechCrunch に対し、コンテンツ クリエーターやマーケティング チームはしばしばナレーションを自分で録音したり、プロセス全体を外部委託したりしていますが、どちらも「面倒で、費用がかかり、時間がかかる」ものです。 一方、マーフでは、ユーザーは録音機器を購入したり、声優を雇ったりすることなく、「人間のような」ナレーションを生成できます。
同社はまた、テキスト読み上げでできることの制限を取り除きたいと考えています。 「TTS はかなり前から存在していましたが、音声品質の制限により使用が制限されていました。 最近の AI とディープ ラーニングの進歩を活用することで、人間の発話の自然な韻律と発音を模倣した忠実度の高い合成音声を作成できるようになります。」
マーフのプラットフォームには AI 対応の SaaS ツールが含まれており、ユーザーは複雑で高価な録音機器を調達したり、声優を雇ったりすることなく、通常はビデオやプレゼンテーションで使用する「人間のような」声を生成できます。 コンテンツ作成者は、オンラインの音声録音ブースを使用して、さまざまな話し方を試すことができます。 マーフ氏は、アフリカ系アメリカ人、イギリス人、オーストラリア人など、さまざまな訛りの声を含めることで、従来のテキストから音声へのプラットフォームにおける多様性のギャップを埋めたいと考えています。
Murf の創設者が使用した市場レポートによると、世界のテキスト音声市場は 2028 年までに 70 億 6000 万ドルに達し、14.6% の CAG で成長すると予想されています。 一方、ナレーションと吹き替えの市場は、2027 年までに年間合計 80 億ドルを生み出すと予測されています。
テキスト読み上げは何年も前から存在していましたが、品質上の制限により、主に音声アシスタントやチャット ボットによって使用されていました。 しかし、最近の AI とディープ ラーニングの発展により、人間の発話の韻律と発音を持つ合成音声を作成できるようになりました。 Murf の AI エンジンは、実際の人間の音声で何時間にもわたってトレーニングされており、Murf Studios は、20 の言語で話すことができる 120 以上の人間のさまざまな AI 音声を提供しています。 マーフはまた、声優と提携して、アフリカ系アメリカ人、イギリス人、オーストラリア人英語などの声を海外に持ち込むことで、より多様なアクセントをもたらすことに取り組んでいます.
Murf の AI を利用したテキスト読み上げは、コンテキスト情報から学習して適切な応答を返すこともできます。 創設者は、Murf を、ユーザーが画像、ビデオ、BGM を追加できるようにする「オールインワン ボイス ソリューション」と表現しています。 また、国際音声記号 (IPA) を使用した発音、ユーザーのピッチ、一時停止、強調、速度を変更する音声カスタマイズ機能も備えています。
Murf は、サービスのサブスクリプション プランを通じて収益を上げています。 2021 年 1 月にベータ テストを終了し、過去 18 か月間で ARR が 22 倍に成長し、現在までに 100 万を超えるボイスオーバー プロジェクトが合成されています。
Edkie 氏によると、Murf の主な競合相手は、市場で有数のテキスト読み上げプラットフォームを持っている Google、Amazon、Polly、Microsoft などの大手テクノロジー企業やクラウド企業です。 Murf は、複数のアクセントとスタイルをサポートする自然な AI 音声で際立っています。
「私たちのプラットフォームは、単純なテキスト読み上げツールを超えて、ユーザーが画像、ビデオ、プレゼンテーションを追加し、ナレーションにバックグラウンド ミュージックを含め、それらを完全に同期して魅力的なコンテンツを作成する機能を提供します」と Edkie 氏は述べています。 マーフの AI を活用した TTS は、大量のコンテキスト情報から学習して、コンテキスト スピーチを作成することもできます。 たとえば、数値、通貨、パーセンテージ、住所、日付、時刻などの一般的に使用されるエンティティ形式を認識できる組み込みのコンテキスト認識があり、それらのランダム性を減らし、定義済みの標準に近づけることができます、と Edkie 氏は付け加えました。
Elevation Capital の共同管理パートナーである Mukul Arora 氏は、準備された声明の中で、次のように述べています。 優れた創業チームと独自の IP を持つ Murf は、この分野で主導的な地位を獲得する態勢が整っています。 彼らの実行力と技術第一主義は、これまでに実証してきた確固たる牽引力と成長に表れています。 マーフとのパートナーシップを倍増できることを本当に嬉しく思います。」