合成音声は、最近ではディープフェイクやその他の AI による欺瞞と組み合わせると恐ろしいオブジェクトになる可能性がありますが、自分で話すことができなくなった人にとって不可欠なツールでもあります。 Acapela Group は、これらの人々を真摯に念頭に置き、新しい 「自分の声」 誰でもできるサービス AI 音声プロファイルをトレーニングする 無料で。
Acapela は約 25 年間、テキスト読み上げの分野に携わっており、最近、テクノロジ アクセシビリティの巨人である Tobii Dynavox に買収されましたが、現在も独立して運営されています。
多くの業界と同様に、アクセシビリティは、消費者規模の機械学習プロセスの出現によって大きな影響を受けてきました。 7 ~ 8 年前、Acapela の共同設立者である Remy Cadic 氏は、合成音声を自分用にカスタマイズするのは面倒だっただけでなく、結果もあまり良くなかったと回想しました。
「非常に時間がかかりました。患者は 8 時間のトレーニングをしなければなりませんでした。 これで、録音された 50 のセンテンスだけで声をバンクできます。 約 10 分かかり、翌日には音声の準備が整います」と彼は言いました。 「間違いなく、ニューラル テキスト読み上げ技術で革命が起こっています。」
彼らはそれがどれほど迅速で簡単であるかについて冗談を言っていませんでした.私は自分自身で新しい「自分の声」プロセスを経験しました.それは実際には小説やレシピ本のコーパスから引き出された50の短い文章でした. 、および記事。 録音インターフェースはシンプルでナビゲートしやすく、確かに、1日かそこら後に私の声を使用する準備が整いました. 品質は良好です — 一部のモデルのように不気味ではありませんが、(宣伝されているように) 明らかに自分の声であり、デモ ページで投げかけた文を処理できます。
これで必要になった場合は、有料でダウンロードして、互換性のある音声生成システムで使用できます。 明らかに、これには Tobii Dynavox の TD Talk とデバイスが含まれます。 会社 先週新作を出したばかり、実際、これらのものはかなり洗練されています。
そして、それがすべての本当のポイントです。これは、ニューラル音声技術の力の技術的なデモンストレーションでも、誰でもクローンする有名人の声をフィードできるデモでもありません. これは、自分の声を維持したい場合、最近まで選択肢がなかったか、せいぜい困難で複雑なプロセスしかなかった人々のために特別に作成されたツールです。
退行性疾患、癌、または特定の処置に直面している多くの人は、数か月または数年以内にうまく話すことができなくなるか、まったく話せなくなる可能性があることを知っています. 彼らの声を銀行に預けるプロセスをできるだけ簡単にすることは、多くの人が高く評価するサービスです.
「大きな利点の 1 つは、子供向けにもカスタマイズできることです。録音スクリプトを読みやすくし、システムを調整して、子供の合成音声の品質を向上させました。 私たちは世界で初めてそれを行い、今もこの方向に向かっています」と Cadic 氏は述べています。
バンクされた声を録音して再録音したり人工的に老化させたりすることは、新しく挑戦的な機能ですが、結果を得ているようです:
最新のニューラル処理チップを搭載していないオフライン デバイスとの互換性も重要な差別化要因です。 「声を簡単に作成できるオンライン ソリューションがありますが、それはクラウド経由でしか利用できず、実用的ではありません」と彼は言いました。
同社はまた、トレーニング プロセスにおける多様性と思慮深さが、他の AI アプリケーションと同様に重要であることにも気付きました。 Cadic 氏が指摘する超高速トレーニング テクニックの問題は、「ユーザーに最も近いトレーニング マテリアル内のスピーカーを見つけようとするだけです。 でも、元の声に近いトレーニングのスピーカーがいないと、元の声のようには聞こえません。」
Acapela プロダクト マネージャーの Nicolas Mazars 氏は、不十分なトレーニング データに根ざした多くの AI の問題と同様に、この問題も均等に分散されていないと付け加えました。アフリカ系アメリカ人か、英語が苦手か。 私たちは 23 の言語で仕事をしており、多くの障害を持つユーザーがいます。 私たちはユーザーからのフィードバックを頼りに、彼らのために何かを開発しようとしています。」
レコーディングとバンキングのプロセスは無料です。 ここでアカウントにサインアップできます 数分で自分の合成音声をトレーニングできます。 デバイスにダウンロードしてインストールする場合にのみ料金が発生します。