Microsoft と Google は、どちらの AI チャットボットが優れているかを争っていますが、機械学習と言語モデルの用途はそれだけではありません。 今年の年次 I/O イベントで人工知能を搭載した 20 以上の製品を披露するという噂の計画に加えて、Google は 1,000 の異なる言語をサポートする AI 言語モデルを構築するという目標に向かって進んでいます。 の 月曜日に投稿された更新、Google はユニバーサル スピーチ モデル (USM) に関する詳細情報を共有しました。
昨年 11 月、同社は、世界で最も話されている 1,000 の言語をサポートする言語モデルを作成する計画を発表し、USM モデルも明らかにしました。 Google は、USM を「最先端の音声モデルのファミリー」と表現しており、300 を超える言語で 1,200 万時間の音声と 280 億の文でトレーニングされた 20 億のパラメーターを備えています。
YouTube が既にクローズド キャプションの生成に使用している USM は、自動音声認識 (ASR) もサポートしています。 これにより、英語、北京語、アムハラ語、セブアノ語、アッサム語などの言語が自動的に検出され、翻訳されます。