ベンジ・エドワーズ / アルステクニカ:
マイクロソフトは、英語の音声データでトレーニングされ、3 秒間のサンプル オーディオで人の声をシミュレートできるテキスト読み上げ AI モデル VALL-E を発表しました。— テキスト読み上げモデルは、話者の感情的なトーンと音響環境を維持できます。 — 木曜日に、マイクロソフトの研究者は発表しました…
ベンジ・エドワーズ / アルステクニカ:
マイクロソフトは、英語の音声データでトレーニングされ、3 秒間のサンプル オーディオで人の声をシミュレートできるテキスト読み上げ AI モデル VALL-E を発表しました。— テキスト読み上げモデルは、話者の感情的なトーンと音響環境を維持できます。 — 木曜日に、マイクロソフトの研究者は発表しました…