開発者は、Apple の Siri 音声アシスタントを強化し、はるかに会話的な音声コマンドを許可しようとする GPT-3 デモをまとめました。 で Redditに投稿されたビデオ、開発者の Mate Marschalko は、アシスタントが HomeKit スマート ホーム デバイスを制御し、Siri のような今日の音声アシスタントが通常理解するのに苦労する比較的あいまいなプロンプトに応答してクエリに応答する様子を示しています。
たとえば、AI は音声プロンプトに応答して Marschalko のライトをオンにすることが示されています。 ビデオの後半で、マルシャルコはアシスタントに寝室を「よく眠れる」温度に設定するように依頼し、アシスタントは寝室のサーモスタットを摂氏 19 度に設定して応答します。
「オフィスの暗闇でこのビデオを録画していることに今気づきました。何かできることはありますか?」
で 付随するブログ投稿、Marschalko がデモのしくみを説明します。 基本的に、彼は Apple の Shortcuts アプリを使用して、Siri、GPT-3、および HomeKit 対応のスマート ホーム デバイス間のインターフェイスをとっています。 Siri への音声コマンドにより、Shortcuts は長いプロンプトを AI サービスに送信し、機械可読形式での応答を要求します。 応答を取得すると、Shortcuts はそれを解析してスマート ホーム デバイスを制御したり、Siri 経由で応答したりします。 の ブログ投稿 完全な説明については、全体を読む価値があります。
これは興味深いデモであり、この新世代の AI テクノロジを統合することで音声アシスタントに何ができるかを示していますが、完全ではありません。 まず第一に、GPT-3 に送信される API リクエストごとに、各コマンドのコストが 0.014 ドルであると Marschalko 氏は述べています。 ビデオも編集されているため、デモが 100% 正常に機能するのか、それとも応答が選択的に表示されているのかは不明です。 音声認識ソフトウェアがそもそもユーザーが何を言っているのか理解できない場合、よりインテリジェントなバックエンドも役に立ちません。
このデモでは、音声アシスタントをどのように機能させたいかについて、より大きな疑問が生じます。 音声アシスタントと本当に会話したいですか、それともロボットのように制御するための短くて簡単なコマンドを吠えたいだけですか? マルシャルコ自身も、アシスタントが「予想外のこと」を言うリスクを上げています。 Redditのコメントをフォローアップ:
それにもかかわらず、このデモは、Apple、Amazon、Google などがこの技術を自社のサービスに統合した場合、どのような種類の音声アシスタントの相互作用がすぐに可能になるかについての興味深いヒントを提供します. そして、これらのツールがオープンで親しみやすいので、このような比較的洗練されたデモを、広く入手可能な消費者向けソフトウェアを使用して一緒にハッキングできることは印象的です。