今日では、Alexa に照明をつけたり、Siri に寝室の温度を教えてもらったりすることができます。 または、あなたが聞くかもしれません、 「lights という名前のデバイスが 15 個あります。 どちらを支配したいですか?」 また 「カトマンズの現在の気温は 53 度です。」 しかし、音声アシスタントが常に正確であるだけでなく、次のようなあいまいなコメントにも応答できるとしたらどうでしょうか。 リラックスする良い方法は何ですか?」 「インテリジェントな」応答で? たとえば、シェードを下げたり、照明を暗くしたり、サーモスタットを調整したり、Netflix でグッズをキューに入れたりしますか?
これが、新しい AI 言語モデルを搭載した音声アシスタントの可能性です。 Josh.ai ホーム オートメーション システム. Josh.ai はすでに開始されています プロトタイプの統合に取り組んでいます OpenAI の ChatGPT を使用します。 この概念実証ビデオ カペセラトロがジョシュのアシスタントにシェードを開け、音楽を消し、天気を教えてくれるように頼んでいるところを示しています (一度に 3 つのことを制御することは、ジョシュが既に持っている機能です)。 その後、彼はスマート ホームに対してより自然な音声コマンドを使用します。 ここはちょっと暗いです」と言うと、音声アシスタントは部屋の照明を上げて、少し不器用に応答します。
AI 言語モデルを使用して自然言語を解析することで、スマート ホーム制御を改善できる可能性は、非常に興味深いものです。 カペセラトロはそれが未来だと考えています。 「私たちは、より自然で直感的な方法で環境を制御する上で、どれだけうまくいくかを理解しようとしています」と彼は言います.
今日、音声アシスタントは通常、正確な言語を必要とし、基本的なスマート ホーム コマンドと情報の要求を混同することが多く、イライラしたり、役に立たない応答をしたりすることがあります。 これは、Capecelatro と Tim Gill (クォークの創始者) は 2015 年に会社を設立しました。その名を冠した音声アシスタントは、要求の言い回しに関係なく、接続されたガジェットを優れた方法で制御することを目指しています。
「ChatGPT のような技術を採用しなければ、私のようなビジネスは 1 年以内に存在しなくなります。 これは、家庭で音声制御を行う人の将来にとって重要です。」
Josh は広範なナレッジ グラフ モデルを使用して、「照明をつけて」ではなく「衛星」を聞いたときに解析し、適切な処理を実行できます。 「ドレープを開けて」というと「ブドウを手に入れて」のように聞こえるかもしれませんが、ジョシュはあなたがブドウ園に住んでいないことを知っているほど頭がいいのです。 「私たちは、聞き間違いを修正したり、さまざまなアクセントを使用したり、不完全な文章を理解したりするために、ボンネットの下で多くの時間を費やしています。そのため、「ひどいライトをつけて」と言ったとしても、私たちはあなたが何を意味するかを知っています」とケープセラトロは言います.
現在、Josh は カスタム スマート ホーム インストールの音声制御レイヤー Crestron や Control4 などを搭載しています。 システムがセットアップされ、プロのインストーラーによって大部分が制御され、使用されている、より保護された環境で Josh.ai 独自のハードウェア、ジョシュは、より信頼性が高く、よりプライベートな音声アシスタントであるという評判を築いてきましたが、エントリーコストは高くなります. (Josh にはクラウド コンポーネントがありますが、リクエストの大部分はローカルで処理されます。 ジョシュ・コアであり、クラウドベースの API を使用すると、識別可能な情報が取り除かれます、と Capecelatro は言います)。
同社は、最近 アマゾンとの提携を発表は、ChatGPT やその他のチャットボットで使用される新世代の大規模言語モデル (LLM) に大きく賭けています。 Capecelatro は、これらのシステムが今日の音声アシスタントをより便利なものに変えると信じています。 「今から 1 年後には、Alexa、Google、Siri、さらには Josh が操作していた古い方法を容認する人は誰もいないでしょう。 それだけでは十分ではありません」とCapecelatro氏は言います。 「ChatGPT のような技術を採用しなければ、私のようなビジネスは 1 年以内に存在しなくなります。 これは、家庭で音声制御を行う人の将来にとって重要です。」
競合他社のように一般的な知識の深さを持たない Josh.ai にとって、ChatGPT 統合によって音声アシスタントに追加される知識ベースは、大きな前進です。 「ジョシュを可能な限り賢くしたいと常に考えていましたが、私たちは小さなチームです」とケープセラトロは言います。
しかし、一般的なスマート ホームでは、AI 言語モデルの会話能力とホーム オートメーション システムが提供できるコンテキストを組み合わせることが有望です。 たとえば、自宅にあるスマート デバイスとその使用方法の詳細を把握することで、Josh は自然言語コマンドを解析して自宅でのアクションに変換できます。 次のように言います。 すべての準備が整っていることを確認できますか?」 音声アシスタントは、玄関の照明をつけたり、オーブンの予熱を開始したり、シェードを下げたり、キッチンの照明をつけたりすることができます。
Josh は、スマート ホームでのメディア検出に ChatGPT を使用する作業も行っています。 これまでミッシングリンクだった何か。 「自分が何をしたいのかわからない場合、音声コントロールは理想的ではありません」とケープセラトロは言います。 「視聴したいコンテンツを閲覧するために使用できる Ava リモートとの統合を構築しました。 ChatGPT をミックスに追加することで、「ロマンティック コメディやフィーチャー (この) 俳優など、Netflix で本当に優れた番組は何ですか?」と言うことができます。 ChatGPT はリストを作成し、リモコンの画面に表示できます。」 それでは、家族向けの映画の夜です。
Josh の AI アップグレードはまだ公開されておらず、Capecelatro は、この分野で急成長している他の企業がより良いモデルを提供できる場合に備えて、その技術を注意深く監視していると述べています。 ChatGPT が現在非常に遅いことに加えて (動画は高速化するために編集されています)、AI 生成に関する非常に現実的な問題があります。 (そして、ChatGPT がトレーニングされたデータセットは 2021 年半ばに終了するという事実。注目に値するのは、Josh が「Netflix で見るべき番組は何ですか」と尋ねられたときのデモ ビデオで、リストされている最新の番組が 2019 年にデビューしたことです。 .) しかし、カペセラトロは言います いくつかの ジェネレーティブ AI 音声アシスタントの形がスマート ホームにやってくる。
注意が必要です。 人種差別的で同性愛嫌悪の殺人音声アシスタントが、ハードウェアを通じて人々の家に「意見」を吐き出すことを望んでいる企業はありません。ジェネレーティブ AI が本質的にフィルターなしでコンテンツを逆流している例を考えると、明確な可能性があります。 「私たちは非常に慎重です。 ChatGPT との統合をすぐに開始できたはずです」と Capecelatro 氏は言います。 「私たちはそうしていません。 本当に悪いデータを人々に提供したくないからです。 私たちは嘘をつきたくありません。」
Google、Apple、Amazon のすべてが、新しい AI 言語モデルを音声アシスタントに組み込む方法を検討していると考えるのは簡単なことではありません。
同社は、適切なガードレールを配置する方法を見つけるために時間をかけて計画しています。これは、この技術がスマートホームに変換されるために不可欠です. 「Microsoft と Google は少し飛び上がったと思います。 [with their search ChatBot models]、そして彼らは今、その結果を目の当たりにしています」と、最近の注目を集めた打ち上げが急速に横ばいになったことについて、ケープセラトロは言います。
Google、Apple、Amazon のすべてが新しい AI 言語モデルを音声アシスタントに組み込む方法を検討していると仮定するのは簡単ではありません (Microsoft が Cortana を復活させるかもしれません)。 ChatGPT をスマート ホームに導入するための Siri ショートカット。 Web ブラウザーに入力するよりも、スマート スピーカーに話しかける方がはるかに簡単です。
しかし、私たちは本当にこの種の人工知能を家庭に求めているのでしょうか? 8 歳の子供に量子物理学を教えようとするかもしれない音声アシスタントがあれば、「そのまま使える」音声アシスタントに対する私たちの欲求は非常に大きいのでしょうか? 個人的には、信頼できる音声制御のスマート ホーム システムで、「なんてこった照明を消して」と言ったときに私が何を意味するかを理解することが、ここでの聖杯だと思います。私の家を動かしている全知の知性ではありません。
本質的に有能で非常に直感的な音声アシスタント (自宅用の完璧な執事) の可能性は非常に魅力的ですが、現実はそれ以上になる可能性があるのではないかと心配しています。 スペース オデッセイ よりも ダウントン・アビー. しかし、私が間違っていることが証明されているかどうか見てみましょう。