ChatGPT が来るのを誰も見ていないことは明らかです。 OpenAIでさえありません。 ChatGPT が歴史上最も急速に成長している消費者向けアプリになる前、「ジェネレーティブ トレーニング済みトランスフォーマー」というフレーズが一般的な言語に変わる前、考えられるすべての企業がその基盤となるモデルを採用しようと競い合う前に、ChatGPT は 11 月に「研究プレビュー」。
の ChatGPT を発表するブログ投稿 安売りの陽気なケーススタディになりました。 「ChatGPT は InstructGPT の兄弟モデルであり、プロンプトの指示に従い、詳細な応答を提供するようにトレーニングされています。 ユーザーのフィードバックを得て、その長所と短所について学ぶために、ChatGPT を導入できることを嬉しく思います。」 それでおしまい! それがピッチ全体です! テクノロジーと私たちの相互作用の性質を根本的に変えることについての詩的なワックスはありません。 それは単なる研究のプレビューでした。
しかし、わずか 4 か月後の今、ChatGPT はテクノロジーに対する私たちの考え方を本当に変えようとしているようです。 または、より正確には、元に戻します。 私たちの進むべき道は、技術の未来は奇抜なインターフェースやメタバースではないということです。 「コンピューターのテキスト ボックスにコマンドを入力する」ことです。 コマンド ラインが復活しました。よりスマートになりました。
実際、ジェネレーティブ AI は 2 つの方向に同時に進んでいます。 1 つ目は、はるかにインフラストラクチャーであり、既に使用しているものに新しいツールと機能を追加します。 GPT-4 や Google の LaMDA などの大規模な言語モデルは、電子メールやメモの作成に役立ちます。 自動的にスライド デッキを整え、スプレッドシートの間違いを修正します。 彼らはあなたよりも上手にあなたの写真を編集します。 彼らはあなたがコードを書くのを助け、多くの場合、あなたのためにそれをしてくれます。
これは、大まかに言うと、AI が何年にもわたってたどってきた道ですよね? Google はここ数年、あらゆる種類の AI を製品に統合してきました。Salesforce のような企業でさえ、強力な AI 研究プロジェクトを構築しています。 これらのモデルは、作成に費用がかかり、トレーニングに費用がかかり、クエリに費用がかかり、企業の生産性を一変させる可能性があります。 すでに使用している製品の AI 強化は大きなビジネスであり、少なくとも同様の投資が行われており、それは長期にわたって続くでしょう。
もう 1 つの AI の方向性、つまり AI とのやり取りが消費者向け製品になるという方向性は、それほど明白ではありませんでした。 もちろん、今では理にかなっています。 しません 映画やレシピ、東京で何をすべきかをすべて知っているロボットと話をしたいのですが、私がちょうどいいことを言ったら、完全に脱線してあなたと仲直りしようとするかもしれません? しかし、ChatGPT が世界を席巻する前、そして Bing と Bard の両方がこのアイデアを採用し、それから独自の製品を構築しようとする前は、チャット ウィンドウに入力することがユーザーの次の大きなものになるとは確信していませんでした。インターフェイス。
ある意味で、これは非常に古い考えへの回帰です
ある意味で、これは非常に古い考えへの回帰です。 長年にわたり、ほとんどのユーザー それだけ 空白の画面に文字を入力することでコンピューターとやり取りしました — コマンドラインは、マシンに何をすべきかを伝える方法でした。 (はい、ChatGPT は 多く 机の上にはありませんが、アイデアはわかります。)
しかしその後、面白いことが起こりました。私たちはより良いインターフェイスを発明しました! コマンド ラインの問題点は、何を入力し、どの順序でコンピューターを動作させるかを正確に知る必要があることでした。 大きなアイコンをポイントしてクリックするのははるかに簡単で、画像やアイコンを使ってコンピューターでできることを人々に教えるのもずっと簡単でした。 コマンド ラインはグラフィカル ユーザー インターフェイスに取って代わられましたが、GUI は依然として最高です。
とはいえ、開発者はチャット UI を機能させる試みをやめませんでした。 WhatsApp はその良い例です。同社は何年もかけて、ユーザーがチャットを使用して企業と対話する方法を見つけようと試みてきました。 Google の多くの失敗したメッセージング アプリの 1 つである Allo は、友人とのチャット内で AI アシスタントと対話できることを望んでいました。 2016 年頃の最初のチャットボットの誇大広告では、多くの非常に賢い人々が、メッセージング アプリがすべての未来であると考えていました。
メッセージング インターフェイスである「会話型 AI」には魅力的なものがあります。 それは、私たち全員がそれを使用する方法を知っているという事実から始まります。 メッセージング アプリは、私たちが最も大切な人と連絡を取り合う方法です。つまり、メッセージ アプリは私たちが多くの時間とエネルギーを費やす場所です。 Uber アプリのくぼみをナビゲートする方法や、Southwest アプリでフリークエント フライヤー番号を見つける方法を知らないかもしれませんが、「これらの単語をこの番号にテキスト送信する」という動作は、ほとんどの人が理解していることです。 人々がアプリをダウンロードしたくないし、モバイル Web サイトがほとんどいまだにつまらない市場では、メッセージングはエクスペリエンスを大幅に簡素化することができます。
また、メッセージングは最も高度なインターフェイスではありませんが、最も拡張性がある可能性があります。 たとえば、Slack を例にとると、チャット アプリのようなものだと思われるかもしれませんが、その双方向のインターフェースには、リンク、編集可能なドキュメント、インタラクティブな投票、情報ボットなどを埋め込むことができます。 WeChat は、プラットフォーム全体 (基本的にはインターネット全体) がメッセージング アプリに押しつぶされていることで有名です。 メッセージングから始めて、多くの場所に行くことができます。
しかし、これらのツールの多くは同じようにつまずきます。 営業時間などの迅速な情報交換には、チャットが最適です。質問をして回答を得ることができます。 しかし、カタログを一連のメッセージとしてブラウジングしていませんか? 結構です。 何千回もメッセージをやり取りして飛行機のチケットを購入しますか? ハードパス。 音声アシスタントと何ら変わりはありません。Alexa で簡単なものを購入しようとしたことがあるなら、きっと助けてくれるでしょう。 (「Charmin の場合は、「3」と言ってください。」) ほとんどの複雑なことについては、視覚的で専用の UI の方が、メッセージ ウィンドウよりもはるかに優れています。
そして、ChatGPT、Bard、Bing、およびその他に関しては、物事は非常に複雑になります. これらのモデルはスマートで協調的ですが、何を、どのように、どのような順序で求めるかを正確に把握する必要があります。 「の考え方」迅速なエンジニアStable Diffusion から完璧な画像を引き出す方法や、ChatGPT で適切な Javascript を生成する方法を正確に知るためにお金を払う人は、ばかげているように見えますが、実際には方程式の完全に必要な部分です. これは、コンピューターに何をすべきかを伝える方法を知っている人がごくわずかだった初期のコンピューター時代と何ら変わりはありません。 本当に素晴らしいプロンプトを売買できる市場はすでにあります。 プロンプトに関する専門家や本があります。 スタンフォード大学は、誰もがすぐに受講するプロンプト エンジニアリング専攻にすでに取り組んでいると思います。
ジェネレーティブ AI の注目すべき点は、ほぼ何でもできるように感じられることです。 それが全体の問題でもあります。 何でもできるとき、あなたは何をしますか? どこから始めますか? その可能性への唯一のウィンドウが点滅するカーソルである場合、どのように使用するかを学びますか? 最終的に、これらの企業は、人々が何ができるのか、どのように機能するのかを真に理解するのに役立つ、より視覚的でインタラクティブなツールを開発するかもしれません. (これは、ChatGPT の新しいプラグイン システムに注目する理由の 1 つです。これは今のところ非常に単純ですが、チャット ウィンドウでできることをすぐに拡張できる可能性があります。)入力する可能性のあるものについていくつかの提案を提供します。
AIは機能になる予定でした。 では商品です。 そして、それはテキストボックスが戻ってきたことを意味します。 メッセージングはインターフェースです。