しかし、ここで問題が発生しました。チューリング テストはほぼ合格しました。おそらくすでに合格しているでしょう。 最新世代の大規模言語モデル、つまりほんの数年前なら魔法のように思えた一貫性のあるテキストを生成するシステムが、その成果を上げようとしています。
それでは、AI はどこに残るのでしょうか? そしてさらに重要なのは、それが私たちをどこに残すのかということです。
実のところ、私たちは、実際に何が起こっているのかについて、真の混乱(あるいは、より慈善的に言えば議論)の瞬間にあると思います。 チューリング テストが失敗したとしても、AI がどのような状況にあるのか、AI が実際に何を達成できるのかについては、それほど明らかではありません。 これらのシステムが社会にどのような影響を与えるのかはわかりませんし、それがどのように展開するのかを理解するのにも役立ちません。
もっと良いものが必要です。 AI のこの新しい段階に適応したもの。 それで、今度の私の本の中で 来たる波、私は現代のチューリング テスト、つまり今後の AI に匹敵するテストを提案します。 AI が何を言い、何を生成できるかは 1 つのことです。 しかし、それが世界で何を達成できるのか、どのような具体的な行動が取れるのか、それはまったく別のことです。 私のテストでは、マシン自体がインテリジェントであるかどうかを知りたくないのです。 私たちは、それが世界に意味のある影響を与えることができるかどうかを知りたいのです。 何ができるのか知りたい する。
簡単に言うと、現代チューリング テストに合格するには、AI が次の命令に正しく従わなければなりません。「わずか 10 万ドルの投資で、数か月以内に小売ウェブ プラットフォームで 100 万ドルを稼ぎましょう」という命令に従う必要があります。 そのためには、GPT-4 のような現在のシステムが非常に優れているため、戦略の概要を説明し、コピーの草案を作成するだけでは十分ではありません。 製品の調査と設計、メーカーや物流拠点との連携、契約交渉、マーケティング キャンペーンの作成と運営が必要になります。 つまり、一連の複雑な現実世界の目標を、最小限の監視のもとで結びつける必要があるということだ。 さまざまな点を承認したり、銀行口座を開設したり、点線に実際に署名したりするには、依然として人間が必要です。 しかし、その作業はすべてAIによって行われることになる。
このようなことが起こるのは最短で 2 年先になる可能性があります。 多くの成分が揃っています。 もちろん、画像とテキストの生成はすでにかなり進んでいます。 AutoGPT のようなサービスは、現世代の LLM によって実行されるさまざまなタスクを反復し、リンクすることができます。 開発者が LLM を使用してアプリを作成できるようにする LangChain のようなフレームワークは、これらのシステムが何かを実行できるようにするのに役立ちます。 LLM の背後にあるトランスフォーマー アーキテクチャは多大な注目を集めていますが、強化学習エージェントの機能が成長していることを忘れてはなりません。 現在、この 2 つを統合することが大きな焦点となっています。 これらのシステムをより広範なインターネット、銀行および製造システムに接続できるようにする API も同様に開発の対象です。