すべてを自動化しようとするシリコンバレーの探求は絶え間なく続いており、それが最新の強迫観念を説明しています。 自動 GPT.
本質的に、Auto-GPT は OpenAI の最新の AI モデルの汎用性を使用してオンラインでソフトウェアやサービスと対話し、X や Y のようなタスクを「自律的に」実行できるようにします。海のように広く、水たまりのように深い。
Auto-GPT — 最近ソーシャル メディアで話題になっているのを目にしたかもしれません — は、ゲーム開発者の Toran Bruce Richards によって作成されたオープン ソース アプリです。 OpenAI のテキスト生成モデル (主に GPT-3.5 と GPT-4) を使用して「自律的に」動作します。
その自律性に魔法はありません。 Auto-GPT は、OpenAI のモデルの最初のプロンプトに対するフォローアップを単純に処理し、タスクが完了するまで質問と回答の両方を行います。
Auto-GPT は、基本的に、GPT-3.5 と GPT-4 を、GPT-3.5 と GPT-4 に何をすべきかを指示するコンパニオン ボットと組み合わせたものです。 ユーザーが Auto-GPT に目標を伝えると、ボットは GPT-3.5 と GPT-4 およびいくつかのプログラムを使用して、設定した目標を達成するために必要なすべてのステップを実行します。
Auto-GPT が合理的に機能する理由は、Web ブラウザーやワープロなど、オンラインとローカルの両方でアプリ、ソフトウェア、およびサービスとやり取りできることです。 たとえば、「花ビジネスの成長を手伝ってください」などのプロンプトが表示された場合、Auto-GPT は次のことができます。 ある程度妥当な広告戦略を策定し、基本的なウェブサイトを構築します。
Auto-GPT を試したソフトウェア開発者の Joe Koen が TechCrunch に電子メールで説明したように、Auto-GPT は基本的に、チャットボット指向の AI モデルを使用して何度もプロンプトを表示する必要があった複数ステップのプロジェクトを自動化します。 、OpenAIのChatGPT。
「Auto-GPT は、OpenAI の API と通信するエージェントを定義します」と Koen 氏は述べています。 「このエージェントの目的は、エージェントの要求に応じて AI が生成するさまざまなコマンドを実行することです。 ユーザーは、エージェントがコマンドの実行を開始する前に、AI の役割と目的を指定するための入力を求められます。」
ターミナルで、ユーザーは Auto-GPT エージェントの名前、役割、目的を説明し、その目的を達成するための最大 5 つの方法を指定します。 例えば:
- 名前: スマートフォン-GPT
- 役割: 最適なスマートフォンを見つけるように設計された AI
- 目的: 市場で最高のスマートフォンを見つける
- 目標 1: 現在市場に出回っているさまざまなスマートフォンの市場調査を行う
- 目標 2: トップ 5 のスマートフォンを取得し、長所と短所をリストします
舞台裏では、Auto-GPT はメモリ管理などの機能に依存してタスクを実行し、GPT-4 および GPT-3.5 を使用してテキスト生成、ファイル ストレージ、および要約を実行します。
Auto-GPT は、次のような音声シンセサイザーに接続することもできます。 イレブンラボの、たとえば電話を「発信」できるようにします。
Auto-GPT は GitHub で公開されていますが、起動して実行するにはセットアップとノウハウが必要です。 Auto-GPT を使用するには、Docker などの開発環境に Auto-GPT をインストールし、OpenAI の API キーに登録する必要があります。これには、有料の OpenAI アカウントが必要です。
それは価値があるかもしれません—陪審員はそれについて出ていますが. 初期の採用者は、Auto-GPT を使用して、ボットに委任したほうがよい種類のありふれたタスクを引き受けました。 たとえば、Auto-GPT は、コードのデバッグや電子メールの作成などの項目や、新しいスタートアップの事業計画の作成などのより高度な項目に対応できます。
「Auto-GPT が何らかの障害に遭遇した場合、またはタスクを完了できない場合、状況をナビゲートし、適切な次のステップを決定するのに役立つ新しいプロンプトを作成します」と、技術コンサルタント会社である UST のチーフ アーキテクトである Adnan Masood 氏は語った。電子メールでTechCrunch。 「大規模な言語モデルは、人間のような応答を生成することに優れていますが、ユーザーのプロンプトと対話に依存して、望ましい結果をもたらします。 対照的に、Auto-GPT は OpenAI の API の高度な機能を活用して、ユーザーの介入なしに独立して動作します。」
ここ数週間で、Auto-GPT をさらに使いやすくする新しいアプリが登場しました。 エージェントGPT GodMode は、ユーザーがやりたいことをブラウザー ページに直接入力できるシンプルなインターフェイスを提供します。 Agent-GPT と同様に、両方とも OpenAI からの API キーが必要であり、すべての機能のロックを解除することに注意してください。
ただし、他の強力なツールと同様に、Auto-GPT にも限界とリスクがあります。
ツールが提供する目的に応じて、Auto-GPT は非常に… 予期しない方法で動作する可能性があります。 1 つの Reddit ユーザー サーバー インスタンス内で使用する予算が 100 ドルの場合、Auto-GPT は猫に関する wiki ページを作成し、インスタンスの欠陥を悪用して管理者レベルのアクセス権を取得し、それが実行されていた Python 環境を乗っ取ったと主張しています。それから自分自身を「殺した」。
また、「人類の破壊」や「世界支配の確立」などの目標を課された Auto-GPT の修正版である ChaosGPT もあります。 当然のことながら、ChaosGPT はロボットの黙示録をもたらすまでには至っていませんが、 つぶやいた 人類についてはむしろ不愉快に。
ただし、「人類を破壊」しようとする Auto-GPT よりも間違いなく危険なのは、それ以外の場合は完全に正常なシナリオで発生する可能性のある予期しない問題です。 OpenAI の言語モデル (すべての言語モデルと同様に、不正確になりがちなモデル) に基づいて構築されているため、エラーが発生する可能性があります。
それだけが問題ではありません。 タスクを正常に完了した後、Auto-GPT は通常、後で使用するためにその実行方法を思い出しません。 Auto-GPT は、複雑なタスクをより単純なサブタスクに効果的に分割するのにも苦労しており、さまざまな目標がどのように重なり合っているかを理解するのに苦労しています。
「Auto-GPT は、ジェネレーティブ AI の力と未知のリスクを示しています」と、Salesforce の Service Cloud の CEO で Auto-GPT 愛好家の Clara Shih 氏は電子メールで述べました。 「企業にとって、Auto-GPT のようなジェネレーティブ AI テクノロジーを開発および使用する際には、ループ アプローチに人を含めることが特に重要です。」