サンフランシスコを拠点とするスタートアップ OpenAI によって開発された無料のテキスト生成 AI である ChatGPT を呼び出すには、ヒットは非常に控えめな表現です。
12 月の時点で、ChatGPT には 推定 1 億人を超える月間アクティブ ユーザー。 主要なメディアの注目を集め、ソーシャル メディアで無数のミームを生み出しました。 使い慣れた 書く Amazon の Kindle ストアにある何百もの電子ブック。 そして、少なくとも共著でクレジットされています 1 つの科学論文。
しかし、ビジネスである OpenAI は、投資家が不安にならないように、どうにかして ChatGPT を収益化する必要がありました。 2 月にプレミアム サービスである ChatGPT Plus を開始し、これに向けた一歩を踏み出しました。 そして今日、より大きな動きを見せ、あらゆる企業が ChatGPT 技術を自社のアプリ、ウェブサイト、製品、サービスに組み込むことを可能にする API を導入しました。
API は常に計画でした。 これは、OpenAI の社長兼会長 (および共同設立者の 1 人) である Greg Brockman によるとです。 彼は昨日の午後、ChatGPT API のローンチに先立ってビデオ通話で私と話をしました。
「これらの API を特定の品質レベルにするには、しばらく時間がかかります」と Brockman 氏は言います。 「需要と規模に対応できるというのは、こういうことだと思います。」
Brockman 氏によると、ChatGPT API は、「gpt-3.5-turbo」と呼ばれる OpenAI の非常に人気のある ChatGPT の背後にある同じ AI モデルによって強化されています。 GPT-3.5 は、現在 OpenAI が API スイートを通じて提供する最も強力なテキスト生成モデルです。 「ターボ」モニカは、 最適化され、より反応が良い OpenAI が ChatGPT のために静かにテストしている GPT-3.5 のバージョン。
ブロックマンは、トークン 1,000 個あたり 0.002 ドル、または約 750 語で、この API は「非チャット」アプリケーションを含むさまざまなエクスペリエンスを促進できると主張しています。 Snap、Quizlet、Instacart、Shopify は早期採用者の 1 つです。
gpt-3.5-turbo を開発する最初の動機は、ChatGPT の莫大な計算コストを削減することだったのかもしれません。 OpenAI の CEO である Sam Altman はかつて、ChatGPT の費用を「目を見張るような」ものと呼んでいました。 それらを見積もる コンピューティング コストはチャットあたり数セントです。 (100 万人を超えるユーザーがいるため、おそらくすぐに合計されます。)
しかし、ブロックマン氏は、gpt-3.5-turbo は別の点で改善されていると述べています。
「AI を活用したチューターを構築している場合、チューターが単に生徒に答えてほしいと思うことは決してありません。 常にそれを説明し、彼らが学ぶのを助けることを望んでいます – それはあなたが構築できるべき種類のシステムの例です [with the API]」とブロックマンは言いました。 「これは、API をより使いやすく、アクセスしやすくするものになると考えています。」
ChatGPT API は、My AI、Snap が最近発表した Snapchat+ サブスクライバー向けのチャットボット、および Quizlet の新しい Q-Chat バーチャル チューター機能を支えています。 Shopify は ChatGPT API を使用して、ショッピングのおすすめを表示するためのパーソナライズされたアシスタントを構築しました。一方、Instacart はそれを利用して、Ask Instacart を作成しました。これは、Instacart の顧客が食品について質問し、同社の小売店からの製品データに基づいて通知された「購入可能な」回答を得ることを可能にする今後の有料サービスです。パートナー。
「食料品の買い物は、予算、健康と栄養、個人的な好み、季節性、料理のスキル、準備時間、レシピのインスピレーションなど、多くの要因が関係するため、大きな精神的負荷がかかる可能性があります」と Instacart のチーフ アーキテクト JJ Zhuang 氏は電子メールで私に語った。 . 「AI がその精神的負担を引き受け、食料品の買い物、食事の計画、配膳などを担当する家庭のリーダーを助け、実際に食料品の買い物を本当に楽しいものにできるとしたら? Instacart の AI システムを OpenAI の ChatGPT と統合すると、まさにそれが可能になり、Instacart アプリで可能なことの実験を開始できることに興奮しています。」
ただし、ChatGPT サガを注意深くフォローしている人は、リリースの機が熟しているかどうか疑問に思っているかもしれません。
早い段階で、ユーザーは ChatGPT に質問に答えるよう促すことができました。 人種差別主義者と性差別主義者 これは、ChatGPT が最初にトレーニングされた偏ったデータを反映したものです。 (ChatGPT のトレーニング データには、電子ブック、Reddit の投稿、ウィキペディアの記事など、幅広いインターネット コンテンツが含まれます。) ChatGPT はまた、事実を発明していることを明らかにせずに、事実を発明します。 幻覚.
ChatGPT (およびそのようなシステム) は、プロンプトベースの攻撃や、当初の目的の一部ではないタスクを実行させる悪意のある敵対的なプロンプトの影響を受けやすくなっています。 コミュニティ全体 Reddit では、ChatGPT を「ジェイルブレイク」し、OpenAI が導入した保護手段を回避する方法を見つけることを中心に形成されました。 あまり攻撃的でない例の 1 つとして、スタートアップ Scale AI のスタッフが ChatGPT を取得することができました。 漏らす その内部の技術的な仕組みに関する情報。
ブランドは間違いなく、十字線に巻き込まれたくないでしょう。 ブロックマンは、そうはならないと断言している。 なぜそうなのか? その理由の 1 つは、バックエンドの継続的な改善であると彼は言います。 ケニアの契約労働者の費用. しかし、Brockman 氏は、OpenAI が Chat Markup Language (ChatML) と呼ぶ新しい (そして明らかに議論の余地の少ない) アプローチを強調しました。 ChatML は、テキストを一連のメッセージとメタデータとして ChatGPT API にフィードします。 これは、一連のトークンとして表される生のテキストを消費する標準の ChatGPT とは対照的です。 (たとえば、「ファンタスティック」という単語は、「ファン」、「タス」、「ティック」というトークンに分割されます。)
たとえば、「私の 30 歳の誕生日に何か面白いパーティーのアイデアはありますか?」というプロンプトがあるとします。 開発者は、「あなたは、ユーザーが尋ねる質問を支援するために設計された楽しい会話型チャットボットです。 正直に楽しく答えてください!」 または、ChatGPT API に処理させる前に「あなたはボットです」。 Brockman 氏によると、これらの指示は、ChatGPT モデルの応答をより適切に調整 (およびフィルター処理) するのに役立ちます。
「私たちはより高いレベルの API に移行しています。 「これは開発者からのものです」または「これはユーザーからのものです」など、システムへの入力を表すより構造化された方法があれば、開発者として、実際にはより堅牢になることが期待できます。 [using ChatML] この種の迅速な攻撃に対して」とブロックマンは言いました。
意図しない ChatGPT の動作を (うまくいけば) 防止するもう 1 つの変更は、より頻繁なモデルの更新です。 gpt-3.5-turbo のリリースにより、開発者はデフォルトで OpenAI の最新の安定したモデルに自動的にアップグレードされるとブロックマン氏は述べ、gpt-3.5-turbo-0301 (本日リリース) から開始します。 開発者は、選択した場合、古いモデルを使用し続けるオプションがありますが、これにより、利点がいくらか打ち消される可能性があります.
最新モデルへの更新を選択するかどうかにかかわらず、Brockman は、一部の顧客 (主に対応する予算が大きい大企業) は、専用のキャパシティ プランの導入により、システム パフォーマンスをより詳細に制御できるようになると指摘しています。 今月初めにリークされた文書で最初に詳述された、本日開始された OpenAI の専用キャパシティー プランにより、顧客は OpenAI モデル (gpt-3.5-turbo など) を実行するためのコンピューティング インフラストラクチャの割り当てに対して支払うことができます。 (ちなみに、バックエンドは Azure です。)
インスタンスの負荷を「完全に制御」することに加えて (通常、OpenAI API の呼び出しは共有コンピューティング リソースで行われます)、専用の容量により、お客様はより長いコンテキスト制限などの機能を有効にすることができます。 コンテキスト制限は、追加のテキストを生成する前にモデルが考慮するテキストを参照します。 より長いコンテキスト制限により、モデルは本質的により多くのテキストを「記憶」できます。 コンテキスト制限を高くしても、バイアスや毒性の問題がすべて解決されるわけではありませんが、gpt-3.5-turbo のようなモデルを 幻覚が少ない.
Brockman 氏によると、専用容量の顧客は、最大 16k のコンテキスト ウィンドウを持つ gpt-3.5-turbo モデルを期待できるため、標準の ChatGPT モデルの 4 倍のトークンを取り込むことができます。 これにより、誰かが税コードのページとページを貼り付けて、モデルから合理的な答えを得ることができるようになる可能性があります。たとえば、今日では不可能な偉業です。
Brockman 氏は、将来の一般リリースについてほのめかしましたが、すぐにはリリースされません。
「コンテキスト ウィンドウが増え始めています。現在、私たちが専用のキャパシティ カスタマーのみである理由の 1 つは、私たちの側に多くのパフォーマンスのトレードオフがあるためです」と Brockman 氏は言います。 「最終的には、同じもののオンデマンド バージョンを提供できるようになるかもしれません。」
Microsoft からの数十億ドルの投資の後、OpenAI が利益を上げなければならないという圧力が高まっていることを考えると、それはそれほど驚くべきことではありません。