OpenAI は、お客様が GPT-3.5 などの同社の新しい機械学習モデルを専用の容量で実行できるようにする新しい開発者プラットフォームを静かに立ち上げています。 によって Twitter に公開されたドキュメントのスクリーンショット ユーザー OpenAI は、Foundry と呼ばれる今後の製品について、「大規模なワークロードを実行する最先端の顧客向けに設計されている」と説明しています。
「[Foundry allows] モデル構成とパフォーマンス プロファイルを完全に制御して、大規模な推論を行うことができます」とドキュメントには書かれています。
スクリーンショットが信じられるなら、Foundry は、起動するたびに、単一の顧客専用のコンピューティング容量 (おそらく Azure、OpenAI の優先パブリック クラウド プラットフォーム) の「静的割り当て」を提供します。 ユーザーは、OpenAI がモデルの構築と最適化に使用するのと同じツールとダッシュボードを使用して、特定のインスタンスを監視できます。 さらに、Foundry はある程度のバージョン管理を提供し、顧客が新しいモデル リリースにアップグレードするかどうかを決定できるようにし、OpenAI の最新モデルの「より堅牢な」微調整を行います。
Foundry はまた、インスタンスのアップタイムやオンカレンダー エンジニアリング サポートなどのサービス レベルのコミットメントも提供します。 レンタルは、3 か月または 1 年間の契約を伴う専用のコンピューティング ユニットに基づいています。 個々のモデル インスタンスを実行するには、特定の数のコンピューティング ユニットが必要です (下のグラフを参照)。
インスタンスは安くはありません。 GPT-3.5 の軽量バージョンを実行するには、3 か月の契約で 78,000 ドル、1 年間の契約で 264,000 ドルかかります。 大局的に見ると、Nvidia の最新世代のスーパーコンピューターの 1 つである DGX Station は、 走る 1ユニットあたり149,000ドル。
鷹の目のTwitterと レディット ユーザーは、インスタンスの料金表にリストされているテキスト生成モデルの 1 つに最大 32k のコンテキスト ウィンドウがあることに気付きました。 (コンテキスト ウィンドウとは、モデルが追加のテキストを生成する前に考慮するテキストを指します。コンテキスト ウィンドウが長いほど、モデルは本質的により多くのテキストを「記憶」できます。) OpenAI の最新のテキスト生成モデルである GPT-3.5 には、最大 4k のコンテキスト ウィンドウがあります。この謎めいた新しいモデルが、待望の GPT-4 である可能性、またはそれに向けた足がかりになる可能性があることを示唆しています。
OpenAI は、Microsoft からの数十億ドルの投資の後、利益を上げなければならないというプレッシャーにさらされています。 同社によると、 期待する 2023 年に 2 億ドルを稼ぐには、これまでにスタートアップに投入された 10 億ドル以上に比べれば微々たるものです。
計算コストが主な原因です。 最先端の AI モデルをトレーニングして命令できる 数百万ドル以上、そしてそれらを実行することは一般的にそれほど安くはありません。 OpenAI の共同創設者兼 CEO であるサム アルトマン氏によると、 数セント OpenAI のバイラル チャットボットである ChatGPT を実行するためのチャットあたり。
収益化への動きとして、OpenAI は最近、ChatGPT の「プロ」バージョンである ChatGPT Plus を月額 20 ドルから開始し、Microsoft と協力して Bing Chat を開発しました。 によると セマフォーと 情報、OpenAIは将来的にモバイルChatGPTアプリを導入し、そのAIを導入する予定です 言語テクノロジを Word、PowerPoint、Outlook などの Microsoft アプリに組み込みます。
これとは別に、OpenAI は引き続き、Microsoft の Azure OpenAI サービス (ビジネスに焦点を当てたモデル提供プラットフォーム) を通じてその技術を利用できるようにし、GitHub と提携して開発されたプレミアム コード生成サービスである Copilot を維持します。