最もホットな AI 技術基盤である OpenAI の GPT は、火曜日に大幅なアップグレードを行い、現在、 ChatGPT チャットボット.
新しいGPT-4は、はるかに長いテキスト文字列を生成し、人々が画像をフィードすると応答することができ、以前のGPT-3.5で見られた人工知能の落とし穴を回避するより良い仕事をするように設計されています. OpenAIは火曜日に言った. 例えば、弁護士が法律実務を行うために合格しなければならない司法試験を受けるとき、 GPT-4 がスコアの上位 10% にランクイン GPT-3.5 の下位 10% と比較して、AI 調査会社は述べています。
GPT は Generative Pretrained Transformer の略で、独自にテキストを生成でき、Google が開発したトランスフォーマーと呼ばれる AI テクノロジーを使用していることを示しています。 これは大規模言語モデルと呼ばれる AI の一種で、インターネットから収集された膨大なデータでトレーニングされ、パターンを見つけてスタイルを再現することを数学的に学習します。
OpenAI は開発者が GPT テクノロジを何年も利用できるようにしてきましたが、11 月にデビューした ChatGPT は簡単なインターフェイスを提供し、興味、実験、およびテクノロジのマイナス面への懸念を爆発させました。 ChatGPT は無料ですが、需要が高くなると機能が低下します。 1 月に OpenAI は ChatGPT Plus を月額 20 ドルで提供し始めました。
GPT-4 の進歩
「カジュアルな会話では、GPT-3.5 と GPT-4 の違いは微妙な場合があります。タスクの複雑さが十分なしきい値に達すると、違いが明らかになります」と OpenAI は述べています。 「GPT-4 は、GPT-3.5 よりも信頼性が高く、創造的であり、はるかに微妙な指示を処理できます。」
GPT-4 のもう 1 つの大きな進歩は、テキストや写真を含む入力データを受け入れる機能です。 OpenAI の例は、チャットボットに、最新の iPhone の小さな Lightning ポートに差し込まれた何十年も前のかさばるコンピューター ケーブルを示すジョークを説明するように求めることです。
もう 1 つは、幻覚などの AI の問題を回避するパフォーマンスの向上です。これは、誤って作成された応答であり、多くの場合、AI が正しい答えと同じくらい権威を持って提供されます。 GPT-4 は、間違ったことを言わせようとする試みを阻止することにも優れています。「GPT-4 は、内部の敵対的事実評価で最新の GPT-3.5 よりも 40% 高いスコアを獲得しています」と OpenAI は述べています。
GPT-4 には、新しい「操縦性」オプションも追加されています。 今日の大規模言語モデル (LLM) のユーザーは、多くの場合、精巧な「プロンプト エンジニアリング」に従事し、プロンプトに特定の手がかりを埋め込んで適切な種類の応答を得る方法を学ばなければなりません。 GPT-4 では、プログラミング コードやソクラテスの家庭教師など、ユーザーが特定のトーンやスタイルを設定できるシステム コマンド オプションが追加されています。彼らが自分で考えることを学ぶのを助けるために、ちょうどいい質問をするようにしてください。」
確率オウムとその他の問題
OpenAI は、GPT-4 に続く重大な欠点を認めていますが、それらを回避するための進歩も宣伝しています。
「単純な推論エラーを起こすこともある…または、ユーザーからの明らかな虚偽の陳述を受け入れて過度にだまされやすいこともある。また、生成するコードにセキュリティの脆弱性を導入するなど、人間と同じように難しい問題で失敗することもある」と OpenAI は述べています。言った。 さらに、「GPT-4 は、間違いを犯す可能性が高いときに作業を再確認するように注意を払わずに、自信を持ってその予測が間違っている可能性もあります。」
大規模な言語モデルは印象的な結果をもたらすことができ、膨大な量の主題を理解し、多少高尚な言語ではあるが人間のように聞こえるように会話するように見えます。 ただし、基本的に、LLM AI は実際には何も知りません。 彼らは、統計的に非常に洗練された方法で単語をつなぎ合わせることができます.
知識に対するこの統計的だが基本的にやや中空のアプローチは、元 Google AI 研究者のエミリー ベンダーやティムニット ゲブルを含む研究者に警告を発するように導きました。確率的オウムの危険性言語モデル AI は、トレーニング データに存在する偏見、ステレオタイプ、および否定的な感情をエンコードする傾向があり、これらのモデルを使用する研究者や他の人々は、「パフォーマンスの向上を実際の自然言語理解と間違える」傾向があります。
OpenAI、Microsoft、Nvidia のパートナーシップ
OpenAI は、Microsoft が 2 月に Bing 検索エンジンで ChatGPT に似たチャット機能を含む GPT テクノロジを使用していると発表したときに、大きな後押しを受けました。 火曜日に、マイクロソフトはそれが Bing に GPT-4 を使用する 仕事。 OpenAI と Microsoft が協力して、 Google に対する主要な検索の脅威ですが、Google には独自の大規模な言語モデル テクノロジーもあります。 Bardというチャットボット Google が非公開でテストしていること。
Microsoft は GPT テクノロジを使用して、ユーザーが Bing に入力する検索を評価し、場合によっては、より精巧な会話形式の応答を提供します。 の 結果ははるかに有益です しかし、オプションとして呼び出すことができるより会話的なインターフェースには、それが邪魔にならないように見える問題がありました.
GPT をトレーニングするには、 OpenAI は Microsoft の Azure クラウド コンピューティング サービスを使用しました、何千もの Nvidia の A100 グラフィックス プロセッシング ユニット (GPU) が結合されています。 Azure では、Nvidia の新しい H100 プロセッサを使用できるようになりました。これには、AI 変圧器の計算を高速化するための特定の回路が含まれています。