Meta の AI 研究所は、新しい最先端のチャットボットを作成し、その機能に関するフィードバックを収集するために、一般のメンバーがシステムに話しかけることができるようにしています。
ボットは BlenderBot 3 と呼ばれます ウェブ上でアクセスできます. (ただし、現時点では、米国の居住者だけがそうできるようです。) BlenderBot 3 は、一般的なおしゃべりを行うことができますが、デジタル アシスタントに尋ねるような質問にも答えることができます。市内で子供に優しい施設を見つけるための食事のレシピ。」
ボットはプロトタイプであり、Meta’s に基づいて構築されています 前の仕事 大規模言語モデルまたは LLMS として知られている — 強力だが欠陥のあるテキスト生成ソフトウェアであり、OpenAI の GPT-3 が最も広く知られている例です。 すべての LLM と同様に、BlenderBot は最初に、言語を生成するために統計パターンをマイニングするテキストの膨大なデータセットでトレーニングされます。 このようなシステムは非常に柔軟であることが証明されており、プログラマー向けのコードの生成から、著者が次のベストセラーを書くのを支援するまで、さまざまな用途に使用されています。 ただし、これらのモデルには重大な欠陥もあります。 逆流バイアス 彼らのトレーニングデータで、そしてしばしば ユーザーの質問に対する答えを発明する (デジタル アシスタントとして役立つ場合は大きな問題です)。
この後者の問題は、Meta が特に BlenderBot でテストしたいものです。 チャットボットの大きな特徴は、特定のトピックについて話すためにインターネットを検索できることです。 さらに重要なことに、ユーザーはその応答をクリックして、その情報がどこから得られたのかを確認できます。 つまり、BlenderBot 3 はそのソースを引用できます。
チャットボットを一般に公開することで、Meta は大規模な言語モデルが直面しているさまざまな問題についてフィードバックを収集したいと考えています。 BlenderBot とチャットするユーザーは、システムからの疑わしい応答にフラグを立てることができます。Meta は、「ボットによる下品な言葉遣い、中傷、文化的に無関心なコメントの使用を最小限に抑える」ために懸命に取り組んできたと述べています。 ユーザーは、データを収集することを選択する必要があります。その場合、ユーザーの会話とフィードバックは保存され、後で Meta によって公開され、一般的な AI 研究コミュニティで使用されます。
「会話型 AI を改善できることを期待して、デモで収集したすべてのデータを公開することを約束します」と、BlenderBot 3 の作成を支援した Meta の研究エンジニアである Kurt Shuster 氏は語った。 ザ・バージ.
プロトタイプの AI チャットボットを一般に公開することは、これまでテック企業にとって危険な動きでした。 2016 年、Microsoft は Twitter で Tay という名前のチャットボットをリリースしました。このチャットボットは、一般の人々とのやり取りから学習しました。 予想通り、Twitter のユーザーはすぐに Tay に、さまざまな人種差別的、反ユダヤ主義的、女性蔑視的な発言を吐き出すように指導しました。 それに応じて、Microsoft は 24 時間以内にボットをオフラインにしました。
Meta は、AI の世界は Tay の故障以来大きく変化しており、BlenderBot にはあらゆる種類の安全レールがあり、Meta が Microsoft の過ちを繰り返さないようにする必要があると述べています。
Facebook AI Research (FAIR) のリサーチ エンジニアリング マネージャーである Mary Williamson 氏によると、Tay はユーザー インタラクションからリアルタイムで学習するように設計されているのに対し、BlenderBot は静的モデルです。 つまり、会話中にユーザーが何を言ったかを記憶することができます (ユーザーがプログラムを終了して後で戻ってきた場合でも、ブラウザーの Cookie を介してこの情報を保持します) が、このデータはシステムをさらに改善するためにのみ使用されます。
「あくまで個人的な意見ですが、 [Tay] このエピソードは比較的残念なことです。なぜなら、すべての機関が研究のために公開チャットボットを出すことを恐れていたこの冬のチャットボットを作成したからです。」 ザ・バージ.
Williamson 氏によると、現在使用されているほとんどのチャットボットは範囲が狭く、タスク指向のものです。 たとえば、カスタマー サービス ボットを考えてみてください。多くの場合、事前にプログラムされたダイアログ ツリーをユーザーに提示するだけで、ユーザーのクエリを絞り込んでから、実際に仕事を遂行できる人間のエージェントに引き渡します。 本当の目的は、人間と同じように自由奔放で自然な会話を行うことができるシステムを構築することであり、これを達成する唯一の方法は、ボットに自由奔放で自然な会話をさせることだと Meta は言います。
「広い意味で役に立たないことを言うボットに対する寛容の欠如は残念です」と Williamson 氏は言います。 「そして、私たちがやろうとしていることは、これを非常に責任を持ってリリースし、研究を前進させることです。」
BlenderBot 3 を Web 上に置くだけでなく、Meta も 基礎となるコード、トレーニング データセット、および小規模なモデル バリアントの公開. 研究者は、1,750 億のパラメーターを持つ最大のモデルへのアクセスを要求できます。 こちらのフォームから.