驚くべき能力 大規模な言語モデルがなければ、OpenAI の ChatGPT は不可能です。 これらのモデルは、何十億、時には何兆ものテキストの例でトレーニングされます。 ChatGPT の背後にある考え方は、言語を非常によく理解することであり、次の言葉を一瞬で予測することができます。 これを実現するには、膨大な量のトレーニング、コンピューティング リソース、および開発者の知識が必要です。
しかし、これらのモデルの将来は、太陽の下ですべての質問に答えられるようにしたいと考えている OpenAI などのボイル ザ オーシャン アプローチよりも焦点が絞られている可能性があります。 各業界、さらには各企業が、個々のエンティティの専門用語、言語、およびアプローチを理解するようにトレーニングされた独自のモデルを持っていたらどうなるでしょうか? おそらく、答えはより限られた単語やフレーズの世界から得られるため、完全にでっち上げの答えは少なくなるでしょう。
AI 主導の未来では、各企業の独自のデータが最も価値のある資産になる可能性があります。 保険会社の場合、病院、自動車会社、または法律事務所とはまったく異なる用語集があり、それを顧客データおよび組織全体のコンテンツ全体と組み合わせると、言語モデルができあがります。 おそらくそれは大規模ではありませんが、真に大規模な言語モデルの意味では、それはまさに必要なモデルであり、大衆向けではなく 1 人向けに作成されたモデルです。
これには、企業のデータセットを収集、集約し、継続的に更新して、これらの小規模で大規模な言語モデル (sLLM) に取り込めるようにするための一連のツールも必要になります。
これらのモデルの構築は困難を伴う可能性があります。 彼らはおそらく、オープン ソースや民間企業の既存の LLM などを利用し、それを業界や企業のデータに合わせて微調整して、一般的な LLM の種類よりも安全な環境で、より焦点を当てます。
これはスタートアップ コミュニティにとって大きなチャンスであり、多くの企業がこのアイデアで有利なスタートを切っています。