LLaMA は ChatGPT や Bing とは異なります。 誰でも相談できる制度ではありません。 むしろ、メタが「この重要で急速に変化する分野でのアクセスを民主化する」ことを期待して共有していると述べているのは研究ツールです。 言い換えれば、偏見や有害性から、単に情報をでっち上げる傾向に至るまで、専門家が AI 言語モデルの問題を解き明かすのを助けることです。
この目的のために、Meta は LLaMA (実際には単一のシステムではなく、さまざまなサイズのモデルのカルテット) を「研究のユースケースに焦点を当てた非商用ライセンス」の下でリリースしており、大学、NGO、業界の研究所などのグループにアクセスを許可しています。 .
「私たちは、AI コミュニティ全体 (学術研究者、市民社会、政策立案者、業界) が協力して、責任ある AI 全般、特に責任ある大規模言語モデルに関する明確なガイドラインを作成する必要があると考えています」と同社は投稿に書いています。 「コミュニティが LLaMA を使用して何を学び、最終的に構築できるかを楽しみにしています。」
の 研究論文Meta は、LLaMA モデルの 2 番目に小さいバージョンである LLaMA-13B は、「ほとんどのベンチマークで」OpenAI の人気のある GPT-3 モデルよりも優れたパフォーマンスを発揮し、最大の LLaMA-65B は「最高のモデルと競合する」と主張しています。 DeepMind の Chinchilla70B や Google の PaLM 540B のように。 (これらの名前の数字は、各モデルの数十億のパラメーターを指します。システムのサイズの尺度であり、その洗練度の大まかな概算ですが、これら 2 つの品質は必ずしもロックステップでスケーリングするとは限りません。)
トレーニングが完了すると、LLaMA-13B は単一のデータ センター グレードの Nvidia Tesla V100 GPU でも実行できます。 これは、これらのシステムでテストを実行したいと考えている小規模な機関にとっては歓迎すべきニュースですが、そのような機器が手の届かない孤独な研究者にとってはあまり意味がありません.
Meta は過去にアクセス可能な独自の AI チャットボットを実際にリリースしましたが、評判はそれほど良くありませんでした。 BlenderBot という名前の 1 つは、単に… あまりよくない、科学論文を書くために設計されたGalacticaという名前の別のものは、 わずか 3 日後にオフラインになった 科学的なナンセンスを生み出し続けた後。
LLaMAカルテットで、メタはおそらくより親切な歓迎を望んでいます.
「本日、研究者が研究を進めるのを支援するために設計された、LLaMA と呼ばれる新しい最先端の AI 大規模言語モデルをリリースします」と、CEO の Mark Zuckerberg は述べています。 Facebookの投稿で言った. 「LLM は、テキストの生成、会話、文書の要約、および数学の定理の解決やタンパク質構造の予測などのより複雑なタスクにおいて、多くの可能性を示してきました。 Meta はこのオープンな研究モデルに取り組んでおり、新しいモデルを AI 研究コミュニティが利用できるようにします。」