最近流出したのは、 書類Google出身とされる人物は、オープンソースAIがGoogleやOpenAIと競合すると主張した。 この漏洩により、AI システムとその多くのコンポーネントを研究者や一般の人々とどのように共有すべきかについて、AI コミュニティで継続的に議論が行われていることが浮き彫りになりました。 最近多数の生成 AI システムがリリースされたにもかかわらず、この問題は未解決のままです。
多くの人は、これを二者択一の質問として考えています。システムはオープンソースかクローズドソースのどちらかです。 オープン開発では権限が分散されるため、多くの人が共同で AI システムに取り組むことができ、次のように AI システムが自分たちのニーズや価値観を確実に反映できるようになります。 ビッグサイエンスのブルーム。 オープン性により、より多くの人が AI の研究開発に貢献できるようになりますが、アクセスが増えると、特に悪意のある者による危害や悪用の可能性が高まります。 クローズドソース システムなど Google のオリジナル LaMDA リリース、開発者組織外の行為者から保護されていますが、外部の研究者による監査や評価はできません。
私は、以下を含む生成 AI システムのリリースを主導し、研究してきました。 OpenAIのGPT-2、これらのシステムが最初に普及し始めて以来、私は現在、 倫理的開放性 ハグフェイスでの考察。 この仕事をしていると、オープンソースとクローズドソースは、その両端であると考えるようになりました。 生成 AI システムをリリースするためのオプションの勾配、単純な二者択一の質問ではなく。
勾配の一方の端には、非常に閉鎖的なシステムがあり、一般には知られていません。 明らかな理由から、これらの具体例を挙げるのは困難です。 しかし、勾配を一歩越えただけで、ビデオ生成などの新しいモダリティでは、公表されているクローズド システムがますます一般的になりつつあります。 ビデオ生成は比較的最近開発されたものであるため、ビデオ生成がもたらすリスクとその最適な軽減方法に関する研究や情報はあまりありません。 メタが発表したとき ビデオを作ります 2022年9月モデル、 言及された懸念 たとえば、モデルを共有しない理由として、現実的で誤解を招くコンテンツを誰でも簡単に作成できることなどが挙げられます。 その代わりにメタ氏は、研究者へのアクセスを段階的に許可すると述べた。
グラデーションの中央には、一般ユーザーが最もよく知っているシステムがあります。 たとえば、ChatGPT と Midjourney はどちらも公的にアクセス可能なホスト システムであり、開発者組織である OpenAI と Midjourney がそれぞれプラットフォームを通じてモデルを共有し、一般の人々が出力を求めたり生成したりできるようにしています。 これらのシステムは、幅広い対応範囲とコード不要のインターフェイスにより、有用であることが証明されています。 リスキーな。 ホスト組織の外部の人々がモデルと対話できるため、クローズド システムよりも多くのフィードバックが可能ですが、外部の人々が持つ情報は限られており、トレーニング データやモデル自体を評価するなどしてシステムを確実に調査することはできません。
勾配の反対側では、トレーニング データからコード、モデル自体に至るまで、すべてのコンポーネントが完全にオープンで誰でもアクセスできる場合、システムは完全にオープンになります。 生成 AI は、オープンな研究と、次のような初期のシステムからの教訓に基づいて構築されています。 GoogleのBERT、全開でした。 現在、最もよく使われている完全オープン システムは、民主化と透明性を重視する組織によって開発されました。 Hugging Face が主催する取り組み(私も参加しています)— ビッグサイエンス と ビッグコード、ServiceNow と共同主導、および次のような分散型集団によって主導されています。 エレウザーAI 今人気があります ケーススタディ 建物用 オープンシステム に 含む 世界中の多くの言語と人々。
絶対的に安全な放出方法や標準化された一連の放出方法はありません。 リリース規範。 基準を設定するための確立された機関もありません。 ELMo や BERT などの初期の生成 AI システムは、2019 年の GPT-2 の段階的リリースまでほぼオープンでした。 責任を持って導入することについてのディスカッション ますます強力なシステム (リリースやリリースなど) 出版義務 あるべき姿。 それ以来、さまざまなモダリティ、特に大規模組織のシステムが閉鎖的な方向に移行し、 権力の集中 これらのシステムを開発および展開できるリソースの高い組織。