コード行をインテリジェントに提案する GitHub のサービスである GitHub Copilot は、 利用可能になりました 個人ユーザーと教育者向けのローンチから数か月後の企業向けプラン。
GitHub Copilot for Business と呼ばれるこの新しいプランは、ユーザーあたり月額 19 ドルで、単一ライセンスの Copilot 層のすべての機能に加えて、企業のライセンスとポリシー コントロールが付属しています。 これには、IT 管理者が GitHub の公開コードと一致する提案されたコードが開発者に表示されないようにするトグルが含まれています。これは、Copilot をめぐって発生している知的財産論争への対応と思われます。
Microsoft Visual Studio、Neovim、JetBrains などの開発環境向けのダウンロード可能な拡張機能として利用できる Copilot は、OpenAI によって開発された Codex と呼ばれる AI モデルを利用しており、この AI モデルは数十億行のパブリック コードでトレーニングされ、与えられた追加のコード行と関数を提案します。既存のコードのコンテキスト。 8 月の時点で 400,000 人を超えるサブスクライバーがいる Copilot は、開発者が達成したいことの説明 (「Say hello world」など) に応じて、そのナレッジ ベースと現在のコンテキストを利用して、プログラミングのアプローチまたはソリューションを明らかにすることができます。
Codex が訓練を受けたコードの少なくとも一部は、著作権で保護されているか、制限付きのライセンスに基づいており、一部の擁護団体が問題を提起しています。 ユーザーは、Copilot に Quake からのコード、個人用コードベースのコード スニペット、および「Mastering JavaScript」や「Think JavaScript」などの書籍からのサンプル コードを生成するように促すことができました。 GitHub 自体は、約 1% の時間で、Copilot の提案に、トレーニング データと一致する最大 150 文字を超えるコード スニペットが含まれていることを認めています。
GitHub は、Copilot が著作権で保護されたコードに対して故意または無意識に開発された場合に、フェアユース (著作権で保護された素材の使用を最初に権利者から許可を得る必要なく許可する米国法の教義) によって保護されると主張しています。 しかし、誰もが同意するわけではありません。 フリーソフトウェア運動を擁護する非営利団体であるフリーソフトウェア財団は、コパイロットを「容認できず、不当」と呼んでいます。 Microsoft、GitHub、OpenAI が 訴えられた Copilot がクレジットを提供せずにライセンス コードのセクションを逆流させることを許可したことで、著作権法に違反したとして彼らを告発する集団訴訟で。
GitHub の責任はさておき、何人かの法律専門家は、Copilot がツールからの著作権で保護された提案を無意識のうちに製品ソフトウェアに組み込んだ場合、企業を危険にさらす可能性があると主張しています。 エレイン・アトウェル ノート Kolide の企業ブログの記事では、Copilot はライセンスのコードを削除するため、どのコードが展開を許可され、どのコードが互換性のない使用条件を持つ可能性があるかを判断することは困難です。
これを是正しようとする GitHub の試みはフィルターであり、6 月に Copilot プラットフォームに初めて導入されました。このフィルターは、公開されている GitHub コードに対して約 150 文字の周囲のコードでコードの提案をチェックし、一致または「ほぼ一致」している場合は提案を非表示にします。 しかし、それは不完全な措置です。 テキサス A&M 大学のコンピューター サイエンス教授であるティム デイビスは、フィルターを有効にすると、Copilot が著作権で保護されたコードの大部分を、すべての帰属とライセンス テキストを含めて出力することを発見しました。
GitHub は、2023 年に、開発者が Copilot の提案を使用するかどうかについて十分な情報に基づいた決定を下せるようにすることを目的とした追加機能を導入する予定です。これには、これらのリポジトリへの参照を使用してパブリック コードに一致する文字列を識別する機能が含まれます。 また、GitHub Copilot for Business の顧客の場合、GitHub は、データがパブリック リポジトリ、プライベート リポジトリ、GitHub 以外のリポジトリ、ローカル ファイルのいずれから取得されたかに関係なく、トレーニング用のコード スニペットを保持したり、コードを共有したりしないと主張しています。
しかし、これらの措置が、法的異議申し立てに対する企業の不安を和らげるのに十分かどうかは不明です。