DeepMind の AlphaCode、Amazon の CodeWhisperer、GitHub の Copilot サービスを強化する OpenAI の Codex などのコード生成システムは、コンピューター プログラミングの領域内で今日の AI で何が可能になるかについて興味をそそる外観を提供します。 しかし、これまでのところ、 一握り そのような AI システムの多くは、一般公開され、オープンソース化されています。これは、それらを構築する企業の商業的インセンティブを反映しています。
それを変えるために、AI スタートアップの Hugging Facial area と、ServiceNow の R&D 部門である ServiceNow Investigation が本日発足しました。 ビッグコードは、「オープンで責任ある」方法でコード用の「最先端」の AI システムを開発することを目的とした新しいプロジェクトです。 目標は、コード生成システムをトレーニングするのに十分な大きさのデータセットを最終的にリリースすることです。このデータセットは、Codex (120 億のパラメーター) よりもサイズが大きく、AlphaCode よりも小さい、150 億パラメーターのモデルを作成するために使用されます。 (~414 億のパラメーター) — ServiceNow の社内グラフィック カード クラスターを使用。 機械学習では、パラメーターは過去のトレーニング データから学習した AI システムの一部であり、コードの生成など、問題に対するシステムのスキルを本質的に定義します。
高度に洗練されたテキスト生成システムをオープンソース化する Hugging Confront の BigScience の取り組みに触発された BigCode は、専門的な AI 研究のバックグラウンドを持ち、プロジェクトに時間を費やすことができる人なら誰でも利用できる、と主催者は述べています。 申込書 今日の午後ライブに行きました。
「一般的に、応募者は(学界または産業界の)研究機関に所属し、技術的/倫理的/法的側面に取り組んでいることが期待されます。 [large language models] アプリケーションのコーディング用です」と ServiceNow は次のように書いています。 ブログ投稿. 「かつて [code-generating system] が訓練されたら、その能力を評価します…私たちは、評価をより簡単に、より広く行えるように努めます。 [system’s] 能力。」
BigCode は、コード生成システムを共同で開発し、開発者が特定の条件に従って再利用できるようにするライセンスの下でオープン ソース化することで、AI の実践をめぐって生じた論争のいくつかに対処しようとしています。パワードコード生成 — 特にフェアユースに関して。 非営利団体の Software package Freedom Conservancy などは、GitHub と OpenAI が公的なソース コードを使用していることを批判していますが、それらのすべてが寛容なライセンスの下にあるわけではなく、Codex のトレーニングと収益化を行っています。 Codex は OpenAI の有料 API を通じて利用できますが、GitHub は最近、Copilot へのアクセスに対して課金を開始しました。 GitHub と OpenAI は、Codex と Copilot がいかなるライセンス条項にも違反していないと主張し続けています。
BigCode の主催者は、寛大なライセンスを持つリポジトリからのファイルのみが前述のトレーニング データセットに確実に入るように苦労すると述べています。 その過程で、あらゆる種類のコード生成システムをトレーニングおよび共有するための「責任ある」AI プラクティスを確立するために取り組み、ポリシーを発表する前に関連する利害関係者からのフィードバックを求めると彼らは言います。
ServiceNow と Hugging Deal with は、プロジェクトがいつ完了するかについてタイムラインを提供しませんでした。 しかし、彼らは、コードのスニペットと自然言語の記述からコードをオートコンプリートして合成し、幅広いドメイン、タスク、およびプログラミング言語で機能するシステムなど、今後数か月でいくつかの形式のコード生成を探求することを期待しています。
倫理的、技術的、法的な問題がいつか解決されると仮定すると、AI を活用したコーディング ツールによって開発コストが大幅に削減され、コーダーはより創造的なタスクに集中できるようになります。 によると 勉強 ケンブリッジ大学の研究者によると、開発者の労力の少なくとも半分はデバッグに費やされ、積極的なプログラミングは行われておらず、ソフトウェア業界には年間推定 3,120 億ドルのコストがかかっています。