AI の状態に関するレポートを書くことは、移動する砂の上に構築するようなものである必要があります。公開するまでに、業界全体が足元で変化しています。 しかし、重要な傾向と重要な点はまだあります。 スタンフォードの 386 ページの入札 この複雑で動きの速いドメインを要約します。
人間中心の人工知能研究所の AI インデックスは、学界や民間企業の専門家と協力して、この問題に関する情報と予測を収集しました。 毎年の取り組みとして (そして、その規模からして、彼らは次のものを準備するためにすでに懸命に取り組んでいることは間違いありません)、これは AI に関する最新の見解ではないかもしれませんが、これらの定期的な広範な調査は、指を離さないために重要です。業界の動向について。
今年のレポートには、「地政学とトレーニング コスト、AI システムの環境への影響、K-12 AI 教育、AI に関する世論の傾向など、基盤モデルに関する新しい分析」に加えて、新たに 100 か国の政策を考察する内容が含まれています。
最高レベルの要点については、ここで箇条書きにしましょう。
- AI の開発は、過去 10 年間で学界主導から産業界主導へと大幅に変化しており、これは変化の兆しを見せていません。
- 従来のベンチマークでモデルをテストすることが難しくなりつつあり、新しいパラダイムが必要になる可能性があります。
- AI のトレーニングと使用のエネルギー フットプリントはかなりのものになっていますが、それが他の場所でどのように効率を高めるかはまだわかっていません。
- 「AI の事件と論争」の数は、2012 年以来 26 倍に増加しており、実際には少し低いように見えます。
- AI 関連のスキルや求人情報は増加していますが、思ったほど速くはありません。
- しかし、政策立案者は、最終的な AI 法案を作成しようとして、自分自身を挫折させています。
- 投資は一時的に停滞していますが、それは過去 10 年間の天文学的な増加の後です。
- 中国、サウジアラビア、インドの回答者の 70% 以上が、AI には欠点よりも利点の方が多いと感じています。 アメリカ人? 35%。
しかし、レポートは多くのトピックとサブトピックについて詳しく説明しており、非常に読みやすく、技術的ではありません。 熱心な人だけが 300 ページを超える分析をすべて読むことができますが、実際には、やる気のある人なら誰でも読むことができます。
第 3 章「AI の技術的倫理」をもう少し詳しく見てみましょう。
バイアスと毒性を測定基準に還元することは困難ですが、これらのモデルを定義してテストできる限り、「フィルタリングされていない」モデルは問題のある領域に導きやすいことは明らかです。 命令のチューニング、つまり追加の準備レイヤー (非表示のプロンプトなど) を追加するか、モデルの出力を 2 番目のメディエーター モデルに渡すことは、この問題を改善するのに効果的ですが、完全にはほど遠いものです。
箇条書きで言及されている「AI のインシデントと論争」の増加は、次の図で最もよく示されています。
ご覧のとおり、傾向は上向きであり、これらの数値は、画像ジェネレーターの大幅な改善は言うまでもなく、ChatGPT やその他の大規模な言語モデルが主流に採用される前に達成されました. 26 倍の増加はほんの始まりにすぎません。
次の図に示すように、ある方法でモデルをより公平または公平にすることは、他の指標に予期しない結果をもたらす可能性があります。
レポートが指摘しているように、「特定の公平性ベンチマークでより優れたパフォーマンスを発揮する言語モデルは、より悪いジェンダーバイアスを持つ傾向があります.」 なぜ? 言うのは難しいですが、最適化が誰もが望むほど単純ではないことを示しています。 これらの大規模なモデルを改善するための簡単な解決策はありません。その理由の 1 つは、モデルがどのように機能するかを本当に理解していないためです。
ファクト チェックは、AI に自然に適合するように思われるドメインの 1 つです。Web の大部分をインデックス化した後、ステートメントを評価し、それらが真実の情報源によってサポートされているという信頼を返すことができます。 これは事実とはかけ離れています。 実際、AI は事実を評価するのが特に苦手であり、信頼できないチェッカーになるリスクはそれほど大きくありませんが、AI 自体が説得力のある誤った情報の強力な情報源になる可能性があります。 AI ファクト チェックをテストおよび改善するために、多くの研究とデータセットが作成されていますが、これまでのところ、多かれ少なかれ出発点にとどまっています。
幸いなことに、AI への関心が大幅に高まっています。AI を信頼できないと人々が感じれば、業界全体が後退するという明らかな理由があります。 ACM Conference on Fairness, Accountability, and Transparency では提出物が大幅に増加しており、NeurIPS では公平性、プライバシー、解釈可能性などの問題がより多くの注目とステージタイムを獲得しています。
これらのハイライトのハイライトは、テーブルに多くの詳細を残します. しかし、HAI チームはコンテンツの整理に優れた仕事をしてくれました。 ここで高レベルのものを熟読する あなたはできる 完全な論文をダウンロードする 興味をそそるトピックに深く入り込みます。