機械学習と AI の分野の研究は、今やほとんどすべての業界や企業で重要な技術となっていますが、そのすべてを読むには膨大な量の研究が行われています。 このコラム、パーセプトロンは、最も関連性の高い最近の発見と論文のいくつかを収集することを目的としており、特に人工知能に限定されませんが、それらが重要な理由を説明します。
「耳に届くソナーを使って表情を読み取る」は、ここ数週間で注目を集めたプロジェクトの 1 つです。 だからした ProcTHORは、実世界のロボットのトレーニングに使用できる環境を手続き的に生成するアレン人工知能研究所 (AI2) のフレームワークです。 他のハイライトの中でも、Meta は AI を作成しました システム 単一のアミノ酸配列からタンパク質の構造を予測することができます。 そしてMITの研究者が新たに開発した ハードウェア 彼らは、より少ないエネルギーで AI の計算を高速化できると主張しています。
Cornell のチームによって開発された「earable」は、かさばるヘッドフォンのように見えます。 スピーカーは着用者の顔の側面に音響信号を送信し、マイクは鼻、唇、目、およびその他の顔の特徴によって生成されるかろうじて検出可能なエコーを拾います。 これらの「エコー プロファイル」により、イヤラブルは、眉を上げる、目の動きなどの動きをキャプチャでき、AI アルゴリズムが完全な表情に変換します。
earable にはいくつかの制限があります。 バッテリーで 3 時間しか持続せず、処理をスマートフォンにオフロードする必要があり、エコー翻訳 AI アルゴリズムは、表情の認識を開始する前に 32 分間の顔データでトレーニングする必要があります。 しかし、研究者たちは、映画、テレビ、ビデオゲームのアニメーションで従来使用されていたレコーダーよりもはるかに洗練された体験であると主張しています. たとえば、ミステリー ゲーム LA Noire の場合、Rockstar Games は各俳優の顔に 32 台のカメラをトレーニングするリグを構築しました。
おそらくいつの日か、コーネルのイヤーラブルを使用して、ヒューマノイド ロボットのアニメーションを作成できるようになるでしょう。 しかし、これらのロボットは、まず部屋を移動する方法を学ばなければなりません。 幸いなことに、AI2 の ProcTHOR はこの方向に (しゃれではなく) 一歩踏み出し、シミュレートされたロボットがオブジェクトを拾ったり、家具の周りを移動したりするなどのタスクを完了する必要がある教室、図書館、オフィスなど、何千ものカスタム シーンを作成します。
照明をシミュレートし、大量の表面素材 (木材、タイルなど) と家庭用オブジェクトのサブセットを含む舞台裏のアイデアは、シミュレートされたロボットを可能な限り多様なものにさらすことです。 シミュレートされた環境でのパフォーマンスが現実世界のシステムのパフォーマンスを向上させることができるというのは、AI で確立された理論です。 Alphabet の Waymo のような自動運転車企業は、近所全体をシミュレートして、実際の車の挙動を微調整しています。
ProcTHOR に関しては、AI2 は論文の中で、トレーニング環境の数をスケーリングすると一貫してパフォーマンスが向上すると主張しています。 これは、家庭、職場、その他の場所で使用されるロボットにとって良い兆候です。
もちろん、これらのタイプのシステムをトレーニングするには、多くの計算能力が必要です。 しかし、それは永遠にそうではないかもしれません。 MIT の研究者は、「ニューロン」と「シナプス」の超高速ネットワークを作成するために使用できる「アナログ」プロセッサを作成したと述べています。これを使用して、画像の認識、言語の翻訳などのタスクを実行できます。
研究者のプロセッサは、アレイ状に配置された「プロトン プログラム可能な抵抗器」を使用して、スキルを「学習」します。 抵抗器の電気コンダクタンスの増減は、学習プロセスの一部である脳内のニューロン間のシナプスの強化と弱体化を模倣します。
コンダクタンスは、プロトンの動きを支配する電解質によって制御されます。 より多くの陽子が抵抗器のチャネルに押し込まれると、コンダクタンスが増加します。 プロトンが取り除かれると、コンダクタンスは減少します。
無機材料であるリンケイ酸ガラスは、MIT チームのプロセッサを非常に高速にします。これは、ナノメートル サイズの細孔が含まれており、その表面がタンパク質の拡散に最適な経路を提供するためです。 追加の利点として、ガラスは室温で動くことができ、細孔に沿って移動するタンパク質によって損傷を受けません.
「アナログ プロセッサを手に入れたら、他の人が取り組んでいるネットワークをトレーニングする必要はなくなります」と、筆頭著者で MIT ポスドクの Murat Onen 氏はプレス リリースで述べていると引用されています。 「あなたは、他の誰にもできない前例のない複雑さでネットワークをトレーニングすることになるため、それらすべてを大幅に凌駕します。 つまり、これは速い車ではなく、宇宙船です。」
加速といえば、機械学習が活用され始めています 少なくとも実験的な形での粒子加速器の管理. ローレンス バークレー国立研究所の 2 つのチームは、マシン全体とビームの ML ベースのシミュレーションが、通常の統計分析よりも 10 倍も優れた高精度の予測を提供することを示しました。
「変動を上回る精度でビームの特性を予測できれば、その予測を使用して加速器の性能を向上させることができます」とラボの Daniele Filippetto 氏は述べています。 関連するすべての物理学と機器をシミュレートすることは簡単なことではありませんが、驚くべきことに、さまざまなチームが初期の努力で有望な結果をもたらしました。
そして、オークリッジ国立研究所では、AI を搭載したプラットフォームにより、中性子散乱を使用してハイパースペクトル CT を実行し、最適なものを見つけています… 彼らに説明させた方がいいかもしれません.
医療の世界では、神経学の分野で機械学習ベースの画像分析の新しいアプリケーションがあり、ユニバーシティ カレッジ ロンドンの研究者がモデルをトレーニングして、 てんかんの原因となる脳病変の初期兆候を検出する.
薬剤耐性てんかんのよくある原因の 1 つは、限局性皮質異形成として知られているものです。これは、異常に発達した脳の領域ですが、何らかの理由で MRI では明らかに異常に見えません。 それを早期に検出することは非常に役立つ可能性があるため、UCL チームは、健康で FCD に影響を受けた脳領域の何千もの例で、Multicenter Epilepsy Lesion Detection と呼ばれる MRI 検査モデルをトレーニングしました。
モデルは、表示された FCD の 3 分の 2 を検出できました。これは、兆候が非常に微妙であるため、実際には非常に優れています。 実際、医師がFCDを見つけることができなかった178のケースが見つかりました。 当然のことながら、最終的な決定権は専門家に委ねられますが、何かが間違っている可能性があることを示唆するコンピューターが、より詳細に調べて自信を持って診断するのに必要なすべてである場合があります。
「解釈可能で、医師の意思決定に役立つ AI アルゴリズムの作成に重点を置いています。 MELD アルゴリズムがどのように予測を行ったかを医師に示すことは、そのプロセスの重要な部分でした」と UCL の Mathilde Ripart 氏は述べています。