顔を追跡する「イヤラブル」、アナログ AI チップ、加速する粒子加速器

Kyle Wiggers は TechCrunch のシニアレポーターで、人工知能に特に関心があります。彼の著作は、VentureBeat や Digital Trends に掲載されているほか、Android Police、Android Authority、Droid-Life、XDA-Developers などのさまざまなガジェットブログにも掲載されています。彼はピアノの教育者であるパートナーと一緒にブルックリンに住んでおり、彼自身もピアノに手を出しています。ときどき – ほとんどが失敗した場合。

この寄稿者によるその他の投稿

新しいホワイトハウス指令は、税金で資金提供された研究への無料アクセスを要求します
最近従業員をレイオフしたサプライチェーンのスタートアップ、FourKites が 3,000 万ドルを調達

機械学習と AI の分野の研究は、今やほとんどすべての業界や企業で重要な技術となっていますが、そのすべてを読むには膨大な量の研究が行われています。このコラム、パーセプトロンは、最も関連性の高い最近の発見と論文のいくつかを収集することを目的としており、特に人工知能に限定されませんが、それらが重要な理由を説明します。

「耳に届くソナーを使って表情を読み取る」は、ここ数週間で注目を集めたプロジェクトの 1 つです。だからした ProcTHORは、実世界のロボットのトレーニングに使用できる環境を手続き的に生成するアレン人工知能研究所 (AI2) のフレームワークです。他のハイライトの中でも、Meta は AI を作成しましたシステム単一のアミノ酸配列からタンパク質の構造を予測することができます。そしてMITの研究者が新たに開発したハードウェア彼らは、より少ないエネルギーで AI の計算を高速化できると主張しています。

Cornell のチームによって開発された「earable」は、かさばるヘッドフォンのように見えます。スピーカーは着用者の顔の側面に音響信号を送信し、マイクは鼻、唇、目、およびその他の顔の特徴によって生成されるかろうじて検出可能なエコーを拾います。これらの「エコープロファイル」により、イヤラブルは、眉を上げる、目の動きなどの動きをキャプチャでき、AI アルゴリズムが完全な表情に変換します。

画像クレジット: コーネル

earable にはいくつかの制限があります。バッテリーで 3 時間しか持続せず、処理をスマートフォンにオフロードする必要があり、エコー翻訳 AI アルゴリズムは、表情の認識を開始する前に 32 分間の顔データでトレーニングする必要があります。しかし、研究者たちは、映画、テレビ、ビデオゲームのアニメーションで従来使用されていたレコーダーよりもはるかに洗練された体験であると主張しています. たとえば、ミステリーゲーム LA Noire の場合、Rockstar Games は各俳優の顔に 32 台のカメラをトレーニングするリグを構築しました。

おそらくいつの日か、コーネルのイヤーラブルを使用して、ヒューマノイドロボットのアニメーションを作成できるようになるでしょう。しかし、これらのロボットは、まず部屋を移動する方法を学ばなければなりません。幸いなことに、AI2 の ProcTHOR はこの方向に (しゃれではなく) 一歩踏み出し、シミュレートされたロボットがオブジェクトを拾ったり、家具の周りを移動したりするなどのタスクを完了する必要がある教室、図書館、オフィスなど、何千ものカスタムシーンを作成します。

照明をシミュレートし、大量の表面素材 (木材、タイルなど) と家庭用オブジェクトのサブセットを含む舞台裏のアイデアは、シミュレートされたロボットを可能な限り多様なものにさらすことです。シミュレートされた環境でのパフォーマンスが現実世界のシステムのパフォーマンスを向上させることができるというのは、AI で確立された理論です。 Alphabet の Waymo のような自動運転車企業は、近所全体をシミュレートして、実際の車の挙動を微調整しています。

画像クレジット: アレン人工知能研究所

ProcTHOR に関しては、AI2 は論文の中で、トレーニング環境の数をスケーリングすると一貫してパフォーマンスが向上すると主張しています。これは、家庭、職場、その他の場所で使用されるロボットにとって良い兆候です。

もちろん、これらのタイプのシステムをトレーニングするには、多くの計算能力が必要です。しかし、それは永遠にそうではないかもしれません。 MIT の研究者は、「ニューロン」と「シナプス」の超高速ネットワークを作成するために使用できる「アナログ」プロセッサを作成したと述べています。これを使用して、画像の認識、言語の翻訳などのタスクを実行できます。

研究者のプロセッサは、アレイ状に配置された「プロトンプログラム可能な抵抗器」を使用して、スキルを「学習」します。抵抗器の電気コンダクタンスの増減は、学習プロセスの一部である脳内のニューロン間のシナプスの強化と弱体化を模倣します。

コンダクタンスは、プロトンの動きを支配する電解質によって制御されます。より多くの陽子が抵抗器のチャネルに押し込まれると、コンダクタンスが増加します。プロトンが取り除かれると、コンダクタンスは減少します。

コンピューター回路基板上のプロセッサ

無機材料であるリンケイ酸ガラスは、MIT チームのプロセッサを非常に高速にします。これは、ナノメートルサイズの細孔が含まれており、その表面がタンパク質の拡散に最適な経路を提供するためです。追加の利点として、ガラスは室温で動くことができ、細孔に沿って移動するタンパク質によって損傷を受けません.

「アナログプロセッサを手に入れたら、他の人が取り組んでいるネットワークをトレーニングする必要はなくなります」と、筆頭著者で MIT ポスドクの Murat Onen 氏はプレスリリースで述べていると引用されています。「あなたは、他の誰にもできない前例のない複雑さでネットワークをトレーニングすることになるため、それらすべてを大幅に凌駕します。つまり、これは速い車ではなく、宇宙船です。」

加速といえば、機械学習が活用され始めています少なくとも実験的な形での粒子加速器の管理. ローレンスバークレー国立研究所の 2 つのチームは、マシン全体とビームの ML ベースのシミュレーションが、通常の統計分析よりも 10 倍も優れた高精度の予測を提供することを示しました。

画像クレジット: トール・スウィフト/バークレー研究所

「変動を上回る精度でビームの特性を予測できれば、その予測を使用して加速器の性能を向上させることができます」とラボの Daniele Filippetto 氏は述べています。関連するすべての物理学と機器をシミュレートすることは簡単なことではありませんが、驚くべきことに、さまざまなチームが初期の努力で有望な結果をもたらしました。

そして、オークリッジ国立研究所では、AI を搭載したプラットフォームにより、中性子散乱を使用してハイパースペクトル CT を実行し、最適なものを見つけています… 彼らに説明させた方がいいかもしれません.

医療の世界では、神経学の分野で機械学習ベースの画像分析の新しいアプリケーションがあり、ユニバーシティカレッジロンドンの研究者がモデルをトレーニングして、てんかんの原因となる脳病変の初期兆候を検出する.

UCL アルゴリズムのトレーニングに使用される脳の MRI。

薬剤耐性てんかんのよくある原因の 1 つは、限局性皮質異形成として知られているものです。これは、異常に発達した脳の領域ですが、何らかの理由で MRI では明らかに異常に見えません。それを早期に検出することは非常に役立つ可能性があるため、UCL チームは、健康で FCD に影響を受けた脳領域の何千もの例で、Multicenter Epilepsy Lesion Detection と呼ばれる MRI 検査モデルをトレーニングしました。

モデルは、表示された FCD の 3 分の 2 を検出できました。これは、兆候が非常に微妙であるため、実際には非常に優れています。実際、医師がFCDを見つけることができなかった178のケースが見つかりました。当然のことながら、最終的な決定権は専門家に委ねられますが、何かが間違っている可能性があることを示唆するコンピューターが、より詳細に調べて自信を持って診断するのに必要なすべてである場合があります。

「解釈可能で、医師の意思決定に役立つ AI アルゴリズムの作成に重点を置いています。 MELD アルゴリズムがどのように予測を行ったかを医師に示すことは、そのプロセスの重要な部分でした」と UCL の Mathilde Ripart 氏は述べています。

顔を追跡する「イヤラブル」、アナログ AI チップ、加速する粒子加速器 – TechCrunch

コメントするコメントをキャンセル

コメントする コメントをキャンセル

コメントするコメントをキャンセル