AI の 1 週間: Apple が機械学習に取り組む

AI のように急速に変化する業界に追いつくのは至難の業です。そこで、AI がそれをやってくれるようになるまで、機械学習の世界に関する先週の記事と、単独では取り上げなかった注目すべき研究や実験を簡単にまとめておきます。

先週、Apple は非常に目に見えて、意図を持って超競争の激しい AI 競争に全力を尽くしたと言えるでしょう。同社がこれまでに AI への投資と優先順位付けを表明していなかったわけではありません。しかし、Apple は WWDC イベントで、今後発売されるハードウェアとソフトウェアの両方の機能の多くに AI が組み込まれていることを十分に明らかにしました。

たとえば、今年後半に登場する予定の iOS 17 では、コンピュータービジョンを使用して iPhone の写真から似た料理のレシピを提案できます。 AI は、他のアプリのアクティビティに基づいてパーソナライズされた提案を行う新しいインタラクティブな日記である Journal も強化しています。

iOS 17 には、AI モデルを活用したアップグレードされたオートコレクトも搭載されており、ユーザーが次に使用する可能性のある単語やフレーズをより正確に予測できます。時間が経つにつれて、カスタマイズされ、ユーザーが最も頻繁に使用する単語 (汚い言葉など) を楽しく学習します。

AI は、Apple の Vision Pro 拡張現実ヘッドセット、特に Vision Pro の FaceTime の中核でもあります。機械学習を使用して、Vision Pro は着用者の仮想アバターを作成し、皮膚の緊張や筋肉の働きに至るまで、あらゆる範囲の顔の歪みを補間します。

画像クレジット: りんご

それは、間違いなく今日最も注目されている AI のサブカテゴリーである生成 AI ではないかもしれません。しかし、Apple の意図は、ある種の復活を遂げること、つまり、圧倒的な Siri から生産地獄の自動運転車に至るまで、長年苦戦してきた機械学習プロジェクトを経て、Apple が過小評価されるべきものではないことを示すことであったように私には思えます。

強みの投影は単なるマーケティング戦略ではありません。 Appleの歴史的なAI分野での業績不振が深刻な頭脳流出を招いていると、The Informationが報じた。報告 OpenAI の ChatGPT の基礎となる技術に取り組んでいたチームを含む、才能ある機械学習科学者たちが Apple を離れ、より緑豊かな牧草地を目指したということです。

実際にAIに本気で取り組んでいることを示す運送 AI を組み込んだ製品は必要な動きのように感じられますが、実際、Apple の競合他社の一部は最近この基準を満たすことができませんでした。 (ここにあります探しているメタさん、あなたに向かって。) どう見ても、Apple は先週、特に大騒ぎしていなかったとしても、進出を果たしました。

過去数日間の他の注目すべき AI のヘッドラインは次のとおりです。

Meta は音楽ジェネレーターを作成します。 負けないように Google の提供により、Meta は独自の AI を活用した音楽ジェネレーターをリリースしました。そして Google とは異なり、それをオープンソース化しました。呼ばれたミュージックジェネMeta の音楽生成ツールを使用すると、テキストによる説明を約 12 秒の音声に変換できます。
規制当局は AI の安全性を検査します。 先週の英国政府の発表を受けて今秋に「世界的な」AI安全性サミットを主催する予定であることを明らかにしたほか、OpenAI、Google DeepMind、Anthropicは、評価と安全性の研究を支援するために自社のAIモデルへの「早期または優先アクセス」を提供することを約束した。
AI とクラウドの出会い: Salesforce は、非常に競争の激しい AI 分野での地位を強化することを目的とした新しい製品スイートを発売します。 AI Cloudと呼ばれるこのスイートには、「エンタープライズ対応」AIを提供するために設計されたツールが含まれており、AI機能で製品ポートフォリオを強化するSalesforceの最新の分野横断的な試みである。
テキストからビデオへの AI のテスト: TechCrunchは、テキストから短いビデオクリップを生成するRunwayのAIであるGen-2を実際に使ってみた。評決？この技術が映画品質の映像の生成に近づくまでには長い道のりがあります。
エンタープライズ AI にさらに多くの資金を投入: 生成型 AI のスタートアップには潤沢な資金があることを示しています。密着企業向けの AI モデルエコシステムを開発しているは先週、シリーズ C ラウンドの一環として 2 億 7,000 万ドルを調達したと発表しました。
GPT-5 はありません: OpenAIは依然としてGPT-5のトレーニングを行っていない、とOpenAIの最高経営責任者（CEO）サム・アルトマン氏はエコノミック・タイムズ主催の最近のカンファレンスで述べた――多くの業界幹部らがマイクロソフト支援のスタートアップが「しばらくは」GPT-4の後継に取り組まないと約束してから数カ月後そして学者らは懸念を表明したアルトマンの大規模言語モデルによる進歩の速さについて。
WordPress 用 AI ライティングアシスタント: 自動WordPress.com を運営する会社であり、オープンソース WordPress プロジェクトへの主要な貢献者である同社は、先週の火曜日に人気のコンテンツ管理システム用の AI アシスタントを発表しました。
Instagram がチャットボットを獲得: 画像によると、インスタグラムはAIチャットボットの開発に取り組んでいる可能性がある漏れたアプリ研究者のアレッサンドロ・パルッツィ氏による。リーク情報によると、出荷されるかどうかにかかわらず、進行中のアプリ開発が反映されており、これらの AI エージェントは質問に答えたり、アドバイスを与えたりすることができます。

その他の機械学習

AI が今後数年間で科学や研究にどのような影響を与えるか知りたい場合は、6 つの国立研究所のチームが昨年実施されたワークショップに基づいて、まさにそのことについてのレポートを作成しました。事態が急速に進んだ今年ではなく、昨年の傾向に基づいているため、この報告書はすでに時代遅れになっているのではないか、と言いたくなる人もいるかもしれない。しかし、ChatGPT はテクノロジーと消費者の意識に大きな波をもたらしましたが、実際のところ、本格的な研究には特に関連性がありません。より大規模なトレンドはそうであり、異なるペースで進んでいます。 200 ページの報告書は決して読みやすいものではありませんが、各セクションは分かりやすい部分に分かれているので便利です。

国立研究所エコシステムの他の場所でも、ロスアラモスの研究者たちは熱心に取り組んでいます。メモリスタの分野を前進させる、私たち自身のニューロンと同じように、データの保存と処理を組み合わせています。これは計算に対する根本的に異なるアプローチであり、研究室の外ではまだ成果を上げていませんが、この新しいアプローチは少なくともボールを前進させるように見えます。

AIの言語解析機能が展示されています警察が引き止めた人々とのやり取りについて報告する。自然言語処理は、特に黒人男性の場合、停車のエスカレーションを予測する言語パターンを特定するためのいくつかの要素の 1 つとして使用されました。人間と機械の学習方法は相互に強化し合います。 (ここで論文を読む。）

画像クレジット: シリル・ヴェルドン / ルノー・デフランチェスコ BUREAU 141 / EPFL

深呼吸これは、スイスとブラジルの患者から採取した呼吸の記録に基づいてトレーニングされたモデルで、EPFL の作成者らは、呼吸状態の早期発見に役立つと主張しています。計画では、スピンアウトした会社の下で、ニューモスコープと呼ばれるデバイスでそれを世に出すことです。ワンスコープ。おそらく、会社の業績についての詳細を知るために彼らにフォローアップすることになるでしょう。

AI による健康に関するもう 1 つの進歩は、研究者が次のようなソフトウェアを開発したパーデューから来ています。スマートフォンのカメラでハイパースペクトル画像を近似します、血中ヘモグロビンやその他の指標の追跡に成功しました。これは興味深い技術です。携帯電話の超スローモーションモードを使用すると、画像内のすべてのピクセルに関する多くの情報が取得され、モデルに推定に十分なデータが与えられます。特別なハードウェアを使わずにこの種の健康情報を取得できる優れた方法になる可能性があります。

画像クレジット: マサチューセッツ工科大学

私は自動操縦装置が回避操作を行うとはまだ信じていませんが、MIT は研究によって技術の実現に少しずつ近づいています。 AI は望ましい飛行経路を維持しながら障害物を回避するのに役立ちます。古いアルゴリズムはクラッシュしないように方向を大幅に変更することを提案できますが、安定性を維持し、内部で何もパルプ化しないようにしながらそれを行うのはより困難です。チームは、安定性を損なうことなく自律的にトップガンのような操縦を実行するシミュレートされたジェット機を取得することに成功しました。それは思っているよりも難しいです。

今週の最後は Disney Research で、映画製作やテーマパークの運営にもたまたま当てはまる興味深い内容を紹介してくれると期待されています。 CVPR で彼らは次のことを披露しました。強力かつ多用途な「顔ランドマーク検出ネットワーク」より任意の基準点を使用して顔の動きを継続的に追跡できます。モーションキャプチャは、小さなキャプチャドットなしでもすでに機能していますが、これにより、さらに高品質になり、俳優にとってより威厳のあるものになるはずです。

その他の機械学習

コメントする コメントをキャンセル

コメントするコメントをキャンセル