テスラの人工知能チームは、金曜日の夜、同社の第 2 回年次 AI Day のステージに上がり、自律型ロボットと車両の研究がどこまで進んだかを示しました。 Tesla AI Day 2022 では、ステージを歩き回る Optimus ロボット、自動運転ソフトウェアの最新情報、Tesla の AI 研究を強化する Dojo ハードウェアを初めて紹介しました。
当初は 6 月に予定されていた、テスラ CEO のイーロン マスク ショーケースを遅らせた オプティマスのプロトタイプが機能するようになるまで、9 月までお待ちください。 「このイベントは AI & ロボティクス エンジニアを募集することを目的としているため、非常に技術的なものになります。」 マスクは木曜日にツイートした. テスラボットは「友好的」であるというマスクのスタンスを反映して、テスラはアニメーションをツイートしました 人間の心のシンボルを形成するロボットの手.
イベントは、CEO イーロン マスクによる短い基調講演で始まり、Optimus の最新バージョンの簡単なデモが中断されました。Optimus には多くの露出部分がありましたが、テザーなしで手を振ってステージを歩き回っていました。 昨年とは大分違いますね 初の AI デー、人間の場合 ステージをうろうろした オプティマスの衣装で。 しかし、オプティマスがイーロン・マスクが信じている超能力の自律ヘルパーになる前に、やるべきことはたくさんあります。
「オプティマスの経済効果は2倍 [of people,]マスク氏はステージ上でこう語った。
さらに良いことに、Optimus は 3 年から 5 年で売りに出される可能性がある、と Musk は語った。
その夜は、オプティマスに対するマスクの高い期待以上のものを持っていました。 エンジニアは、ロボットを動き回らせ、人間のように物事を認識させるための設計上の課題について説明しました。 次に、Autopilot 自動運転ソフトウェアの背後にあるチームのテスラの研究者は、高速道路をナビゲートする Autopilot をより複雑な街路に導く完全自動運転 (FSD) ソフトウェアの進歩について説明しました。 最後に、何百ものチップを積み上げたハードウェア キャビネットが来年初めに到着し始めると、Dojo が実際に何ができるかを明らかにしたハードウェア関係者が登場しました。
Tesla AI Day 2022 で学んだことは次のとおりです。
テスラ ボットは自力で歩き、手を振る
昨年の AI Day のコンセプト アートで思い描いた最終バージョンにはまだほど遠いですが、Optimus の実用的なバージョンがついに発表されました。 重量 73kg、2.3kWh のバッテリーをサーボ露出シャーシに搭載し、サードパーティのアクチュエーターを使用して、自力で歩き回り、手を振っていました。
テスラ製のアクチュエーターで胴体と手足を覆う金属製のケーシングを備えたより洗練されたモデルであるオプティマスの次のバージョンは、聴衆をからかうために運ばれましたが、開発段階では自力で動くには十分ではなく、単に手を振っていました。 マスク氏が夜通し頻繁に語ったように、彼らの目標は「できるだけ早くロボットを製造し、できるだけ早く使えるようにすること」です。
はい、オプティマスはキャットガールモデルで登場します
オプティマスを明らかにした直後、そして彼のチームがテスラのプレゼンテーションを続けている間、彼が舞台裏にいたとき、文字通り、 マスク氏がツイート 「当然、オプティマス ロボットのキャットガール バージョンが存在します。」 2 番目の返信のツイートでは、前景に女性のアクション フィギュアの写真が表示されました。おそらくゼロ スーツ サムスであると、この筆者は推測しています。その後ろには、女性のヒューマノイドのような形をしたロボット シャーシが何列も何列も並んでいます。
Musk が本気であるかどうかはわかりませんが、Q&A 期間中の質問に答えて、彼は Optimus のさまざまな外観がある可能性があることをほのめかしました。 「私たちはオプティマスの本当に楽しいバージョンを作りたいと思っています」とマスクは言いました。 「さまざまな方法でロボットの皮をむくことができます。」
完全自動運転のベータ ユーザー数が 160,000 人に増加
テスラの Autopilot チームは、完全自動運転 (FSD) がどれだけ進歩したかを説明しました。これは、昨年の 2,000 人のテスラ ドライバーから これまでのところ、2022 年に 160,000. まだ米国とカナダでのみ利用可能ですが、Musk 氏は、拡大するすべての国で規制の問題がなければ、テスラが年末までに FSD ベータ版を世界的に公開することは技術的に可能であると主張しました.
ショー アンド テル セッションで、Tesla のエンジニアは、車両の意思決定機能をミリ秒単位から 100 マイクロ秒まで高速化した方法を説明しました。これは 10 倍の速さです。 チームは、FSD の技術が 3D ジオメトリでマッピングされたテスラの周囲の世界をどのように見て、周囲にあるものに基づいて選択を行うかを示しました。
これらの選択を行うように FSD モデルをトレーニングすることも、並大抵のことではありません。 テスラは、Dojo スーパーコンピューティング プラットフォームとしても知られる 3 台のスーパーコンピューターを組み合わせて、現在 14,000 個の GPU (トレーニング用に 10,000 個、ラベリング用に 4,000 個) で構成されています。 希少な GPU を見つけるのに苦労している場合、そのうちのいくつかは Tesla に移行した可能性があります。
他のテスラ エンジニアは、道路の車線を認識するためだけにニューラル ネットワーク全体を作成するなど、風変わりなトピックについて説明しました。 彼らの初期の画像ベースのモデルは、車が走行している車線と左右の車線を識別することができ、高速道路のような単純な道路では機能していましたが、チームは左折や右折などのより複雑な操作のためのシステムを作りたいと考えていました。車、バス、自転車、歩行者が複数の車線を横断しているにもかかわらず、交差点を通過します。
Dojo は GPU のスタックよりも高速です
テスラは巨大な、 Dojo と呼ばれる特注のハードウェア スタック 同社の車がピックアップして会社に送信するすべてのビデオで AI をトレーニングします。 AI チームが 30 ペタバイトの映像保管庫をかき回すために必要なパフォーマンスを得るために、Tesla はハードウェアを密に詰め込みました。
エンジニアが説明したように、25 個の Dojo ダイ (D1 と呼ばれる) のスタックが 1 つのタイルに集められ、6 つの市販の GPU ボックスを置き換えることができます。 20 枚のカードに分割された 640 GB の DRAM とペアになった 6 枚のタイルからなるシステム トレイは、わずか 75 mm の高さ (つまり約 10 台の iPhone 14 を積み重ねた状態)、重量は 135 kg で、54 ペタフロップス (54 京浮動小数点) の計算能力を備えています。 1 秒あたりの操作数。
これらのトレイのうちの 2 つがキャビネット (ExaPOD と呼ばれる) に配置され、浮かせておくために必要なすべての電源が搭載されています。 昨年のテストでは、エンジニアがキャビネットを 2 メガワット以上に押し上げて変電所を作動させ、市から電話を受けたほどの深刻な電力消費にもかかわらず、彼らは熱膨張係数 (CTE) を下げることができました。熱管理効率の 3 倍。
オフザラックのパフォーマンスと比較すると、標準プロセスは 25 個の D1 ダイのスタックで 5 マイクロ秒かかりますが、24 個の GPU のスタックで 150 マイクロ秒かかります。
これは、これらのデバイスの第 1 世代にすぎません。 テスラは、2023 年の第 1 四半期までに最初の ExaPOD を構築し、さらに 6 つを構築する予定です。 しかし、次世代はより高度なハードウェアで 10 倍優れています。
テスラは、企業が AI を訓練するために Dojo を貸し出すことができます
テスラは確かに Dojo を構築し、それを統合して独自の AI をトレーニングすることになるでしょうが、AI Day の聴衆メンバーからの質問に応えて、Musk は、同社がカスタム キャビネットをビジネスとして販売することはおそらくないだろうと述べました。 代わりに、Tesla が Dojo でコンピューティング時間を販売する可能性があり、Amazon Web Services のように、彼は理論化しました。
「オンラインで利用でき、モデルをより速く、より少ない費用でトレーニングできる、使用できるサービスにするだけです」と Musk 氏は述べています。