自動運転を安全に実現するには、車両を路上に出す前に発生する可能性のあるあらゆる状況について、ほぼ無限の時間にわたってソフトウェアをトレーニングする必要があります。 歴史的に、オートノミー企業はアルゴリズムをトレーニングするための実世界のデータを大量に収集してきましたが、実世界のデータだけに基づいて特殊なケースを処理する方法をシステムにトレーニングすることは不可能です。 それだけでなく、最初からすべてのデータを収集、分類、ラベル付けするのにも時間がかかります。
Cruise、Waymo、Waabi などのほとんどの自動運転車企業は、現実世界から収集されたデータでは不可能な速度と制御レベルで、知覚モデルのトレーニングとテストに合成データを使用しています。 パラレル ドメインは、自律型企業向けのデータ生成プラットフォームを構築したスタートアップであり、合成データは、視覚および認識システムを強化し、物理世界の予測不可能性に備える AI をスケーリングするための重要なコンポーネントであると述べています。
このスタートアップは、3,000 万ドルのシリーズ B をクローズしたところです。 リターン投資家の Costanoa Ventures、Foundry Group、Calibrate Ventures、Ubiquity Ventures が参加する March Capital。 Parallel Domain は自動車市場に重点を置いており、高度な運転支援システムを構築している大手 OEM や、より高度な自動運転システムを構築している自動運転企業に合成データを提供しています。 共同創設者兼 CEO の Kevin McNamara 氏によると、現在、Parallel Domain はドローンとモバイル コンピューター ビジョンに拡張する準備ができています。
「コンテンツ生成のためのジェネレーティブ AI アプローチにも力を入れています」と McNamara 氏は TechCrunch に語った。 「ジェネレーティブ AI の進歩をどのように利用して、より幅広い多様性のモノ、人、行動を私たちの世界にもたらすことができるでしょうか? 繰り返しになりますが、ここで難しいのは、物理的に正確なレンダラーを手に入れたら、車が遭遇する必要のある何百万もの異なるシナリオを実際にどのように構築するのかということです。」
McNamara 氏によると、このスタートアップはまた、北米、ヨーロッパ、アジアで拡大する顧客ベースをサポートするチームを雇いたいと考えています。
仮想世界の構築
2017 年に Parallel Domain が設立されたとき、スタートアップは現実世界の地図データに基づいて仮想世界を作成することに非常に重点を置いていました。 過去 5 年間、Parallel Domain は、車、人、1 日のさまざまな時間帯、天気、およびそれらの世界を興味深いものにするさまざまな行動で満たすことによって、世界の生成に追加してきました。 これにより、Parallel Domain がカウントする顧客が可能になります。 Google、Continental、Woven Planet、Toyota Research Institute が、ビジョンと認識システムを実際にトレーニングしてテストするために必要な動的なカメラ、レーダー、ライダー データを生成すると、McNamara 氏は述べています。
Parallel Domain の合成データ プラットフォームは、トレーニングとテストの 2 つのモードで構成されています。 トレーニングの際、顧客は高レベルのパラメーターを記述します。たとえば、50% の雨、20% の夜間、すべてのシーケンスで救急車がいる高速道路の運転など、モデルをトレーニングしたい場合、システムは数十万の例を生成して、それらのパラメータを満たします。
テスト側では、Parallel Domain が提供する API を使用して、顧客が世界で動的なものの配置を制御できるようにし、それをシミュレーターに接続して特定のシナリオをテストできます。
たとえば、Waymo は、合成データを使用してさまざまなテストを行うことに特に熱心です。 気象条件、と同社はTechCrunchに語った。 (免責事項: Waymo は、Parallel Domain の顧客として確認されているわけではありません。) Waymo は、天候を、現実世界とシミュレーションで走行したすべてのマイルに適用できる新しいレンズと見なしています。条件。
テストであろうとトレーニングであろうと、Parallel Domain のソフトウェアがシミュレーションを作成するたびに、シミュレートされた各エージェントに対応するラベルを自動的に生成できます。 これにより、機械学習チームは、データ自体にラベルを付けるという骨の折れるプロセスを経ることなく、教師あり学習とテストを行うことができます。
Parallel Domain は、自律型企業がトレーニングとテストのニーズのすべてではないにしても、ほとんどの場合に合成データを使用する世界を想定しています。 今日、合成データと現実世界のデータの比率は、企業によって異なります。 多くのデータを収集するための歴史的なリソースを持つより確立された企業は、ニーズの約 20% から 40% に対して合成データを使用していますが、製品開発プロセスの初期段階にある企業は、合成データに 80% を依存しているのに対し、現実世界は 20% です。マクナマラによると。
マーチ キャピタルのパートナーで、現在はパラレル ドメインの取締役の 1 人であるジュリア クライン氏は、機械学習の将来において合成データが重要な役割を果たすと考えていると述べています。
「コンピューター ビジョン モデルのトレーニングに必要な実世界のデータを取得することは、多くの場合、障害となります。そのデータを取得し、そのデータにラベルを付け、実際に配置できる位置に準備するという点で問題があります。クラインはTechCrunchに語った。 「私たちが Parallel Domain で見たのは、彼らがそのプロセスを大幅に促進し、実際のデータセットでは得られない可能性があることにも対処しているということです。」