自動運転車の開発者は当初、データの最大化について同様の哲学を持っていました。 これらは、車両内外の多数のカメラからのビデオ、マイクからの音声録音、LIDAR やレーダーからの空間内のオブジェクトのマッピングを行う点群、車両部品からの診断測定値、GPS 測定値などを生成します。
市場調査会社カウンターポイントで自動車技術を研究しているブレイディ・ワン氏は、多くのデータが収集されるほど自動運転システムがより賢くなると考える人もいたと語る。 しかし、データの量と複雑さによってデータを整理して理解することが困難だったため、このアプローチは常に機能するとは限りませんでした、とワン氏は言います。
近年では、企業は特に有用であると考えられるデータのみを保持し始め、それらを適切に整理することに重点を置くようになりました。 実際的に言えば、晴れた日に砂漠を 1 時間運転したデータは繰り返しに見える可能性があるため、すべてを保存する有用性が疑問視されています。
制限はまったく新しいものではありません。 Waymo の著名なソフトウェア エンジニアであるチャタム氏は、10 年以上前に会社が Google 内の小さなプロジェクトであり、彼も 1 人のチームだった頃、より多くのデジタル ストレージにアクセスするのは簡単ではなかったと語ります。 失敗した無人運転の記録など、明確な用途のないデータは削除されました。 「ストレージを無限として扱うと、コストは天文学的な金額になるでしょう」とチャタム氏は言います。
Waymo が多額の外部投資を受けて独立した会社になった後、プロジェクトはデータ ストレージをより自由に使い込むようになりました。 たとえば、ウェイモが 2019 年末にジャガー I ペイスのテストを開始したとき、クロスオーバー SUV には、より大規模な情報ストリームを生成するより強力なセンサーが搭載されていました。その結果、1 時間の運転のフルログは 1,100 ギガバイト以上に相当し、十分な量になりました。 240枚のDVDを埋めることができます。 Waymo は当時、ストレージ容量を大幅に増やしたため、チームは何を保持するかについてあまりこだわりを持たなくなったとチャタム氏は言います。
つい最近、チャタム氏のチームは厳しいノルマを設定し、社内の人々にもっと賢明になるよう求め始めた。 Waymo は現在、新しく生成されたデータの一部のみを保持しており、保存されたデータが現在のテクノロジー、条件、優先事項と比較して古くなったため、最近では削除し始めています。 チャタム氏は戦略がうまく機能していると語る。 「サービスが成長するにつれて、データの破棄を迅速に開始する必要があります」と彼は言います。
ウェイモ お金を払って乗客を乗せた 州規制当局への開示によると、昨年9月から11月のカリフォルニア州での走行距離は2万3000マイルを超え、わずか半年前の同様の期間の約1万3000マイルから増加した。
データの上限には、自動運転車企業の優先順位が考慮されている場合もあります。 チャタム氏のチームは、ある程度の交渉を許可して、車両の周囲にあるものを識別するための AI の開発 (認識) や、過去の乗車に照らして計画されたソフトウェアのアップデートのテスト (評価) など、さまざまなタスクに取り組むエンジニアのグループに四半期ごとのストレージ割り当てを割り当てています。 これらのチームは、緊急車両の行動に関するデータなど、保持する価値のあるものを決定し、自動化システムがそれ以外のものをすべて除外します。 「それはビジネス上の決定になります」とチャタム氏は言います。 「ビジネスにとって雪と雨のデータはどちらが重要ですか?」
Waymoがこれまでのところ雪上での走行データを限られたものしか取得していないため、今のところ雪の方が勝っている。 「私たちはすべての断片を保管しています」とチャタム氏は言います。 雨は面白くなくなってきました。 「雨は得意になったので、無限に行く必要はありません。」 データを節約することで、創造性や貴重な発見が促されることもあると彼は言います。 Waymo はある時点で、自社の降雨データに、駐車中に車両が収集したすべてのセンサーの測定値が不必要に含まれていることを知りました。