ベターデータプログラム可能な合成データを使用して実際のデータを安全に保つ、シンガポールを拠点とするスタートアップ企業である は、本日、155 万ドルを調達したと発表しました。 オーバーサブスクライブされたというシード ラウンドは Investible が主導し、Franklin Templeton、Xcel Next、Singapore University of Technology and Design、Bon Auxilium、Tenity、Plug and Play、Entrepreneur First が参加した。
このスタートアップは、世界中でデータ保護規制が強化される中、データ共有をより迅速かつ安全にすることを目標に、最高経営責任者(CEO)でありチーフ テクノロジストの Kevin Yee 博士である Uzair Javaid 博士によって 2021 年に設立されました。 同社は現在、シンガポールと米国の 2 つの主要な大学と研究開発パートナーシップを結んでおり (彼らが誰であるかは公開できません)、顧客には上海浦東発展銀行が含まれます。
Betterdata は、データの匿名化を使用してデータを破壊する従来のデータ共有方法とは異なり、代わりに生成 AI とプライバシー エンジニアリングを利用していると述べています。
Yee氏はTechCrunchに対し、プログラムによる合成データは、ディープフェイクで使用される敵対的生成モデル、ChatGPTで使用されるトランスフォーマー、安定拡散で使用される拡散モデルなどのディープラーニングモデルなどの生成モデルを使用して、新しいデータセットを作成および拡張していると説明しました。
これらの合成データセットは、個人に関する機密情報や個人情報を開示することなく、現実世界のデータと同様の特性と構造を持っています。
「アイデアは、機密データの保護、バイアスの軽減、機械学習モデルの改善など、さまざまな目的で安全に使用できる実際のデータセットの架空のバージョンを作成することです」と彼は言いました。
プログラムによる合成データは、多くの点で開発者に役立ちます。 いくつかの例には、機密データの保護、GDPR や HIPAA などのデータ保護規制への準拠、チーム間のデータ可用性の向上、機械学習モデルのトレーニング、テスト、検証のためのデータの作成、過小評価されたグループの記録を増やすことによるデータの不均衡の問題への対処などがあります。またはクラス。
Betterdata の資金は、製品の発売に使用され、単一テーブル、複数テーブル、および時系列データセットのサポートを含む、プログラム可能な合成データ技術スタックを強化するために使用されます。 これらは表形式のデータセットのさまざまなバリエーションであり、主な違いはそれらの構造と対処するために作成された問題であると Yee は説明します。
たとえば、単一テーブルのデータセットはスタンドアロンのテーブルに焦点を当てていますが、複数テーブルのデータセットは複数のテーブル間の関係を考慮することを目的としており、時系列データセットは時間の経過とともに収集されたデータを扱います。
Betterdata はまた、販売およびマーケティングの従業員を含むより多くの人員を雇用し、今後 1 ~ 2 年でシンガポールを超えてアジア太平洋地域に拡大することを計画しています。
インベスティブルの投資に関する声明の中で、プリンシパルのカイル・レジャルは次のように述べています。 Betterdata はその強力なプラットフォームを通じて、品質とプライバシーを損なうことなく現実世界のデータを模倣する合成データを生成し、企業がグローバルなコンプライアンスとプライバシー法を大規模に満たすのを支援します。」