基礎モデルとそれが達成できることについて考えるとき、テキストと画像の作成について考えている可能性があります。 ナンバーズステーションしかし、これらのモデルはまったく異なる方向に進んでいます。 本日、1,750 万ドルのシリーズ A ラウンドを発表したスタートアップは、これらのモデルを使用して、同社が「インテリジェント データ スタック自動化プラットフォーム」と呼ぶものを構築しています。 資金調達ラウンドは Madrona が主導し、Norwest Venture Partners、Factory、および Cloudera の共同創設者である Jeff Hammerbacher を含む多くのエンジェル投資家が参加しました。
Numbers Station は、スタンフォード大学の PhD である Chris Aberger (CEO)、Ines Chami (Chief Scientist)、Sen Wu がスタンフォード准教授の Chris Ré と共に設立したもので、GPT スタイルの基盤モデルの力をエンタープライズ ユース ケースに導入することを目的としています。そしてレコードマッチング。 これを行うために、同社はこれらの基盤モデルを使用して、たとえば自然言語クエリを SQL コマンドに変換します。
「私たちは皆、AI とデータ システムを組み合わせた分野で博士号を取得しています」と、Aberger 氏に会社の起源について尋ねたところ、こう答えました。 「当時、AI の才能のほとんどが、よりセクシーな AI アプリケーションに焦点を当てていました。より良い言葉はありませんでした。 ニュースで目にするすべてのもの: マーケティング コンテンツの生成、画像の生成など、あらゆるものです。 […] しかし、AI 人材のほとんどは、これらのダーティ データの配管、データ変更、データ ラングリング、データ準備操作に集中していませんでした。 データベースの日付を再フォーマットするつもりだと言うのは、画像を生成するほど魅力的ではありませんが、それは依然として企業にとって大きな問題であり、企業のニーズです。」
Aberger 氏はまた、チームが多くの企業内のさまざまなデータ中心のチームがどのように連携しているかを調べたところ、多くのさまざまな機能がさまざまなチームに閉じ込められていましたが、これらのチームは日常的なデータ変換作業に多くの時間を費やしています。より複雑なユースケースを可能にするために必要です。 彼は、Numbers Station とそれを支える基盤モデルが、これらの機能へのアクセスを民主化できると信じています。
「大まかに言えば、私たちの使命は、これらのチームを加速し、データ アナリスト チームを加速することです。そうすることで、彼らは洞察を得るために多くの時間を費やし、これらの平凡なデータ操作に費やす時間を減らすことができます」と Aberger 氏は説明します。
実際には、これはサービスが現在 3 つの異なる機能を提供していることを意味します。 1 つ目は SQL 変換です。これにより、ユーザーは必要なものを自然言語で指定でき、Numbers Station が SQL クエリを生成します。 もう 1 つは、同社が「AI トランスフォーメーション」と呼んでいるもの、つまり、AI を活用したインテリジェントなデータ トランスフォーメーションのプロトタイプを作成する機能です。 最後に、Numbers Station はレコード マッチング機能も提供します。これにより、ユーザーはたとえば、CRM と販売システムのレコードを 1 つのデータベースに結合できます。
Numbers Station の共同設立者でチーフ サイエンティストの Ines Chami が私に語ったように、チームは単純に基礎モデルを採用して、それをこれらすべてのユース ケースに適用しているわけではありません。 「モデルを組織に合わせてパーソナライズし、適応させることが非常に重要です」と彼女は言いました。 「アイデアは、組織に固有の答えを生み出すことです。そのため、微調整技術とフィードバックも使用します。」 彼女は、同社は汎用の事前トレーニング済みモデルでユーザーを開始しますが、その後、ユーザーがモデルにフィードバックを提供すると、これらのユーザー用に組織固有のより小さなモデルを生成すると述べました。 「適応するためには、まさにヒューマン・イン・ザ・ループです。 [the model] 組織の知識に。 そのため、あらゆる面で、汎用モデルを超えることが非常に重要であることに気付きました。 始めるのは素晴らしいことですが、非常に迅速に、モデルを微調整して専門化する必要があります」と彼女は説明し、同社は常にすべての顧客のデータをサイロ化していることにも言及しました.
Aberger はまた、彼の見解では、OpenAI などの基盤モデルはコモディティ化されるだろうと強調しました。 「本当に重要なのは、これらのモデルの上に AI の専門知識をどこに適用して、特定の組織や特定の組織のタスクに対して本当にうまく機能させるかということです」と彼は言いました。
そして間違いなく、Numbers Station はこれらの最初の 3 つの機能をエンタープライズ データ スタックへのエントリ ポイントと見なしています。 ここでのより大きなビジョンは、企業がデータを変換するだけでなく、それを分析するのにも役立つデータ インテリジェンス プラットフォームを構築することです。 しかし、そのためには、まず企業が記録を整理するのを支援する必要があります。
「私たちは基礎モデル、具体的にはどのように 数字 駅 チームはそれらを適用し、乱雑なデータを処理するという大きな課題に対処するための真の「0 対 1」の機会を提供します。」 数字 駅 ボード。 「さらにエキサイティングなことに、データの準備はチームの野心的なビジョンの最初のステップにすぎません。 たとえば、これらのインテリジェントな変換を自動化されたワークフローにすぐに接続できることは、 数字 駅 アプローチ。 すべての企業が最新のデータ スタックの重要な要素と見なすプラットフォームを構築するこの世界クラスの顧客主導のチームを支援できることを嬉しく思います。」