自然言語処理 (NLP) は、ほとんど新しい分野ではありませんが、主に ChatGPT である生成 AI の誇大宣伝のおかげで、ここ数か月で一般の意識に急速に浸透しました。 Hugging Face の Transformers や、Google の LaMDA (ChatGPT のライバルである Bard を強化する予定) などの他の NLP モデルと並んで、AI がメインストリームに登場する日が近づいているという明白な感覚があります。
しかし、ChatGPT にいくつかのキーワードを入力して作成する人にとっては、 Nick Cave のスタイルで歌詞を作成します。、基礎となる AI モデルの開発に費やされるすべての作業を見落としがちであり、それらを大衆市場で消費する準備ができている状態にします。
NLP モデルを作成するには、開発者はアルゴリズムだけでなく、正確に「ラベル付け」された大量の高品質のトレーニング データを必要とします。これは、生データを分類して機械がそれを理解し学習できるようにする手法です。 このラベリング プロセスを実質的に推進する多くの企業が存在し、その 1 つがドイツの新興企業です。 カーンAIは、NLP 開発者とデータ サイエンティストがラベル付けプロセスを制御するだけでなく、接線タスクを自動化および調整し、低品質のデータに対処できるようにするためのプラットフォームを構築しました。
「データ中心」の NLP
NLP が現在のホットな AI トレンドの 1 つであることから、Kern AI は本日、保険会社を含む商業クライアントに採用された最近の成長を倍増させるために、シード資金で 270 万ユーロ (290 万ドル) を調達したことを発表しました。 バルメニア と VHV Versicherungen、Metro Supply Chain Group子会社などの物流会社 エボリューションタイムクリティカル、およびCrowd.devなどのベンチャー支援のスタートアップ。 同社はまた、同社の基本的なオープン ソース化は、Samsung や DocuSign などの企業のデータ サイエンティストによって使用されているとも述べています。
2020 年にボンで設立された共同創業者兼 CEO の Johannes Hötter 氏は、「NLP が中核となるデジタル化技術になるという信念を持って」会社を始めたと述べ、開発者は NLP 開発プロセスに対してより多くの制御と柔軟性を必要としていることを認めました。
同社の主力製品はオープンソースです 製油所、これにより、開発者は、ラベル付けを半自動化することで NLP モデルを構築するためのデータ中心のアプローチを採用し、トレーニング データ内の低品質のデータセットを特定し、単一のインターフェイスですべてのデータを監視できます。
他の場所では、 レンガ — これもオープン ソース — 開発者が Refinery に統合できるモジュール化された標準化された「コード スニペット」のコレクションです。同社によれば、これは「NLP 自動化を推進するアプリケーション ロジック」です。
Hötter 氏は、Kern AI プラットフォームの典型的な現実世界のユースケースには、企業の内部ツールが関係していると述べました。 たとえば、物流会社は、「明日の午後 4 時までに 20 個のパレットをヨーテボリの工場に発送してください」 — そのような時間に敏感な要求には、迅速に回答する必要があります。 ロジスティクス会社は、Kern AI を使用して、着信要求を輸送管理システム (TMS) と同期し、要求の意図と要件を自動的に検出できます。
「これは、サービスの受信トレイを商用製品のワークフローと同期することによって行われ、データが Refinery にプッシュされます」と Hötter 氏は TechCrunch に説明しました。 「ここでは、開発者は NLP 技術を使用してリクエストを分析し、構造化された抽出情報を TMS に直接プッシュできます。」
ある意味では、これは Zapier のようなものと同じように機能しますが、ルールベースのアプローチに従うのではなく、より複雑な自然言語の理解のために構築されています。
プレーの様子
実際、プロプライエタリおよびオープンソースのランドスケープ全体にまたがる無数の同様のプラットフォームがすでに存在しています。 これらには、最近資金を調達した Argilla が含まれます。 160万ドルのシードラウンド 昨年、より多額の 2,500 万ドルの資金調達を完了した Heartex ラベルスタジオ. そして、その歴史を通じて約1億3500万ドルの資金調達を確保した独自のオファリングであるSnorkel AIがあります。
では、正確には、Kern AI は何が違うのでしょうか? Hötter は、現在市場に出回っている唯一の「オープン コアおよびモジュール式のフル スタック」であると述べています。 つまり、そのプラットフォームは、Labelstudio などの既存のラベル付けプラットフォームにプラグインされた開発者向けのアドオンとして使用することも、データ中心の NLP アプリケーション全体を構築するために使用することもできるということです。
「これは、たとえば、洗練された NLP 製品を構築したいスタートアップで、データを構築するための優れたソリューションが必要な場合など、トレーニング データを単に管理および構築するためのアプリケーションとして Refinery を使用できることを意味します」と Hötter 氏は述べています。 . 「あるいは、Refinery のアルゴリズムを使用して、リアルタイム API を展開し、バリュー チェーン全体をカバーする完全なワークフローを調整することもできます。 私たちの目標は、現在の技術スタックに関係なく、最新の NLP の進歩をデータ チームにもたらすことです。したがって、私たちのプラットフォームはモジュール式です。」
Kern AI は現在、約 9 人の従業員を数えており、大部分はリモートで働いていますが、母国のボンに物理的なオフィスを維持しています。
これまでに、Kern AI は 550,000 ユーロ (587,000 ドル) の少額のプレシード ラウンドで資金を調達し、銀行に新たに 290 万ドルを調達しました。 ヘッター氏によると、同社はプラットフォームの機能セットを拡張して、オーディオおよびドキュメントベースのデータを含む追加のワークフローをカバーし、より幅広い業界のユースケース向けの製品を構築する予定である. Hötter 氏はまた、無料の個人用層を一般に利用できるようにする計画を促進すると述べました。 現在しか入手できないので 招待制で。
Kern AI のシード ラウンドは、Seedcamp と Faber が共同でリードし、Xdeck、Another.vc、少数のエンジェル投資家が参加しました。