巨大な技術 機械学習モデルが過去数か月で示した飛躍は、誰もが AI の未来に興奮していますが、その不快な結果についても不安を感じています。 Stability AI と OpenAI のテキストから画像へのツールが話題になった後、インテリジェントな会話を行う ChatGPT の能力は、あらゆる分野で新たな強迫観念となっています。
テクノロジー コミュニティが常に西側諸国の進歩を注視してきた中国では、起業家、研究者、投資家がジェネレーティブ AI の分野に進出する方法を模索しています。 テクノロジー企業は、オープン ソース モデルに基づいて構築されたツールを考案し、消費者や企業の顧客を引き付けています。 個人は、AI によって生成されたコンテンツで利益を得ています。 規制当局は、テキスト、画像、およびビデオ合成の使用方法を定義するために迅速に対応しました。 一方、米国の技術制裁により、中国が AI の進歩に追いつく能力について懸念が高まっています。
ジェネレーティブ AI が 2022 年末に向けて世界を席巻する中、この爆発的なテクノロジーが中国でどのように広がっているかを見てみましょう。
中華味
Stable Diffusion や DALL-E 2 などのバイラル アート作成プラットフォームのおかげで、ジェネレーティブ AI は突然、誰もが口にするようになりました。 世界の反対側では、中国のハイテク大手も同様の製品で大衆を魅了しており、国の好みや政治情勢に合わせてひねりを加えています。
検索エンジンでその名を馳せ、近年は自動運転のゲームを強化している百度は、 ERNIE-ViLG、 100億パラメータモデル 1 億 4500 万の中国語の画像とテキストのペアのデータセットでトレーニングされました。 アメリカのカウンターパートに対してどのように公平ですか? 以下は、ERNIE-ViLG の中国語 (纽约唐人街小孩吃烧卖) の同じプロンプトに対して、Stable Diffusion に与えられた「ニューヨークのチャイナタウンでシュウマイを食べる子供たち」というプロンプトの結果です。
中国やチャイナタウンで点心を食べて育った者として、結果は引き分けだと思います。 どちらも適切なシュウマイを持っていませんでした。 ジューシーな海老と豚肉の餃子を半開きの黄色い包みに. Stable Diffusion はチャイナタウンの点心レストランの雰囲気を際立たせていますが、シュウマイはオフになっています (ただし、マシンがどこに向かっているかはわかります)。 ERNIE-ViLG が生成する一方で、 a シュウマイの一種で、広東版よりも中国東部でよく見られる品種です。
クイックテストは、使用されるデータセットが本質的に偏っている場合、文化的なニュアンスを捉えるのが難しいことを反映しています.Stable Diffusionが中国のディアスポラに関するより多くのデータを持ち、ERNIE-ViLGがおそらく中国国外ではより珍しいシュウマイ画像のより多くの種類で訓練されていると仮定します.
話題になっているもう 1 つの中国製ツールは、Tencent のツールです。 異次元の私、人物の写真をアニメのキャラクターに変えることができます。 AI ジェネレーターは独自のバイアスを示します。 中国のユーザーを対象としていたが、南アメリカなどの他のアニメ好きの地域で予想外に人気を博した. しかし、ユーザーはすぐに、プラットフォームが黒人やプラスサイズの個人、つまり日本のアニメでは明らかに欠けているグループを特定できず、AI によって生成された不快な結果につながることに気付きました。
ERNIE-ViLG 以外に、別の大規模な中国語のテキストから画像へのモデルは次のとおりです。 太一は、著名なコンピューター科学者であるハリー シャムが率いる研究機関である IDEA の発案によるものです。ハリー シャムは、Microsoft の米国外最大の研究部門である Microsoft Research Asia を共同設立しました。 オープンソースの AI モデルは、2,000 万のフィルタリングされた中国語の画像とテキストのペアでトレーニングされ、10 億の パラメーター.
Baidu やその他の利益志向のテクノロジー企業とは異なり、IDEA は近年、地方自治体の支援を受けて最先端のテクノロジーに取り組んでいる数少ない機関の 1 つです。 つまり、センターはおそらく、商業的成功を推進するプレッシャーなしに、より多くの研究の自由を楽しんでいる. 深センの技術ハブに拠点を置き、中国で最も裕福な都市の 1 つに支えられている、注目に値する新進気鋭の組織です。
AIのルール
中国のジェネレーティブ AI ツールの特徴は、学習する国内データだけではありません。 それらはまた、現地の法律によって形作られています。 MITテクノロジーレビューとして 指摘した、バイドゥのテキストから画像へのモデルは、政治的にデリケートなキーワードを除外します。 検閲が長い間中国のインターネット上で普遍的に行われてきたことを考えると、それは当然のことです。
駆け出しの分野の将来にとってより重要なのは、政府が「深層合成技術」と呼んでいるものを対象とした一連の新しい規制措置です。これは、「深層学習、仮想現実、およびその他の合成アルゴリズムを使用してテキスト、画像、ゲームからソーシャル メディアまで、中国の他の種類のインターネット サービスと同様に、ユーザーはジェネレーティブ AI アプリを使用する前に名前を確認するよう求められます。 プロンプトがユーザーの本当の身元を突き止めることができるという事実は、必然的にユーザーの行動に限定的な影響を与えます。
しかし、明るい面としては、これらのルールは生成的 AI のより責任ある使用につながる可能性があります。生成的 AI は、NSFW や性差別的なコンテンツを生み出すためにすでに他の場所で悪用されています。 たとえば、中国の規制は、AI が作成したフェイク ニュースの生成と拡散を明確に禁止しています。 ただし、それをどのように実装するかは、サービス プロバイダー次第です。
「中国が規制の最前線にいることは興味深い」 [generative AI] イスラエルを拠点とする OpenAI のライバルである AI21 Labs の創設者である Yoav Shoham 氏は、インタビューで次のように述べています。 「AIに制限を課しているさまざまな企業があります…私が知っているすべての国は、AIを規制するか、何らかの方法で法制度または社会制度が技術、特に自動生成の規制についていることを確認する努力をしていますコンテンツの。」
しかし、急速に変化する分野をどのように管理すべきかについては、まだコンセンサスが得られていません。 「それは、私たち全員が一緒に学んでいる分野だと思います」とショーハムは認めました。 「それは共同作業でなければなりません。 技術とその機能と機能を実際に理解している技術者、公共部門、社会科学者、技術の影響を受ける人々、および商業的および法律的な問題を含む政府を関与させる必要があります。規制の側面。」
AI の収益化
アーティストが強力な AI に取って代わられることを恐れているため、中国では多くのアーティストが機械学習アルゴリズムを活用してさまざまな方法で収益を上げています。 彼らは、テクノロジーに精通した集団の出身ではありません。 むしろ、彼らは日和見主義者か、追加の収入源を探している専業主婦です。 彼らは、プロンプトを改善することで、 AI をだましてクリエイティブな絵文字や見事な壁紙を作成させることができます、ソーシャル メディアに投稿して広告収入を増やしたり、ダウンロードに対して直接請求したりできます。 本当に熟練した人は、お金を稼ぐゲームに参加したい他の人にプロンプトを販売したり、有料でトレーニングしたりすることさえあります.
中国の他の人は、次のような正式な仕事で AI を使用しています。 残りの世界. たとえば、ライト フィクションの作家は、作品のイラストを安価に大量生産することができます。このジャンルは、小説より短く、多くの場合、イラストが特徴です。 製造業の領域を混乱させる可能性がある興味深いユース ケースは、AI を使用して T シャツ、プレス ネイル、その他の消費財のプリントをデザインすることです。 プロトタイプの大規模なバッチを迅速に生成することにより、メーカーは設計コストを節約し、生産サイクルを短縮します。
ジェネレーティブ AI が中国と西側でどのように異なって開発されているかを知るのは時期尚早です。 しかし、起業家は初期の観察に基づいて決定を下しました。 何人かの創業者は私に、企業や専門家は、投資に対する直接的な見返りが見られるため、一般的に喜んで AI にお金を払っていると語った。 Sequoia China が支援する Surreal (後に Movio に改名) と Hillhouse が支援する ZMO.ai からの巧妙なアプリケーションの 1 つがありました。ZMO.ai は、中国が国境を閉鎖し続けているため、e コマースの売り手が外国のモデルを見つけるのに苦労していることをパンデミック中に発見しました。 ソリューション? 2 つの企業は、あらゆる形、色、人種のファッション モデルを生成するアルゴリズムに取り組みました。
しかし、一部の起業家は、AI を活用した SaaS が、ジャスパーやスタビリティ AI などの西側の対応企業が享受しているような急激な評価と急成長を遂げるとは考えていません。 何年にもわたって、多くの中国の新興企業が同じ懸念を持っていると私に語ってきました。中国の企業顧客は一般に、先進国の企業よりも SaaS にお金を払いたがらないため、多くの企業が海外に進出し始めています。
中国の SaaS スペースでの競争も、食いしん坊です。 「米国では、ユーザーを獲得または維持するために人的サービスに依存しない製品主導のソフトウェアを構築することで、かなりうまくいくことができます。 しかし中国では、たとえあなたが優れた製品を持っていたとしても、あなたのライバルがあなたのソースコードを一晩で盗み、あなたを追い越すために、それほど費用がかからない何十人ものカスタマーサポートスタッフを雇う可能性があります. 、匿名希望。
創業者兼最高経営責任者(CEO)のShi Yi セールス インテリジェンス スタートアップの FlashCloud、中国企業は長期的なイノベーションよりも短期的な利益を優先することが多いことに同意しました。 「人材開発に関しては、中国のテクノロジー企業は、アプリケーションのスキルを身に付け、手っ取り早くお金を稼ぐことに重点を置いている傾向があります」と彼は言いました。 上海を拠点とするある投資家は、名前を明かすことを拒否したが、「今年のジェネレーティブ AI の大きなブレークスルーがすべて中国以外で起こっていることに少しがっかりしている」と語った。
先の障害物
中国のテクノロジー企業が大規模なニューラル ネットワークのトレーニングに投資したいと考えている場合でも、最適なツールが不足している可能性があります。 9月、米国政府はハイエンドAIチップの輸出規制で中国を平手打ちした。 多くの中国の AI 新興企業はアプリケーションの最前線に焦点を当てており、大量のデータを処理する高性能半導体を必要としないが、基礎研究を行っている企業にとって、性能の劣るチップを使用すると、コンピューティングに時間がかかり、コストがかかることを意味すると、エンタープライズ ソフトウェア投資家は述べた。中国のトップ VC ファームで、匿名を希望しています。 良いニュースは、そのような制裁が中国を長期的に高度な技術への投資に駆り立てていることだと彼は主張した。
バイドゥは、中国の AI 分野のリーダーを自称する企業として、同社の AI ビジネスに対する米国のチップ制裁の影響は、短期的にも長期的にも「限定的」であると考えている、とバイドゥのエグゼクティブ バイスプレジデント兼 AI クラウド グループの責任者は述べた。 、Dou Shen、その上で 第 3 四半期決算説明会. それは、Baidu の AI クラウド ビジネスの「大部分」が「高度なチップにあまり依存していない」ためです。 また、ハイエンドのチップが必要な場合は、「実際には、近いうちにビジネスをサポートするのに十分な量の在庫をすでに持っています」。
将来はどうですか? 「中長期的に見ると、実際に独自に開発した AI チップがあり、 クンルン」と幹部は自信満々に語った。 「当社の崑崙チップを使用することで [Inaudible] 大規模な言語モデルでは、AI プラットフォームでテキストおよび画像認識タスクを実行する効率が 40% 向上し、総コストが 20% から 30% 削減されました。」
Kunlun やその他の国産 AI チップが、生成 AI 競争で中国に優位性をもたらすかどうかは、時が経てばわかります。