マイクロソフトが乗り出す Bing の拡張の次の段階について。 そして、驚くことではありませんが、AI を中心に大きく展開しています。
今週ニューヨーク市で開催されたプレビュー イベントで、CVP 兼消費者最高マーケティング責任者である Yusuf Mehdi を含む Microsoft の幹部は、このレポーターを含む報道関係者に、今後数日、数週間にわたって Bing に導入されるさまざまな機能について説明しました。そして数ヶ月。
Microsoft が過去 3 か月ほどの間に Bing エクスペリエンスに注入したものに基づいて構築するため、車輪を再発明することはあまりありません。 Microsoft によると、OpenAI の GPT-4 および DALL-E 2 モデルを搭載した AI 搭載のチャットボットである Bing Chat を立ち上げて以来、Bing への訪問者 (1 日のアクティブ ユーザーは 1 億人を超えるまでに成長) は 5 億を超えるチャットに参加し、 2億枚以上の画像を作成。
今後、Bing Chat での画像とグラフィック中心の回答のおかげで、Bing はより視覚的になるでしょう。 また、ユーザーが Bing Chat の履歴をエクスポートしたり、サードパーティのプラグインからコンテンツを取り込んだりできる機能を備えた、よりパーソナライズされたものになります (これらについては後で詳しく説明します)。 そして、少なくとも Bing Chat が画像のコンテキスト内で質問に答えることができるという意味で、マルチモダリティを取り入れます。
「私たちは検索の変革を進めていると言っても過言ではないと思います」と Mehdi 氏は準備された発言で述べた。 「私たちの心の中では、今日が次世代の『探索ミッション』の始まりになると考えています。」
オープンでビジュアル
今日の時点で、新しい Bing (Bing Chat を備えたもの) は順番待ちなしで利用できるようになりました。 Microsoft アカウントでサインインすれば、誰でも試すことができます。
多かれ少なかれ、数か月前に開始されたエクスペリエンスです。 しかし、先に触れたように、Bing Chat はすぐに画像で応答するようになります (少なくとも意味のある場合)。 質問への回答 (例: 「マチュ ピチュはどこですか?」) には、関連する画像が存在する場合は添付されます。これは、標準の Bing 検索フローによく似ていますが、カードのようなインターフェイスに凝縮されています。
イベントのデモでは、広報担当者が「サグアロ サボテンは花を咲かせますか?」という質問を入力しました。 Bing Chat は、問題のサボテンの画像と一緒に 1 段落の応答を表示しました。 私にとって、それは「知識パネル」が Google 検索で表示されます。
マイクロソフトは、どのカテゴリのコンテンツが画像をトリガーする可能性があるかを正確に述べていません。 しかし、露骨な画像が表示されないようにするためのフィルタリングが行われています。
Microsoft の責任ある AI の責任者である Sarah Bird は、Bing チャットは、Bing 検索で既に導入されているフィルタリングとモデレートの恩恵を受けていると私に語った。 さらに、Bing Chat は、「毒性分類子」、つまり潜在的に有害なプロンプトを検出するようにトレーニングされた AI モデルと、チャットを比較的クリーンに保つブラックリストを組み合わせて使用します。
Bing Chat が 2 月初旬にプレビューで最初にロールアウトされたとき、これらの措置は軌道から外れるのを妨げませんでした。これは注目に値します。 私たちの報道では、チャットボットがワクチンの誤った情報を吐き出し、アドルフ・ヒトラーの観点から憎悪に満ちた大言壮語を書いていることがわかりました。 他のレポーターは、脅迫を行い、複数の身元を主張し、それを警告したことで恥をかかせることさえありました。
マイクロソフトに対する別の打撃として、同社はほんの数か月前に、より大きな AI 組織内の倫理および社会チームを解雇しました。 この動きにより、マイクロソフトは、AI の原則が製品設計と密接に結びついていることを確認するための専任チームを持たなくなりました。
ただし、Bird は、有意義な進歩があり、この種の AI の問題は一晩で解決されるわけではないと主張しています。 他の対策の中でも、ユーザーが Bing Chat を使用してフィッシング メールを生成しようとするなどの悪用を監視するために、人間のモデレーターのチームが配置されている、と彼女は言いました。
しかし、プレスのメンバーは、精選されたデモを超えて Bing の最新バージョンを操作する機会を与えられなかったので、それがどの程度の違いを生んだかはわかりません. もっと多くの人が手に入れれば、きっと明らかになるでしょう。
Bing Chat の 1 つの側面は、 は 改善されているのは、その回答、特に事実に基づく性質の回答に関する透明性です。 まもなく、ドキュメントまたはドキュメントの内容について要約するように求められると (たとえば、「このページはブルックリン橋について何と言っていますか?」)、20 ページの PDF であろうとウィキペディアの記事であろうと、Bing Chat はどこから来たかを示す引用を含めるようになります。情報元のテキスト。 それらをクリックすると、対応するパッセージが強調表示されます。
生産性の創発
視覚面のもう 1 つの新機能として、Bing Chat は、適切なプロンプトとデータが供給されると、チャートとグラフを作成できるようになります。 以前は、「ブラジルで最も人口の多い都市はどこですか?」のような質問をしていました。 結果の基本的なリストが得られます。 しかし、近い将来のプレビューでは、Bing Chat はこれらの結果を視覚的に表示し、ユーザーが選択したグラフの種類で表示します。
これは、Bing が本格的な生産性プラットフォームに向けて一歩前進したことを示しているように思われます。特に、パイプラインで強化されたテキストから画像への生成機能と組み合わせた場合はなおさらです。
今後数週間で、Bing Image Creator — DALL-E 2 を搭載した、テキスト プロンプトから画像を生成できる Microsoft のツール — は、英語以外のより多くの言語 (合計 100 以上) を理解するようになります。 英語と同様に、ユーザーは生成した画像をフォローアップ プロンプトで調整できます (たとえば、「ウサギの画像を作成してください」の後に「毛皮をピンク色にします」など)。
ジェネレーティブ アート AI は、最近よくニュースの見出しを飾っていますが、必ずしも最も楽観的な理由によるものではありません。
原告は OpenAI とそのライバル ベンダーに対していくつかの訴訟を起こし、著作権で保護されたデータ (主にアート) が DALL-E 2 のような生成モデルをトレーニングするために許可なく使用されたと主張しています。サンプルの画像とテキスト。通常、公開されている Web から無差別にスクレイピングされます。
私はバードに、Microsoft が訓練データで仕事を一掃されたクリエイターに補償する方法を模索しているかどうかについて尋ねた. フェアユース. Shutterstock など、ジェネレーティブ AI ツールをローンチするいくつかのプラットフォームは、これらの方針に沿ってクリエイターの資金調達を開始しました。 Spawning のように、アーティストが AI モデルのトレーニングを完全にオプトアウトできるようにするメカニズムを作成している企業もあります。
バードは、これらの問題は最終的に直面しなければならないこと、そしてコンテンツ作成者は何らかの形で報酬を受けるに値することをほのめかしました. しかし、彼女は今週、具体的なことを約束するつもりはありませんでした.
マルチモーダル検索
画像の他の部分では、Bing Chat はテキストだけでなく画像も理解できるようになっています。 ユーザーは画像をアップロードし、関連するコンテンツを Web で検索できます。たとえば、かぎ針編みのタコの画像へのリンクをコピーして、Bing Chat に「どうやって作るの?」という質問をすることができます。 ステップバイステップの手順を取得します。
マルチモダリティは、モバイル用の Edge アプリの新しいページ コンテキスト機能も強化します。 ユーザーは、表示しているモバイル ページに関連する質問を Bing Chat で行うことができます。
マイクロソフトはどちらとも言いませんが、これらの新しいマルチモーダル機能は、テキストだけでなく画像も理解できる GPT-4 に由来するようです。 OpenAI が GPT-4 を発表したとき、モデルの画像理解機能をすべての顧客が利用できるようにはしていませんでした。 しかし、Microsoft は OpenAI への主要な投資家であり、OpenAI との緊密な協力者であり、ある種の特権アクセスを持っていることに賭けたいと思います。
もちろん、どのような画像アップロード ツールも悪用される可能性があるため、Microsoft は自動フィルタリングとハッシングを採用して不正なアップロードをブロックしていると、Bird 氏は述べています。 ただし、これらがどれだけうまく機能するかについては審査員が出ています。画像のアップロードを自分でテストする機会はありませんでした.
新しいチャット機能
マルチモダリティと新しいビジュアル機能だけが Bing Chat に来るわけではありません。
まもなく、Bing Chat はユーザーのチャット履歴を保存し、中断したところから再開し、必要に応じて前のチャットに戻ることができるようにします。 これは、最近 ChatGPT に導入された OpenAI のチャット履歴機能に似たエクスペリエンスであり、チャットのリストと、それらの各チャットに対するボットの応答が表示されます。
チャットの保存期間など、チャット履歴機能の詳細はまだ解明されていません。 しかし、ユーザーは関係なくいつでも自分の履歴を削除できると Microsoft は述べており、いくつかの欧州連合政府が ChatGPT に対して持っていた批判に対処しています
Bing Chat にはエクスポートと共有機能も追加され、ユーザーはソーシャル メディアや Word ドキュメントで会話を共有できるようになります。 Microsoft の Web エクスペリエンス チームのパートナー GM である Dena Saunders 氏は、TechCrunch に、Bing Chat で作成されたグラフと画像用の、より堅牢なコピー アンド ペースト システムが開発中ですが、まだプレビュー段階ではないと語っています。
おそらく、Bing Chat に追加された最も革新的な機能はプラグインです。 OpenTable や Wolfram Alpha などのパートナーのプラグインは、Bing Chat でできることを大幅に拡張します。たとえば、ユーザーが予約をしたり、ビジュアライゼーションを作成したり、難しい科学や数学の質問に答えたりするのに役立ちます。
チャット履歴と同様に、未公開のプラグイン機能は非常に準備段階にあります。 話題になるプラグイン市場はありません。 プラグインは、Bing Chat Web インターフェイスからオンまたはオフに切り替えることができます。
Saunders 氏は、Bing Chat プラグイン スキームが、最近導入された OpenAI の プラグイン ChatGPT用。 両者の類似点を考えると、それは確かに理にかなっています。
エッジ、リフレッシュ
もちろん、Bing Chat は Web だけでなく Edge からも利用できます。 Edge は、Bing Chat と並んで新たな塗装を施されています。
2 月に最初にプレビューされた、新しく改善された Edge 機能は、Microsoft の Windows 11 設計哲学に沿って角を丸くしました。 Microsoft の広報担当者が言うように、ブラウザの要素はより「コンテナ化」されており、Microsoft アカウントの画像が中央から左に移動するなど、全体に微妙な調整が加えられています。
Compose では、Edge の Bing Chat を利用したツールで、基本的なプロンプト (「犬の誕生日パーティーへの招待状を書いてください」など) が与えられると、メールなどを作成できます。新しいオプションを使用すると、ユーザーは生成されたテキストの長さ、フレーズ、トーンを調整できます。彼らが望むほとんど何でも。 好みのトーンを入力すると、Bing Chat が一致するメッセージを書き込みます。Bird によると、「ヘイトフル」や「人種差別主義者」など、明らかに問題のあるトーンの使用を防ぐためのフィルターが配置されています。
ただし、Compose よりもはるかに興味深いのは (少なくとも私にとっては)、特定の Bing チャット プロンプトを自動化に変換する Edge のアクションです。
Edge サイドバーの Bing Chat で「bring my passwords from another browser」などのコマンドを入力すると、Edge の閲覧データ設定ページが開き、プロンプト「play ‘The Devil Wears Prada’」で、Vudu を含むストリーミング オプションのリストが表示されます。 ) マイクロソフト ストア。 ブラウジング タブを自動的に整理し、色を調整するアクションもあります。
アクションは現在原始的な段階にあります。 しかし、マイクロソフトがどこに向かっているのかは明らかです。 最終的には Edge を超えて、Office 365 などの他の Microsoft 製品にまで拡大し、いつの日か Windows デスクトップ全体にまで及ぶ可能性があると想像できます。
サンダースは、これが終盤であることを肯定も否定もしません。 「Microsoft Build にご期待ください」と彼女は、Microsoft の今後の開発者会議について言及しました。 私たちはしなければならない。