2022 年、OpenAI の Dall-E サービスは、テキスト プロンプトを画像に変換する機能で世界を驚かせました。 現在、アドビは、同社の広く使用されているクリエイティブ ツールの技術的オーバーホールを開始するツールを使用して、このジェネレーティブ AI テクノロジの独自のバージョンを構築しました。
火曜日に、Adobe は、その新しいの最初の 2 つのメンバーをリリースしました。 ほたる ベータ テスト用のジェネレーティブ AI ツールのコレクション。 最初のツールは、「激しいワニが雷雨の中で水から飛び出す」などのテキスト プロンプトに基づいて画像を作成し、結果を微調整できる数百のスタイルを備えています。 もう 1 つはプロンプト ベースのスタイルをテキストに適用し、毛むくじゃら、うろこ状、コケ状など、好きなように見える文字を作成できるようにします。
現在、Firefly は Adobe の Web サイトで入手できますが、同社は、Photoshop 画像編集ソフトウェア、デザイン用の Illustrator、簡単なビデオを作成するための Adobe Express から始めて、ジェネレーティブ AI を他のツールに直接組み込む予定です。 同社は、新しいツールの価格設定アプローチを明らかにしていません。
クリエイティブな専門家は、Firefly を自分たちのクリエイティブな領域への侵入と見なすかもしれません。色の選択やビデオのトリミングなどの機械的なツールを超えて、自分たちの仕事の核となるものです。 文書の翻訳、税法の解釈、音楽の作曲、旅行日程の作成に関して AI が新たなスマートさを示しているため、専門家が恐怖を感じるのは不合理ではありません。
しかし、他の AI ファンと同様に、アドビは人工知能を人間ができることを拡大する最新のデジタル ツールと見なしています。 たとえば、Firefly は最終的に、幅広いオーディエンス向けに 1 つのデザインを作成するだけでなく、Adobe のツールを使用して個人に合わせてデザインを調整できるようにする可能性があると、Adobe のジェネレーティブ AI 部門のバイスプレジデントである Alexandru Costin 氏は述べています。
「AI がクリエイティブなクリエーターに取って代わるとは思いません。AI を使用するクリエーターは、AI を使用しないクリエーターよりも競争力があると考えています。これが、AI をすべてのユーザー ベースの指先に届けたい理由です」とコスティン氏は述べています。 「AI で成功する唯一の方法は、AI を受け入れることです。」
Adobe の Firefly 製品は、同社独自のストック イメージのライブラリと、パブリック ドメインおよびライセンスされた作品からトレーニングされています。 同社は、AI モデルが反映できるトレーニング データの偏り (たとえば、ビジネス エグゼクティブが男性であるなど) を減らすことに取り組んできました。
AIは「海の変化」
人工知能は、人間の脳に着想を得たプロセスをコンピューティング タスクに使用し、伝統的で厳格な if-this-then-that プログラミングに従う代わりに、複雑な現実世界のデータのパターンを認識するように訓練されています。 AI ハードウェア、ソフトウェア、アルゴリズム、トレーニング データの進歩により、この分野は急速に進歩し、技術のほぼ隅々に影響を与えています。
最新の技術であるジェネレーティブ AI は、独自に新しい素材を作成できます。 最もよく知られている例である ChatGPT は、ソフトウェアを作成し、会話を行い、詩を作成できます。 Microsoft は ChatGPT の技術基盤である GPT-4 を採用して、Bing の検索結果を向上させ、メール作成のヒントを提供し、プレゼンテーションの作成を支援しています。
AI ツールがあちこちで登場しています。 Adobe は、Lightroom の写真の人物認識や、 Premiere Pro ビデオでスピーチをテキストに書き起こす. EbSynth は写真のスタイルをビデオに適用します、 HueMint はカラー パレットを作成します と LeiaPix は 2D 写真を 3D シーンに変換します.
しかし、デジタル アートとデザインに新しいクリエイティブな可能性をもたらすのは、新しいジェネレーティブ AI です。
「これは海の変化です」と言いました Forrester のアナリスト David Truog.
アルパカが提供する アートを生成するための Photoshop プラグイン、および Aug X Labs は次のことができます テキストプロンプトをビデオに変える. Google の MusicLM はテキストを音楽に変換します、非公開ですが。 Dall-E は、しばしば空想的なイメージでインターネットの注目を集めました。この名前は、Pixar の WALL-E ロボットと、シュルレアリスムの画家サルバドール ダリを結びつけています。
のような関連ツール 途中 安定性AI 安定拡散 技術をさらに広げます。
アドビがジェネレーティブ AI 機能を提供していなければ、クリエイティブなプロやアーティストはどこかからそれらを入手していたでしょう。
確かに、マイクロソフトは火曜日に Bing Image Creator に Dall-E テクノロジーを組み込みました サービス。
AI のトレーニングは簡単ではありませんが、少なくとも健全な予算を持っている人にとっては、それほど難しくはありません。 チップ デザイナーの Nvidia は火曜日に、Adobe がその新しい製品を使用していると発表しました。 H100 ホッパー GPU を介して Firefly モデルをトレーニングします。 ピカソという新しいサービス. その他の Picasso の顧客には、写真ライセンス会社の Getty Images と Shutterstock が含まれます。
法務工学
優れた AI の開発は、単なる技術的な問題ではありません。 アドビは、AI がもたらす法的および社会的問題を回避するために Firefly を設定しました。
たとえば、3 アーティストが Stability AI と Midjourney を訴えた 1月に、AIトレーニングデータでの作品の使用をめぐって。 彼らは「自分たちの仕事が完全に彼らの努力によって動かされたコンピュータプログラムによって排除される前に、彼らの権利のこの露骨で巨大な侵害を終わらせようとしている」と彼らの訴訟は述べた.
ゲッティ イメージズも Stability AI を訴えた、「著作権で保護された何百万もの画像を違法にコピーおよび処理した」と主張している. AI トレーニング用の写真やその他の画像の膨大なカタログにライセンスを提供していますが、Stability AI は画像のライセンスを取得していません。 Stability AI、DeviantArt、Midjourney はコメントの要請に応じなかった。
Adobe は、アーティストがそのような問題について心配する必要がないことを保証したいと考えています。 著作権の問題、ブランドのロゴ、ミッキー マウスの文字はありません。 「誤って他人の著作権を侵害したくはないでしょう」とコスティンは言いました。
このアプローチは賢いと Truog 氏は言います。
「Adobe が Firefly で行っていることは、Apple が 20 年前に iTunes Music Store を導入したことと戦略的に非常によく似ています。 当時、Napster の音楽共有はオンライン音楽の需要を示していましたが、レコード業界の訴訟がそのアイデアを押しつぶしました。 「Apple はそれに飛びつき、人々がオンラインで音楽にアクセスできるようにするサービスを設計しましたが、合法的に、より簡単に、コンテンツの作成者から単に盗むのではなく補償する方法でした。」
アドビはまた、偏ったまたはステレオタイプな画像を表示することで、ビジネスを不機嫌にする可能性のある別の問題に対処するために取り組みました.
AI の波に乗る時が来たことをクリエイティブのプロに納得させるのは、アドビ次第です。
「デジタル クリエイティビティの導入は、当時は大きな脅威に見えたとしても、クリエイティブな仕事の数を減らしたのではなく、増やしました」とコスティン氏は述べています。 「ジェネレーティブ AI でも同じことが起こると考えています。」
編集者注: CNET は、AI エンジンを使用して、編集者によって編集および事実確認された個人金融の説明者を作成しています。 詳細については、 この郵便受け.