胃がゴロゴロします。 それは正常です。 マイクが近くにあると、ゴボゴボとゴロゴロ音が拾われることがあります。
AI オーディオブックのナレーターは胃腸の奇妙な音を気にする必要はありませんが、リア アラーズとエンジニアのクレイグ ヒンクルはボットではありません。 彼らは人間であり、1 月中旬にナッシュビル オーディオ プロダクションズのためにレコーディングを行い、ゴボゴボという音に悩まされ、「増加」という言葉のどこに重点を置くべきかを議論し、本についての「本当の」声を与えるための詳細な作業を行う傾向があります。カップルのコミュニケーション方法。
NAP のスタジオは、テネシー州ナッシュビルのザ ラックス ルームにあり、テイラー スウィフトが 7 回のプラチナ タイトルを獲得したセルフ タイトルのデビュー アルバムをレコーディングしたのと同じ場所です。 待合室に広がるコーヒーの香り。 ヒンクルはアラーの口から発せられるすべての言葉に耳を傾け、書籍のテキストが表示された iPad から、スタジオのサウンドボードに置かれた大型モニターをちらりと見た。
「これらの質問でもう少し感情を表現したい」と、章のセクションを再開する前に Allers は Hinkle に語った。
オーディオブックは活況を呈しています。 によると、市場は 2021 年の約 42 億ドルから 2030 年までに 335 億ドルに達すると予想されています。 洞察力の研究とコンサルティング. これがポッドキャストの人気上昇の副産物なのか、聞き取りやすさの問題なのか、それともパンデミックの副産物なのかにかかわらず、テクノロジー企業の注目と避けられない人工知能の忍び寄る動きを逃れてはいません。
2023 年には、AI の可能性をめぐる興奮が高まっていますが、苦戦しているクリエイティブから仕事を奪うことへの不安も同様です。 ChatGPT は、保険の事前承認レターから出会い系アプリの経歴まで、さまざまな程度の成功を収めてあらゆるものを作成できます。 のような AI プラットフォーム レンサAI と OpenAI の Dall-E AIで生成されたアートを吐き出し、デジタルアートを作成して生計を立てている多くの人が将来を心配しています.
Apple や Google などのテクノロジー企業は、しばらく前から AI オーディオブックのナレーションに取り組んできました。 2022 年に、Google ロールアウト 米国とカナダを含む 6 か国のパブリッシャーにサービスを提供しています。 Google の AI ナレーターには、イギリス人のアーチーやスペイン語のサンティアゴなどの名前があります。 1月上旬、 Apple は一連の AI 音声を導入しました Madison や Jackson などの名前で、Apple Books で本を販売している著者やインディー出版社は、タップしてノンフィクションからロマンスまでのジャンルを読むことができます。
オーディオブックのナレーションにおける AI の存在感の高まりにより、Tanya Eby のような人間のナレーターは、さまざまな段階のストレスを抱えています。
「5年後にこれが私のフルタイムのギグになるかどうかはわかりません」と、ミシガン州グランドラピッズを拠点とするナレーターで、過去21年間に1,000冊以上の本を録音したEbyは言いました.
Eby のようなナレーターは、彼らの人間性こそが彼らの仕事を助けるものだと言います。 特にフィクションでは、ナレーターは、キャラクターの声から、ストーリーを反映する方法でニュアンスや感情を伝える方法まで、あらゆることについて決定を下します.
テキサス州オースティンを拠点とするナレーターのキャスリーン・リー氏は、「登場人物が父親の死後にすすり泣く場合、その涙とあえぎをスピーチで伝えなければなりません。
ナレーターは、リスナーの耳の中で声になることの親密さを説明し、最もリアルな AI でさえ不気味の谷に落ちるのではないかと考えています。 彼らが心配しているのは、体験を中断させる危険性です。
AI の声は、堅苦しいものから非常に説得力のあるものまでさまざまです。 しかし、最も流動的な人でさえ、耳障りな配信やペーシングで、これらの不気味な谷のトリップワイヤーを引き起こす可能性があります。
ジョージア州アトランタ郊外に住むナレーターのジョナサン・スリープ氏は、「メディアを消費することのすべては、私たちがそれに包まれることを望んでいるということです.
お金の話
オーディオブックの熱心な人は、なぜ人間の声よりも合成音声を選ぶのか理解に苦しむかもしれません。 しかし、小規模な出版社や著者にとって、時間とお金は、創造的なパフォーマンスの神聖さよりも強力な議論になる可能性があります.
ミシガン大学出版局にとって、オーディオブックはあまり儲からない。 出版社は、学者や学生のために、学者によって年間約 100 冊の学術書を発行しています。
本のナレーターを雇うには 6,000 ドルもの費用がかかる可能性があり、数百ドルしか稼げない可能性があります。 そしてそれは言うまでもなく、集中的な生産プロセスです。 1 時間分のオーディオブックを作成するには、約 6 時間かかります。 ACXによると、Amazon の Audiobook Creation Exchange。
ミシガン大学出版局のディレクターであり、ミシガン大学図書館で出版を担当する准大学司書であるチャールズ・ワトキンソン氏は、「現実には、ある種のベストセラーがなければ、経済はうまくいかない. 彼はまた、学術分野の出版社の専門組織である Association of University Presses の会長でもあります。
小規模な著者や出版社にとって、オーディオブックを制作する時間とコストは手の届かないものかもしれません。 AIはそれを変えることができます。
約 2 年前、Google はミシガン大学出版局にパイロット プログラムへの参加について打診しました。 プレスは Google のツールを使用して、約 100 のデジタル オーディオブックを作成することができました。 ある程度の人間の介入が必要です。 ワトキンソン氏によると、Google を使用した一部の教授は、学生に録音を聞かせて、テキストと照合させます。 小規模な印刷機では、AI を使用して記録プロセスを迅速化しても、人員配置の問題が発生する可能性があります。
ワトキンソン氏によると、ミシガン大学は、AI を使用することで、他の方法では音声形式で入手できない書籍のアクセシビリティを向上させる方法に関心を持っているという。
パイロットの初期段階で、ナレーションのサンプルを持って約 900 人の著者に連絡を取りましたが、一般的な反応は、AI のナレーションは、視覚障害のある人にスクリーン リーダーが提供できるものよりも少しだけ優れているというものでした。 ただし、視覚に問題があり、スクリーン リーダーなどを持っていない可能性がある人にとっては、AI がアクセスのギャップを埋めるのに役立つ可能性があります。
他の場合では、リスナーは録音された本をどんな形でも喜んで持っているかもしれません. ワトキンソンのインターンは、バスの中や教室まで歩いているときなど、目の前に本を開くことができない瞬間に、オーディオブックを使って勉強を続けていました。 彼女はそれを「インタースティシャル・リスニング」と呼んだ。
デジタル音声の台頭
Apple や Google のような大企業に加えて、急成長中の中小企業のグループが AI 音声の分野に参入しています。
ディープゼン その一つです。 2018 年に設立され、AI バーチャル アシスタントと恋に落ちる男性を描いた 2013 年の映画 Her に触発された DeepZen は、テキストから手がかりを得ることができる自然言語処理システムを構築し、仮名でラベル付けされた認可を受けた人間のナレーターから構築された AI 音声を使用します。 .
最大の課題の 1 つは、テキストをきっぱりとオウムにするのではなく、トーンを吹き込むプラットフォームを作成することでした、と CEO 兼共同設立者の Taylan Kamis 氏は述べています。
市場に出るまでに数年かかりましたが、現在、DeepZen ではクライアントが原稿をアップロードし、料金プランに応じて自動化サービスまたはマネージド サービスを選択できます。 どちらも発音チェックなどのレベルの品質管理が付属していますが、管理されたオプションには、人間の編集者による校正チェックと 2 回の修正があります。
自動化されたサービスは、マネージド オプションが 129 ドルであるのに対し、1 時間あたり 69 ドルで顧客を処理します。 DeepZen は、フィクションとノンフィクションの両方で、これまでに約 3,000 冊の本を制作してきました。
の上 そのウェブサイトでは、Todd、Dahlia、Alice などの名前の 10 のボイスのサンプルを聞くことができます。
世界のどこかで、トッド、ダリア、アリスは実在の人物です。 Kamis は、音声ライセンスは、ナレーターがナレーションで AI と共存する方法になる可能性があると考えています。
「あのナレーターは眠っている間にお金を稼ぎ、彼の声は日本で印税を稼ぐだろう」 [or] 中国か南アフリカだ」と語った。
DeepZen は、AI の音声を他の言語で話せるようにする方法にも取り組んでおり、市場へのリーチを拡大しています。
そして、1 つの言語だけを話すという課題を克服することを気にしないでください。死が邪魔になる必要さえありません。 DeepZen は、2014 年に亡くなった著名な声優でナレーターのエドワード ハーマンの家族に、彼の声のライセンスについてアプローチしました。 彼らはサインオンしました。 ある意味では、ヘルマンは死後も働いています。
口答え
AI と人間が音声ナレーションでうまくやっていく方法があると考えているのはカミスだけではありません。
ミシガン大学のワトキンソンは、人間を雇って録音する価値のある本をテストする方法として AI を使用したいと考えています。 売れ行きが特に良い場合、その成功はコストを正当化する可能性があります。 彼自身もオーディオブックのファンです。
「これは、人間のナレーターを獲得するための入り口です」と彼は言いました。
誰もが楽観的ではありません。 業界内の一部では、有名でないナレーターや自分のフォロワーがいないナレーターの仕事が少なくなるのではないかと心配する人もいます。
Independent Book Publishers Association の CEO である Andrea Fleck-Nisbet 氏は、次のように述べています。
この業界で 20 年間働いてきた Eby さんは、最終的にフルタイムでナレーションを担当する仕事を見つけられなくなったらどうなるのだろうと考えていると語っています。
「私が持っている競争力のあるスキルは何ですか?そして、どうすればオフィスに入ることができ、何を提供できるでしょうか?」 彼女は尋ねた。
ナレーターのジョナサン・スリープは、やらなければならない宿題があることを知っていると言い、署名した契約と、自分の声に関してどのような権利を譲渡するかについて、さらに鋭い目を向けています.
ナレーターの Andy Garcia-Ruse のように、自分の強みを活かしたいと考えている人もいます。
デジタル音声の使用を拒否する著者もいます。
「フィクションの目的は、読み手や聞き手の感情を呼び起こすことだと思います。フィクションは、人間であることの意味についてです。そして、機械はそれを再現することはできません」と作家のエリザベス ベルは述べています。
著者の Chris Stokel-Walker は、Google を使用して、2021 年のノンフィクション本 TikTok Boom で、人気の動画アプリについて語りました。 結果についてInverseに書いた.
「戻ってきたのは、あなたが望む感情とドラマの一部が欠けているものの、まともに聞こえるオーディオブックでした」とStokel-Walkerは書いています.
それでも、多くの疑問が残ります。 人々がすでに Siri や Alexa などのデジタル音声を毎日聞いている世界では、デジタル音声が完全に人間に聞こえない場合、人間は気にしなくなるのでしょうか? Fleck-Nisbet 氏にとって、AI によるナレーションは、出版業界が直面する多くの問題の 1 つにすぎません。 AI と著作権または知的財産に関するその他の不確実性があります。
言い換えれば、これはほんの始まりにすぎません。
率直に話す
これは、ナレーターが来週失業者になると言っているわけではありません。
Nashville Audio Productions のオーナーである John Behrens は、ここ数年で AI で生成された 2 冊の本を扱っており、本質的に品質管理を行っています。 AI にはまだ問題がありました。 聖書の一節を発音できず、テキスト内の修辞的な質問に苦労しました。
質の悪いオーディオブックは、修正が必要な問題について 50 から 100 のエントリを生成する可能性がある、と Behrens 氏は述べています。 AIは何百もの生産を行いました。 そのため、少なくともしばらくの間、人間のナレーターはどこにも行かないと彼は信じています。 彼はパニックに陥らないようにアドバイスします。
「もしあなたが恐怖の中で生きようとしているのなら… 枯渇すると思うなら、なぜこのキャリアに投資し続けるのですか?」 彼は言った。
Rukkus Room に戻ると、Allers と Hinkle はロボットについておしゃべりをするために休憩を取ります。
Allers がオーディオブックのナレーションを担当するのはこれが初めてですが、Netflix を含め、多くのナレーションや吹き替えを行っています。
Hinkle は AI に感銘を受けていません。
「本を読むロボット」と彼は言った。 「それが自然で才能に満ちたものになるまでには、まだ長い時間がかかると思います。」
マディソンとジャクソンには言わないで
編集者注: CNET は、AI エンジンを使用して、編集者によって編集および事実確認された個人金融の説明者を作成しています。 詳細については、 この郵便受け.