スペインの地方選挙 まだ 4 か月近く先ですが、Irene Larraz と Newtral の彼女のチームは、すでに衝撃に備えています。 毎朝、マドリッドに本拠を置くメディア企業のララズのチームの半数が政治演説と討論のスケジュールを設定し、政治家の発言の事実確認に備えています。 残りの半分は、偽情報を暴き、ウェブをスキャンしてウイルスの虚偽を探し、嘘を広めるグループに潜入するために働きます. 5 月の選挙が終わったら、年末までに国政選挙を召集する必要があり、オンラインでの偽りが殺到する可能性があります。 「かなり大変です」とララズは言います。 「私たちはすでに準備を進めています。」
オンラインの偽情報とプロパガンダの蔓延は、世界中のファクトチェッカーにとって困難な戦いを意味しています。 ロシアのウクライナ侵攻、 COVID-19 パンデミック、または選挙運動。 このタスクは、OpenAI の ChatGPT などの大規模な言語モデルを使用するチャットボットの出現により、さらに困難になりました。チャットボットは、ボタンをクリックするだけで自然に聞こえるテキストを生成し、本質的に誤った情報の生成を自動化します。
この非対称性に直面して、ファクト チェックを行う組織は、作業の自動化と高速化を支援する独自の AI 駆動型ツールを構築する必要があります。 完全な解決には程遠いが、ファクトチェッカーは、ソーシャルメディア企業が独自のモデレーション活動を縮小している現在、これらの新しいツールが少なくとも彼らとその敵対者との間のギャップが急速に拡大するのを防ぐことを望んでいる.
「ファクトチェッカーと彼らがチェックしている人々との間の競争は不平等なものです」と、人工知能戦略とガバナンスのアドバイザリー会社であるBest Practice AIの共同創設者であり、英国のファクトチェック慈善団体の理事であるティム・ゴードンは言います.
「ファクトチェッカーは、偽情報を作成する組織に比べて小さな組織であることがよくあります」とゴードンは言います。 「そして、ジェネレーティブ AI が生み出すことができる規模とそのペースは、この競争がますます激しくなることを意味します。」
Newtral は、2020 年に多言語 AI 言語モデルである ClaimHunter の開発を開始しました。 事実確認をしている政治家を見せる、HBO と Netflix のドキュメンタリー。
Microsoft の使用 BERT 言語モデル、ClaimHunter の開発者は 10,000 のステートメントを使用して、データ、数値、または比較などの事実の宣言を含むように見える文をシステムが認識できるようにシステムをトレーニングしました。 「私たちはマシンにファクトチェッカーの役割を果たすように教えていました」と Newtral の最高技術責任者である Rubén Míguez は言います。
確認が必要な政治家やソーシャル メディア アカウントによる主張を単純に特定することは困難な作業です。 ClaimHunter は、Twitter で行われた政治的主張を自動的に検出し、別のアプリケーションは、政治家のビデオと音声の報道をテキストに書き起こします。 どちらも、証明または反証できる公的生活に関連する主張を含む声明を特定して強調表示し、あいまいではない声明、質問、または意見などを示し、レビューのためにニュートラルのファクトチェッカーにフラグを立てます.
このシステムは完璧ではなく、意見に事実としてフラグを立てることもありますが、その誤りは、ユーザーがアルゴリズムを継続的に再訓練するのに役立ちます. Míguez 氏によると、チェックする価値のあるステートメントを特定するのにかかる時間が 70 ~ 80% 短縮されました。