たとえば、OpenAI のチャットボット ChatGPT が 11 月にローンチされて以来、学生はすでにそれを使用してエッセイを書いてカンニングを始めています。 ニュース Web サイト CNET は、ChatGPT を使用して記事を作成しましたが、発行する必要があるだけでした。 修正 真ん中 非難 剽窃の。 しかし、AI のテキストを特定する有望な方法があります。それは、AI によって生成されたテキストが公開される前にこれらのシステムに識別できるようにする隠れたパターンを埋め込むことです。
研究では、これらの透かしが AI 生成テキストをほぼ確実に識別できることがすでに示されています。 メリーランド大学のチームによって開発されたものは、Meta のオープンソース言語モデル OPT-6.7B によって作成されたテキストを、彼らが構築した検出アルゴリズムを使用して見つけることができました。 作品は、 論文 それはまだ査読されておらず、 コードが利用可能になります 2月15日頃無料。
AI 言語モデルは、一度に 1 つの単語を予測して生成することによって機能します。 各単語の後、透かしアルゴリズムは、言語モデルの語彙を「グリーンリスト」と「レッドリスト」の単語にランダムに分割し、言語モデルにグリーンリストの単語を選択するように促します。
パッセージ内のグリーンリストに登録された単語が多いほど、そのテキストが機械によって生成された可能性が高くなります。 人によって書かれたテキストには、よりランダムな単語の組み合わせが含まれる傾向があります。 たとえば、「beautiful」という単語の場合、透かしアルゴリズムは「flower」という単語を緑に、「orchid」を赤に分類できます。 透かしアルゴリズムを使用した AI モデルは、「蘭」よりも「花」という単語を使用する可能性が高いと、この研究に携わったメリーランド大学の助教授であるトム ゴールドスタインは説明しています。