2024年10月24日 08:21 ITmedia NEWS
米Google傘下のGoogle DeepMindは10月23日(現地時間)、AI生成テキストを識別する技術「SynthID Text」を発表した。デジタルウォーターマーク(電子透かし)技術を用いて、AIが生成したテキストに人間の目には見えない特殊な印を埋め込むことで、そのテキストがAIによって生成されたものかどうかを判別することを可能にする。
同社は昨年8月には、Imagenで生成した画像向けの電子透かし「SynthID」をリリースしている。
SynthID Textは、テキスト生成モデルの出力層に作用するロジットプロセッサとして機能する。 これは、モデルがテキストを生成する際に、透かし情報をエンコードした疑似乱数関数を用いて、生成される単語の確率分布をわずかに調整することで、透かしを埋め込むというものだ。
テキストの一部を切り取ったり、単語を少し変更したり、言い換えをしたりといった操作を加えても検出可能であり、堅牢性が高い点が特徴という。
Google DeepMindは、SynthID Textは画期的な技術ではあるが、限界もあるとしている。例えば、事実を淡々と述べるテキストでは効果が低くなるし、大幅に書き換えたり他の言語に翻訳されたAI生成テキストでも検出しにくくなる。また、悪意ある利用者を直接阻止するようには設計されていない。こうした限界を克服するための研究を続けているという。
SynthID Textは、Hugging Face Transformersライブラリで利用可能。開発者は自身のテキスト生成モデルに統合できる。 また、ウォーターマークの検出ツールもGitHubで公開されている。