AIによるテキスト生成ツール「ChatGPT」を開発・提供するオープンAIは1月31日、AIが生成したテキストを判別するツールの提供を始めた。「ChatGPT」は、対話型でプログラミングができるなどの可能性を秘める一方、偽情報の流布や論文執筆などへの悪用なども懸念されている。
「AIテキストクラシファイア(分類器)」として一般に公開した。「人間によって書かれたものと混同させるようなテキストへの抑止として用意した」という。オープンAIは「ChatGPT」について、「教育・研究機関での不正行為のほか、偽情報の流布や、チャットボットをあたかも人間のように見せかけるなどの悪用が想定される」と認める。
オープンAIによる事前の評価では、AIが生成したテキストを正しく判別できた割合は26%で、9%の確率で人間が書いた文章を「AIによるもの」と誤って判断した。現時点では英文のみに対応し、それ以外の言語では判別力が下がるという。最低でも1000字(150〜250単語)が必要で、文章が長いほど精度が高まる。単なる箇条書きなどはAIか人間かの判断が困難といった課題も残る。
「分類器を回避するために文章に手を加えることもできるだろう。それを再び学習すれば分類機を更新できるが、〔いたちごっこのようになって〕長期的に検出が有利になるかは不明だ。ツールはまだ不完全だが、公開によってフィードバックを得たい。AIが生成したテキストの検出についての研究は今後も続け、改善されたツールを提供したいと考えている」(オープンAIの発表文)。
AIによるテキストを判別する仕組みは「ChatGPT」以前から研究されており、機械学習を用いたもののほか、統計的特徴量によって検出する方法、双方の組み合わせなどがある。2月1日には「ChatGPT」と同様に言語モデルを用いた分類器「DetectGPT」をスタンフォード大学のエリック・ミッチェル氏ら5人が発表した。
「ChatGPT」は入力した質問や指示などに対して回答となるテキストを生成するツール。文章だけでなく、プログラミング言語の知識がなくても、自然文で応答をくり返すことでプログラムを書かせることができる。国内では、検索エンジン最適化(SEO)を目的とした記事作成ツールや、利用者からのレビューコメントに対して自動で返信するツールなどがいくつか発表されている。
- 「ChatGPT」は何と回答する?