2Q-05
半教師あり学習によるAI生成文章と人間が書いた文章の識別
○今井悠斗,森 博彦(東京都市大)
近年、生成系AIが書いた文章がAIによるものであるか否かの識別が難しくなっている。レポート課題をAIに書かせる学生や、レビューの自動書き込みなどが身近な例である。また、生成系AIは言語特化のモノだけでもchatGPTやGemini、Claudeなど数多く存在し、現在も新たなAIモデルの開発が進んでいる。一般的に識別モデルの開発には人間とAIそれぞれの文章データが大量に必要であるため、既存の手法では新型AIが生まれるたびにそのAIが書いた大量の文章データを集める手間とコストが発生してしまう。そこで本研究ではAI生成文章データをごく少量しか使わず、人間とAIのデータ量に偏りがある状態での識別モデル開発に取り組んだ。