情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

4N-04
コピー対策のための編集距離に基づく文書コピー度評価
○林 成元,張 馨雲,石田将暉,辻田航希,成  凱(九産大)
昨今の高度情報化社会において、膨大な量の情報が誰でも入手可能になっている。確かに、これは社会にとって大きな進歩であるが、その反面、様々な問題も生み出している。その一つとして、レポート等における“コピー文書“が挙げられる。そこで我々は、ある文書がコピーであるかを定量的に評価するプログラムを作成した。本報告では基本評価単位を文字単位、単語単位としてある。また、集合としてモデル化したものを「集合距離」、系列としてモデル化したものを「編集距離」によってそれぞれ判断した。事前に類似度及びパターンの異なるコピー文書を用意し、プログラムによって評価したものが一致するかどうかを検証し、有効性を確かめた。