情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催 情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催

2S-05
Word2vecを用いた日本語文章における同音異義語誤り検出方法について
○吉村光汰,須子統太(早大)
現在,文書作成ソフトには校正機能が備わっている.しかし,一般的な校正機能では,助詞,助動詞等の文法誤りの検出や,存在する単語であるかの検査は行うが,名詞や動詞,形容詞などにおける同音異義語の変換誤りは検出できない場合が多い.文章作成ソフトで作成された日本語文章において同音異義語の変換誤りは多く,これらを検出する機能は非常に重要な機能であると言える.本研究では,Word2vecを用いることで,文書中に出現した単語と周辺の単語との距離を算出し,同音異義語の変換誤りが無いか検出する方法を提案する.実際の新聞記事データに対し評価実験を行い,提案手法の有効性を検証する.