抄録
E-019
中世日本文学に対する自然言語処理
河原井翼・蓬莱尚幸・平本留理(茨城高専)
我々は、自然言語処理技術を用いて、中世日本文学、特に説話文学の作品分類等の研究を行っている。本発表では、『古今著聞集』に収録された説話の出典に関する分析結果を報告する。説話文学は多数の説話を収録するアンソロジーの形態をとっているので、他文献からの引用(抄入と呼ぶ)された説話が含まれている。『古今著聞集』には697話が集録されているが、そのうち78話が抄入されたと考えられている。しかし、その中には、出典が不明であり抄入に疑義があるものが4話存在する。そこで、この疑義がある4話について、形態素解析とサポートベクトルマシンを利用し分析した。疑義がある4話は、抄入された説話である可能性が高いことを示す結果が得られた。