情報処理学会 第88回全国大会

5X-04
和歌のベクトル化表現を用いた人文的類似性の定量的評価
○齋藤圭冴,慎 祥揆(東海大)
本研究では、和歌をベクトル空間に写像する手法を提案し、和歌集間の人文的類似性を定量的に評価することを目的とした。比較対象として、(i) wikipediaで事前学習された fastText、(ii) 本研究で構築した古典和歌コーパスによる fastText の再学習モデル、(iii) 五句構造(5-7-5-7-7)を明示的に取り込み、句内部の畳み込み処理と句間自己注意層からなる 5 層エンコーダモデルを用いた。各和歌は単語(または文字)埋め込みの平均により一首のベクトルへ集約し、各代集はその和歌ベクトルの平均(重心)として表現した。その結果、(ii)、(iii)モデルでは人文学的解釈と整合的な類似度構造を示すことが確認された。