抄録
E-012
テレビ番組データを対象とした人名抽出と番組ジャンル推定
織田一輝・佐々木稔(茨城大)
本研究では、テレビ番組という内容に偏りのあるデータからの人名抽出や放送内容のジャンル推定を行う。テレビ番組データの中からテキスト分析に必要であるテキスト情報に焦点を絞って、有効な特徴の抽出を行い、抽出した特徴を用いて、テキストに含まれる人名の抽出と各シーンのカテゴリ分類を行う。実験の結果、人名抽出ではELMoを用いたCRFによる手法が最も高い精度で人名抽出を行うことができた。また、ジャンル推定ではMLPを用いた場合の正解率が最も高かった。以上の結果より、人名抽出やジャンル推定においてテレビ番組データのテキスト情報が有効であることを示すことができた。