FIT2016 第15回情報科学技術フォーラム 開催日:2016年9月7日(水)~9日(金) 会場:富山大学キャンパス
抄録
E-008
格フレームと日本語WordNetを用いた小説文中の登場人物抽出
加守田侑・上野敦志・田窪朋仁(大阪市大)
小説を理解する際に登場人物は重要な情報である.小説文中の人物名は小説固有の場合があるため辞書ベースで抽出することは難しい.本研究では登場人物は主語として現れると仮定する.また動詞には人物と係りやすいものがあると仮定し,その係りやすさを動詞ごとに格フレームと日本語WordNetを用いて動詞の人間関連度として算出しておく.登場人物を抽出する際には,小説に形態素解析・構文解析を行い,主語と対応する述語の動詞を取得する.主語の局所出現頻度と対応する述語の動詞の人間関連度の平均値を素性としてSVMで主語が登場人物かどうか識別する.提案手法の結果として適合率74.2%,再現率71.9%が得られた.