2V-5
カテゴリ階層を考慮した固有表現抽出
○東山翔平,関 和広,Mathieu Blondel,上原邦昭(神戸大)
固有表現抽出は,自然言語処理における基本的な問題のひとつであり,テキスト中に現れる固有名詞や時間表現などを同定することを目的とする.抽出の対象となる固有表現は,組織名や人名などが一般的であり,これらのカテゴリは本来,階層性を有する.たとえば,組織名はさらに会社名や大学名などのカテゴリに細分化されうる.このような階層構造のカテゴリを考えたとき,階層的に近い(遠い)という情報は固有表現抽出の際に利用可能であり,カテゴリ数が多い場合に特に有用であると考えられる.本研究では,構造化パーセプトロンによるカテゴリの階層性を考慮した固有表現抽出法を提案し,その有効性を検証する.