情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

4C-05
評判情報分析のための製品属性タグ付きコーパスの半自動構築
○中村 駆,白井清昭(北陸先端大)
本論文では,人手によるコーパス構築のコストを軽減するために,製品属性タグ付きコーパスを半自動構築する手法を提案する.最初に少量の正解の属性を与え,これをもとに属性抽出モデルを機械学習する.得られた属性抽出モデルをレビューテキストに適用して新たな属性を抽出し,抽出した属性の中から正しいものを人手で選別する.これを繰り返すことで大規模なコーパスを半自動的に構築する.人手による属性選別の際,頻度の高い属性から順に,信頼度の高い属性が順に,既知の属性と似ていない属性から順に選別を行う手法を提案し,これらの違いを実験的に検証する.