6Q-02
新語抽出のストリーム型能動学習における半教師あり学習によるサンプル効率の向上
○脇 一晟,武田 龍,駒谷和範(阪大)
ユーザが発話した対話システムにとっての未知語を,システムの聞き返しにより獲得したい.この際,二回以上同様の聞き返しを行うと,ユーザの印象が悪くなる.本研究では,ストリーム型能動学習による単語分割器の新語獲得において,半教師あり学習を導入し聞き返し効率を上げる.この問題設定では,順番に提示される未分割文に対し,学習に用いる正解の分割を尋ねる聞き返しの要否を逐次的に判断する.加えて,現状の単語分割結果に初見の語が含まれない時,それを正解と見做し学習する.これにより獲得した新語を含む文に対する聞き返しの抑制を図る.評価では,聞き返し回数に対する単語分割精度の推移を提案手法とベースラインとで比較する.