6T-2
ドメイン固有語の認識率向上を目指した音声対話システム用言語モデルの構築
○森祥二郎,駒谷和範,佐藤理史(名大)
データベース検索型音声対話システムでは,地名等のドメイン固有語の認識が重要であり,
これをクラスとしたクラスN-gramモデルが必要である.
これにはコーパスへのクラス付与が不可欠であり,大規模コーパスに人手でこれを行うのは労力を要する.
本研究では,機械学習による自動クラス付与を実現する.
まず,データベース中のドメイン固有語とクラス付き小規模コーパスを組み合わせ,学習データを作成する.
次に学習したモデルで大規模コーパスへクラスを付与し,
これに基づきクラスN-gramモデルを構築する.
評価実験では大規模コーパスから作成した単語N-gramモデルと比較し,ドメイン固有語の認識率が7.0%向上した.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について