FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
E-007
標準語用のパラメータを流用した岡山弁向け統計的形態素解析
福圓琢真・但馬康宏・菊井玄一郎(岡山県大)
本研究ではクラスNグラムを用いた岡山弁向けの形態素解析手法を提案する。クラスNグラムによる形態素解析は学習用にある程度の量のタグ付きコーパスが必要であるが、方言については基本的に話言葉であることから、生コーパス自体が少なく、語彙や統計パラメータをいかにして用意するかが問題となる。本研究では、語彙については標準語の辞書の自動変換などにより、また、統計パラメータについては標準語用のパラメータを対応する方言のパラメータとして流用することにより、岡山弁用の形態素解析を実現した。評価実験の結果、F値89%を達成した。