7Q-01
機械学習によるかな書き文の語分割
○森山柊平,絹川博之(電機大)
近年、外国人日本語学習者を対象とした日本語学習において、コンピュータが広く利用されるようになってきている。外国人学習者の入力するテキストを、誤り検出といった方面に利用可能である。
日本語学校において、初級日本語学習者は初めにひらがなでの読み書きを学習しており、その誤り検出・訂正にはかな書き文の形態素解析が必要である。かなで書かれた文章は、その曖昧さから漢字かな混じり文よりも形態素解析が難しくなる。形態素解析の失敗は、その後に続く処理の失敗にもつながっている。
本稿では、初級日本語学習における形態素解析を始めとする処理の実用のために、かな書き文の語分割を機械学習により行う方式について述べる。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会