情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

4C-03
日本語音声データを利用した韓国語音響モデルの学習
○太刀岡勇気(デンソーアイティーラボラトリ)
多言語音声認識を行う際に,音響モデルを複数の言語で同時に学習することがよく行われている.その際に,IPAなどの汎用的な音素の集合を用いて,分類器を構築する方式や汎用文字符号化が使われる.しかしながら,このアプローチは音素集合の似た言語同士では非効率的である.ここでは,ほぼ音素集合が重なる言語である,日本語と韓国語を取り上げる.対象言語を韓国語とし,日本語の音素を韓国語の音素に変換することで,同時学習を行う.韓国語の音声認識性能を向上させるために,日本語の音素セットを機械的に変換して学習を行った実験により,韓日で同時学習を行ったのちに,韓国語のデータのみでファインチューニングすることで単語誤り率の改善が得られた.