1T-03
低リソース言語の自動音声認識における他言語データの効率的利用
○三森俊祐,柏木爽良,田中啓太郎,森島繁生(早大)
本稿では,低リソース言語の自動音声認識における他言語データの活用手法について述べる.従来,目標の低リソース言語に対する言語単位の類似度に基づき,援用候補の高リソース言語のデータセット全体を選別するアプローチが存在する.しかし,同一の援用候補言語のデータセット内でもデータによって目標言語に対する類似度には差があり,この枠組みは部分的な精度悪化を招く.本研究では発話単位の言語的音響類似度に着目した他言語データの選別手法を提案する.トークン化された音響特徴量から言語間類似度を発話単位で計測し,目標言語に類似した援用言語データのみを抽出,学習に使用する.実験を通し,提案手法の有用性を検証する.