抄録
E-022
字幕文字列自動対応付けのための連語Ngram音声認識に関する検討
高橋伸弥・森元 逞(福岡大)
近年,聴覚障害者のための字幕付き番組放送の普及が重要課題とされ,官民を挙げた字幕放送の拡充が急ピッチで進んでいる.字幕文字列は1度に表示可能な文字数の制限や表現の適切さなどの観点から,予め用意されていることも少なくないため,これらの字幕文字列をどのタイミングで表示すべきかが問題となる.そこで本研究では,映像中に含まれる音声情報との対応付けを高精度に行うことを目的として,Web上の出現頻度情報を基にして用意された少量の字幕文字列から音声認識用Ngram言語モデルを作成する.その際,複数の単語から成る定型的な表現(連語)を単位とすることで精度を向上させることを試み,実験により提案手法の有効性を検討した.