情報処理学会 第87回全国大会

1T-05
スポーツ実況のための日本語固有名詞音声認識
○野々村美紗,伊藤克亘(法大)
スポーツ実況音声のために日本語固有名詞音声認識システムを実現する。現在、テレビ字幕の付与は人手と部分的に音声認識を用いた付与が行われている。これには、効率の悪さ等の問題があり、完全な音声認識を用いた字幕の付与が求められる。その中でも固有名詞の音声認識は難しい。本研究では、スポーツ実況音声の固有名詞部分の制度改善を図る。まず、既存の音声認識システムから上位の結果を複数含むリストを出力する。そのリストと自然言語の指示、文脈、事前情報を大規模言語モデルにプロンプトとして与えることにより、正しい字幕の生成を行う。得られた結果に対して文章全体と固有名詞部分の文字誤り率を使用して評価を行い、精度の向上を目指す。