情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催 情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催

6N-03
プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正
○神谷賢太郎,東中竜一郎,川瀬卓也,長尾 確(名大)
プレゼンテーションの発表者の発言を高精度で音声認識することは,多くの専門用語が使用されることなどから困難である.そこで,本研究では,プレゼンテーションで使用されるスライド情報と認識対象の周辺の発言を補足情報として用い,音声認識結果を修正することで音声認識精度の改善を試みる.この修正には,深層学習モデルを用い,音声認識結果と補足情報から抽出した特徴量を入力とし,音声認識結果の正解を出力するようにモデルの学習を行う.実際のプレゼンテーションデータを対象とした実験の結果,提案手法が音声認識精度の改善につながることを確認した.