4W-05
音声認識誤り訂正のための疑似誤り付与によるデータ拡張
○鈴木悠生,綱川隆司,西田昌史(静岡大)
音声認識システムにおいて生じる認識誤りを軽減するための誤り訂正モデルの学習においては、誤り事例の学習データが不足するという課題がある.本研究では疑似誤りを付与した対話データとT5を利用し,対話形式の発話における音声認識誤りの訂正をテキストベースで行う.まず,実際の人間同士の会話の音声認識結果から認識誤りの特徴を観察した.その特徴をもとに疑似誤りデータを作成し,訂正モデルの転移学習に利用した.実験では,入力文として訂正対象のみを使用した場合とその前後の発話も追加した場合で訂正を行い,性能を比較した.