情報処理学会 第87回全国大会

4ZG-02
Transformerを用いたオンライン会議音声のパケット損失の回復
○稲村直哉,伊藤克亘(法大)
音声欠落を回復するためには欠落部分の前後の音声情報が必要である。しかし、オンライン会議などの通話ではリアルタイム性が重要視される。そのため欠落部分の先の情報はほとんど使われない。また、音声情報を随時読み込み処理するため、言語情報なども用いることができない。そこで今回の手法では、随時処理するのではなくチャンクで区切ることで欠落の後の音声情報を使用できるようにする。また、回復した波形を音声認識することで言語情報も併せて使用できるようにし、欠落回復の精度向上を目指す。