1T-07
大規模言語モデルを用いた音声コンテンツの有害発言マスキング
○大島隆太郎,細田侑也,飯國洋二(阪大)
本研究では、有害な発言をマスキングしながら音声を書き起こす手法を提案する。音声系SNSの普及により、ヘイトスピーチのような有害な発言が世界中に発信されやすい。従来研究では、音声認識モデルによる書き起こしを入力とするBERTモデルでトピックを識別する.そのモデルをLIMEで解析することで書き起こしに対してマスキング処理を施す。しかし、音声認識モデルの認識性能に依存するだけでなく,暗喩表現のマスキングは困難である。提案手法では、大規模言語モデルを音声認識モデルのデコーダに置き換えることで、音声の書き起こしとマスキングを同時に処理しながら複数の有害な単語や暗喩表現の正確なマスキングを実現する。