情報処理学会第88回全国大会

人間は発話の際に言い間違うことがあるが、発話した本人は気づかない場合がある。例えば、正しくは「うろ覚え」だが、「うる覚え」と言い間違える等が挙げられる。そこで本研究では、マスク化言語モデルRoBERTaに言い間違いコーパスを渡しファインチューニングさせることで、言い間違いの有無を判別できるモデルの作成を目指す。言い間違いコーパスの内容をそのまま学習に使った場合、高い精度は確認できなかった。そこでモデルが学習しやすいように、コーパスに対しローマ字変換やわかち書きをするなどして新しく学習用コーパスを作り学習に用いた。その結果、精度の向上が見られた。