情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

1W-08
日本語処理における英語のための自然言語処理data augmentation手法の有用性検証
○仲宗根太朗(明大)
data-augmentationは不均衡データ、低リソースドメイン、大規模モデルの過学習などの問題に対応し、近年注目を集めており、様々な手法が提案されている。しかしながら、画像処理では拡大・縮小・回転などの方法でラベルを変化させずデータを増やすことができるのに対して、自然言語処理では用いる単語が変化するだけで正解ラベルに大きな影響を与える可能性がある。また、言語によって文法などが変わるため、言語が異なる場合、同様の効果を発揮するとは限らない。
本稿では、英語自然言語処理で提案されているdata-augmentation手法を日本語自然言語処理に適用し、その有用性及び、効果を発揮する条件を検証した。