情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

4W-04
単語分散表現における女性標示語のステレオタイプの定量化
○陳 蕾思,杉本 徹(芝浦工大)
人工知能の差別問題は人工知能分野の重要な課題の一つである。人工知能が性差別を学習してしまう主な原因の1つは、訓練データ自体に言語の差別が含まれていることである。一方で、日本語では男性視点から女性を描いた女性標示語が多い。コーパスに含まれるこのような女性標示語に女性へのステレオタイプがあるか、人工知能の公平性に影響が与えているかに関する研究はまだ少ないのが現状である。そこで、本研究では、単語埋め込みを用いた日本語の女性標示語のベクトル化により、女性標示語に隠される女性へのステレオタイプを分析した。