情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

1ZA-01
ツイートの文章に使われている句読点などに基づく属性推定
○江口大賀,菊池浩明(明大)
従来のSNSの文章を用いた属性推定では,特定の名詞などの出現割合に着目する事が多い.特定の名詞に着目する手法では,推定結果が趣味・興味などに依存しがちである.そのため,性別・年代といった属性推定において、高い精度の属性推定が難しかった.そこで,一般的には自然言語処理の過程で省かれる句読点などの出現回数に着目した.その結果,ユーザーの年代が上がるにつれて句読点などの出現回数が増える事が分かった.本論文では,プロフィールからあらかじめ性別・年代が分かっている400人分のツイートを用いて,句読点などの出現回数から属性推定を行い,その推定精度を報告する.