情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

4D-03
マイクロブログからの典型的使用場面付き辞書の構築
○岡 利成,白井清昭(北陸先端大)
単語の典型的使用場面の情報が付加された辞書をマイクロブログから自動的に構築する.典型的使用場面とは,単語がよく使われる【時間】【場所】【職業】と定義する.例えば,「おはよう」は【朝】に,「兼六園」は【石川県】を話題とするテキストに,「注射」は【医者】が書いたテキストに,それぞれよく使われる.まず,Twitterから時刻,場所,ユーザの職業がメタデータとして付与されたツイートを収集する.職業のメタデータについてはこれを半自動的に推定する.次に,単語が特定の場面のみに出現する傾向を Kleinburg のバースト検出アルゴリズムにより定量化し,それが強い単語を取得することで辞書を構築する.