FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
F-021
MEET演算を用いた組合せ集合間の類似度の定義と応用
竹内文登・鈴木浩史・白石恒介・井上祐馬・湊 真一(北大)
購買履歴や文書などの多くの現実のデータは組合せ集合とみなすことができる。このような組合せ集合に対して,それらの類似度(距離尺度)を定義することは,データマイニングや機械学習などの分野に応用できると考えられる.細川らは組合せ集合間の共通因子を求めるMEET演算を用いた類似度を定義した.これは二つの組合せ集合に,共通するアイテムを含む組合せが多く出現するならば,それらは似ているというアイディアに基づく .しかし,この定義では類似度の値が負となる場合が存在するなどの問題があった.本稿では細川らの定義を改良した組合せ集合間の類似度を与え,Twitterユーザーの分類への応用から有効性を検討する .