情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
E-001
ソーシャルブックマークを用いたウェブサイトの意味内容の抽出
長谷川直広・Runhe Huang(法大)
ユーザがアクセスしたウェブサイトやSNS上で取り上げたウェブサイトをユーザの趣味趣向を反映した情報とし、ユーザプロファイルの作成する研究が行われている。ウェブサイトの内容をユーザプロファイルに組み込む際、ウェブサイトのコンテンツから代表的な単語である特徴語を抽出し用いているが、ウェブサイトの形態は様々であり、ブログやウェブ記事などの文章が多いウェブサイトでは有効であるが、その他の場合では正しく内容を抽出することができない。本研究では、ソーシャルブックマークから取得できるウェブサイトに付与されたタグ情報をもとに機械学習を用いてウェブサイトの内容を抽出する手法を提案する。