情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
D-026
HBaseマッピングによる日本語WordNetを利用した番組等検索システムに関する研究
陳  豊・Sriprasertsuk Pao・亀山 渉(早大)
 地方振興の一環として,WebやSNSから抽出した人気キーワードを用いて番組コンテンツを検索するシステムを実現するために,本研究では,日本語WordNetを使用し,人気キーワードの上位語と下位語を拡張し,データベースのメタデータと照合する手法を提案している.検索効率を上げるために,日本語WordNetをSQLiteデータベースからHBaseへマッピングし,上位語と下位語のデータを再構築する手法を試みた.SQLiteとHBaseの検索時間を比較した結果, HBaseの場合,キーワードが8個の場合は約35倍,100個の場合は約40倍に検索時間が短縮されることを確認した.