A Study on Information Retrieval based on Relational Analysis

(邦訳:関係分析に基づく情報検索に関する研究)

 
加藤 誠
京都大学大学院情報学研究科 特定助教

[背景]知らない分野における検索困難性
[問題]既知分野情報の例示による未知分野情報の検索
[貢献]情報検索ための関係分析による異ドメイン間の対応発見


 どのような人にも知っている分野と知らない分野が必ずある.もし検索したい内容が知っている分野の情報であれば,我々はそれほど苦労することなく,その情報を探し出すための検索クエリを生成し,求めている情報が書かれていそうなページを選り抜き,目的の情報に到達できるであろう.しかし,一方で知らない分野の情報発見には労力を要することが多い.もし適切な検索クエリが思い浮かばなければ,知っているキーワードによって検索を行い,自分にとって必要な情報がどのように呼ばれているかをまず知る必要がある.適切なクエリを入力できたとしても,検索結果のうち一体どの情報が自分の欲しかったものなのか,得られた情報を比較し検討するのに時間を要するかもしれない.たとえば,静岡を訪れたことがなくあまり詳しくない場合,「静岡でやや高級なその土地ならではの料理が食べたい」と思った時に,どのように店を探すべきであろうか.まず静岡ではどのような食べ物が有名か,そして,どれくらいの値段がやや高級なのか調査しなければならないだろう.

 本研究では,知らない分野における情報検索の諸問題を解決するために,自分のよく知っている分野の情報を例示することによって,それに対応する情報を知らない分野から発見する検索手法を提案した.上述の静岡の例を用いれば,例えば京都出身のユーザは「京都でやや高級なその土地ならではの料理を出す店」を入力することで,自身の意図に合致した店の情報を得ることができる.この検索方法によって,ユーザが知らない分野の知識を必要とせずに,目的の情報にたどり着くことを可能にしている.本検索手法はアナロジーの理論に基づくものであり,単語・クエリ・オブジェクト(店など)間の関係を分析することで,異なる分野間で対応する情報を発見している.

 本研究で取り組んだ3つの課題について以下で述べる.

【語関係に基づくクエリ修正】
語の関係性をWeb検索エンジンの索引を用いてモデル化し,与えられたa, b, cという語に対して,aとbの関係,cとdの関係が類似するような語dを発見する方法を提案した.たとえば,3つの語「京都」「八つ橋」「静岡」が与えられたときに語「安倍川もち」を自動的に発見することができる.これにより,静岡で京都の八つ橋にあたる食べ物を検索することができる.

【クエリ関係に基づく構造化クエリ推薦】
検索エンジンのログデータから,異なるクエリに対するクエリ推薦の対応関係を発見することで,構造化クエリ推薦インタフェースを実現した.たとえば,2つのクエリ「京都」「静岡」間で対応するクエリ推薦「京都 ラーメン」「静岡 焼きそば」を発見し,その対応をユーザに提示することで知っている分野と知らない分野を対応づけて検索を行うことができる.

【ドメイン-オブジェクト関係に基づく例示検索】
ドメイン-オブジェクト関係を考慮することで,各オブジェクトの所属ドメインにおける役割を特定することによって,異なるドメインにおける例示検索を可能にした.


 
 
 (2013年6月12日受付)
取得年月日:2012年9月
学位種別:博士(情報学)
大学:京都大学



推薦文
:(情報基礎とアクセス技術研究会)


本研究は,関係を分析しその類似度を利用したさまざまな情報検索手法について提案しており,その成果として,Web情報システムに関する国際会議WISE 2008にてBest paper awardを受賞し,さらに,情報検索およびWebに関するトップカンファレンスであるACM SIGIR,WWWにも採録されている.国際的な場における飛躍に期待し,推薦する.


著者からの一言


情報を探すことは人にとって根源的な活動であり,それを探求する情報検索は人と情報のモデル化に挑戦するとてもエキサイティングな分野だと思います.情報検索について研究する場を与えてくださった先生方,また,情報検索の面白さを教えてくださった方々に感謝すると共に,より多くの人がこの分野に興味を示してくれるような,良い研究を行っていきたいと思います.