FIT2015 第14回情報科学技術フォーラム

抄録

D-028
データ取得制限のあるDeep Webからのサンプルデータ収集方式

杜　　翔・大森　匡・○藤田秀之・新谷隆彦・邱　　原（電通大）

従来のDeep Webのクローリングは，ニュース記事のようなテキストデータを対象としてきた．一方で，生成時刻や位置情報を持つ空間データも，さまざまなSNSのデータベースを代表とするDeep Webに大量に蓄積されている．一部のサービスでは，データを取得するためのAPIが公開されているが，全てのデータを取得されることを避けるため，さまざまな利用制限が設けられている．そこで本研究では，指定された時空間におけるサンプルデータを，検索APIの制限を考慮して，効率よく取得する手法を提案する．本稿では，大規模な写真共有サービスであるFlickrの位置情報付き写真を対象とする．