FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
D-028
データ取得制限のあるDeep Webからのサンプルデータ収集方式
杜  翔・大森 匡・藤田秀之・新谷隆彦・邱  原(電通大)
従来のDeep Webのクローリングは,ニュース記事のようなテキストデータを対象としてきた.一方で,生成時刻や位置情報を持つ空間データも,さまざまなSNSのデータベースを代表とするDeep Webに大量に蓄積されている.一部のサービスでは,データを取得するためのAPIが公開されているが,全てのデータを取得されることを避けるため,さまざまな利用制限が設けられている.そこで本研究では,指定された時空間におけるサンプルデータを,検索APIの制限を考慮して,効率よく取得する手法を提案する.本稿では,大規模な写真共有サービスであるFlickrの位置情報付き写真を対象とする.