
抄録
D-028
データ取得制限のあるDeep Webからのサンプルデータ収集方式
杜 翔・大森 匡・○藤田秀之・新谷隆彦・邱 原(電通大)
従来のDeep Webのクローリングは,ニュース記事のようなテキストデータを対象としてきた.一方で,生成時刻や位置情報を持つ空間データも,さまざまなSNSのデータベースを代表とするDeep Webに大量に蓄積されている.一部のサービスでは,データを取得するためのAPIが公開されているが,全てのデータを取得されることを避けるため,さまざまな利用制限が設けられている.そこで本研究では,指定された時空間におけるサンプルデータを,検索APIの制限を考慮して,効率よく取得する手法を提案する.本稿では,大規模な写真共有サービスであるFlickrの位置情報付き写真を対象とする.