
抄録
D-023
クロールデータのプロビジョンスキームにおけるファイル入出力機構の検証
◎伊藤 公・三上喜貴・中平勝子(長岡技科大)
著者はWebコンテンツ内のリンク構造や利用言語など利用レイヤーにおけるデジタル・デバイドの実態把握のため,独立に収集されたクロールデータの統合を図るファイルフォーマットを含めたデータプロビジョンスキームを提案した.このファイルフォーマットは,数百GB-数TBのサイズをもつクロールデータを機関横断での流通・統合に最適なファイルサイズに分割して提供する.そのため,円滑なデータ入出力に関する各種パラメータ(分割サイズ数など)と統合アルゴリズムの動作状況の関係を示す必要がある.本稿では,動作検証を通じて,最適なパラメータを推定する.