5M-3
大規模な異種データ解析のための情報基盤
○山田拓人,鈴木一徳,和良品友大,林 隆史(会津大)
近年、Hadoopなどの大規模のデータを分散処理するフレームワークが
普及したことにより、蓄積された大量のデータを分析する
データマイニングが盛んに行われている。

しかしながら、複数の異なる種類のデータを組み合わせた分析では、
各々のデータフォーマットが異なるため、分析処理が複雑になってしまう。

そこで我々は異なる種類のデータを組み合わせた分析を容易にするために、
様々なデータをある一定の形式に変換可能な情報基盤を構築した。
具体的には、すべてのデータを分析処理が容易なXML
または構造を持ったテキスト形式に変換する。

構築した基盤を用いて、
各種センサー・医療用データ・天候データ
を組み合わせたデータマイニングの結果も含めて報告する。