抄録
CF-005
分散処理基盤のための粒子フィルタ実装手法の検討
佐藤 哲(NHNテコラス)
粒子フィルタは,モデル上はサンプルデータ同士が独立であることを仮定するため,分散並列処理計算が可能であるとされている.しかし,現実的にはデータの移動や集約が避けられないため,単純に標準的なアルゴリズムに沿って実装した場合,入力データ量及び粒子数が多くなるに従い計算機資源消費の爆発的な増大が発生する.特に,外れ値の発生が想定される場合には,低い確率で発生するデータに対応するために粒子数を増やす必要があり,使用される計算機資源の抑制が課題となる.そこで本発表では,入力データの移動や集約を避けるためのアルゴリズムを考察し,分散処理基盤であるApache Spark/Hadoop上で効果的に実行されるように改良した手法について述べる.