5ZF-02
全ペア類似度検索手法SlideSortのタスク並列による高速化
○藤川向日葵,清水佳奈(早大)
リードクラスタリングなどの解析において, 文字列集合中の類似ペアを見つけることは基本的な処理である. 近年, DNAシーケンス技術が大幅に進歩しており, 膨大なショートリードについて高速に処理することが求められている. SlideSortは文字列集合中の類似ペアを高速に発見するためのアルゴリズムである.
SlideSortにはすでにデータ分割による並列化が存在するが, アルゴリズムの性質上, データ分割により高い並列性能を得ることが難しい. 本研究では, データ分割ではなくタスク分割により動的なスケジューリングを行うことで, 実行時間の大幅な削減を実現した.