情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

1L-03
辺重み付き系列二分決定グラフによる頻出部分列の多重集合表現とその評価
○杉野 創,川原 純,湊 真一(京大)
文字列集合を効率的に表現することは、パターンマイニングや索引化といった幅広い応用において重要である。Loekitoらが提案した系列二分決定グラフ(Sequence BDD, SeqBDD)は文字列集合を効率的に表現するデータ構造である。本研究では、SeqBDDを拡張し、文字列の多重集合を表現するEdge-Valued SeqBDD(EV-SeqBDD)を提案する。EV-SeqBDDはSeqBDDの特徴を継承し、効率的に文字列の多重集合を表現、操作することができる。本発表では、提案する手法について述べ、頻出部分列集合をグラフで表現する既存手法と比較し、効率を評価する。