2D-4
Sequential Co-clusteringを用いた行列近似手法とその定量的分析
○稲垣隆史,Danushka Bollegala,石塚 満(東大)
行列の低ランク行列による近似は、自然言語処理においてノイズの削減や同義語
・多義語問題の解消に役立っている。潜在意味解析(LSA)による行列近似手法は、
特異値分解を用いることで、元行列との二乗誤差を最小にするような低ランク近
似行列が得られることが数学的に証明されているが、計算量もO(N^2~N^3)とな
ることが知られている。提案手法は、元行列に対してsequential co-clustering
(Bollegala et al. WWW 2010)を実行し、得られたクラスタの重心ベクトルを用
いて行列近似を行うものである。その結果、平均計算量はO(NlogN)で、元行列と
の二乗誤差もLSAに匹敵する性能を得た。