抄録
D-005
学術情報データベースにおける質的データのクラスター形成手法
菊池 桂・升井洋志(北見工大)
大規模なデータにおけるデータ解析およびデータ可視化の一手法として、クラスタリングがある。
一般的に対象データ間の相対距離が多次元空間でのユークリッド距離として定義できる場合は、クラスタリングは多次元の分布の偏りとして表現可能である。しかし、学術情報データにおける著者や所属機関といった質的データについては、ユークリッド距離を一意に定義できないためにクラスタリングが困難となる。本稿では、学術論文間の関連性の把握と今後の研究動向を推測することを目的に、質的データを多く含む学術論文において、著者や著者の所属機関といった書誌情報から学術論文間の相対的距離を算出し、クラスタリングを行う手法を提案する。