4J-06
大規模コードクローン検出のための,部分一致文字列を対象とした省メモリ化プログラム変換の予備的な性能評価
○山崎徹郎,佐藤芳樹,千葉 滋(東大)
膨大な量のソースコードから類似したコード片を見つける,大規模コードクローン検出はソフトウェアリポジトリマイニングにおける挑戦の一つである.
大規模コードクローン検出の課題の一つに,大量のメモリ消費による処理スループットの低下が挙げられる.
コードクローン検出器は内部にソースコード片を文字列として保持するが,これらの重複が増加すると,計算機の処理性能を十分に生かせない.
本研究では,文字列の重複を排除するために,実行時に文字列の部分一致を検出し,重複データを共有させるようにプログラム変換を行う.
しかし文字列の部分一致検出は計算コストが高く,実行時間のオーバーヘッドが無視できない.
そこで,プログラム中の特定の範囲でのみ検出と共有をする実装を行い,いくつかの範囲について実験することで省メモリ性能とオーバーヘッドを調べた.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会