4L-06
テキストマイニングを用いたWeb上に公開されているソースコードの類似とその傾向に関するー考察
○小野将史,岸本頼紀(東京情報大)
Web上に公開されているソースコードや生成系AIの提案を参考にプログラムを作成する場合、作成されたソースコードが類似すると考えられる。本来多様であるソースコードであるが、この要因からある利用目的のプログラムにはデファクトスタンダードが発生するのではないかと考えられる。そこで、Web上に公開されている利用目的が類似したソースコードについて文書類似度によるクラスター分析を試みた。本例では、多くのソースコードが属するクラスターが確認された。これらの結果と特徴の考察について報告する。