情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

5K-01
発生頻度の少ないコーディング規約違反データ統合による検出精度向上への試み
○亀岡 令,伊原彰紀,南 雄太,大森楓己(和歌山大)
規約違反自動検出ツールは,高品質を保証するために膨大な規約違反を検出するが,開発者は全て修正することはない.従来研究では開発者が優先的に修正すべき規約を特定するための機械学習モデルを構築している.しかし,機械学習の検出精度は学習データセットサイズに依存し,規約によって発生数,修正率に偏りがあるため,修正すべき規約を検出するだけの十分なデータを収集できないことも多い.本研究では,違反数の少ない複数の規約を混合して学習させることで,学習データセットサイズが小さい場合の違反検出精度の向上を目指す.