抄録
F-038
機械学習における特徴量類似性と認識精度に関する検討
藤岡優也・三好 力(龍谷大)
機械学習における教師あり学習では人手によるラベル付きデータを多数学習に用いるほど識別率が高くなることが知られている。しかし、ラベル付きデータは一般的に高コストである。このコストを削減し、識別率を向上させることは機械学習において重大な課題の一つである。そこで本研究では特徴ベクトル間の類似性に着目し、少数のラベル付きデータから多数のラベルなしデータのクラスを特徴ベクトル間距離によって決定して訓練データとして用いる手法を検討し、①合成データの平均ベクトルからの距離の閾値が近いほど識別率が向上するのか②訓練データに加える合成データの数が多いほど識別率が向上するのかを検証する実験を行った。