FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
D-044
機械学習によるセンサー異常値検出
栗原慶典・根山 亮・三宮千尋・那和一成(トヨタIT開発センター)
データ解析において、信頼性の高いデータを使用することは重要であり、仕様と異なるデータや異常値を含むデータは事前に取り除く必要がある。このクレンジング処理には時間がかかる上に、専門的な知識が必要である。
本研究ではクレンジング処理を自動的に行うことを目的とし、例題として時系列データを取り上げ、このデータに含まれる4種類の異常値の検出を試みた。実験では、異常レベルの異なるデータを人工的に生成し、教師あり機械学習手法としてのRandomForestを使用して自動的かつ簡便に異常値を検出した結果、異常レベルの高いデータでは適合率、再現率ともに90%以上の精度で検出できることが判明した。