情報処理学会 第86回全国大会 会期:2024年3月15日~17日

4ZB-01
エッジAIにおける軽量化した推論モデルの性能分析
○北 和樹,林 冬惠(岡山大)
近年,低遅延での推論を行うことができるエッジAIの技術が注目されている.しかし,エッジデバイスでは計算資源が限られるため,AIモデルの軽量化が求められる.また,エッジデバイスの計算資源にはばらつきがあるため,最適なモデルがデバイスによって異なる.そこで本研究では,最適な軽量化モデルをエッジデバイスに配備するために,様々な計算資源の条件下で軽量化した推論モデルの性能分析を行う.具体的には,まず軽量化モデルの性能分析のための環境を構築し,構築した環境で軽量化したモデルの実行時間や精度の分析を行う.分析によって,異なる計算資源の条件下での最適なモデルを示した.