情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

7ZC-01
日本語SMSスパムフィルタリング手法の検討
○今井京志郎,金子直史,鷲見和彦(青学大)
近年,SMS(ショートメッセージ)を利用したスパム(迷惑メール)によるフィッシング詐欺(スミッシング)が急増しており,その検出精度向上が急務である.しかし日本語SMSスパムのデータセットは公開されておらず,研究が困難である.そこで本研究では,英語SMSデータセットを和訳し疑似日本語SMSデータセットを作成することに加え,前処理としてデータから特徴を抽出する新たな手法を提案する.実験では独自に収集した日本語SMSデータセットを用いて,複数の機械学習手法を用いて比較を行った.その結果,スパム検出に広く使われるベイジアンフィルタと比較して,k近傍法を用いた提案手法で約10%上回る精度を達成した.