情報処理学会 第87回全国大会

6A-03
スパムメールフィルタリングにおける辞書にない語の特徴とその分類利用の効果
○天満誠也(福山大)
スパムメールフィルタリングの性能を向上させるため、辞書に載っていない語の特徴を、分類に活用する可能性について検討する。スパムメールには、フィルタをすり抜けるため、意図的にスペース、記号またはHTMLタグといった余分な文字を挿入した、辞書に載っていない語が出現する。このような語をフィルタリングで用いるとき、余分な文字の削除や、類似語の探索などといった操作により、辞書に載っている語に変換してから扱うことが多い。しかしこのアプローチでは、辞書に載っていない語そのものの特徴が失われてしまう可能性がある。本研究では、辞書に載っていない語の特徴がフィルタリングへ活用できる可能性について検討する。