6S-07
URL文字列の特徴量からユーザーへの攻撃を検出する機械学習モデル
○田原舜大,秦野 亮,西山裕之(東理大)
近年、サイバー攻撃は増加傾向にあり、その手段の1つとしてURLが利用される。従来のパターンマッチングを用いた攻撃検出手法では、これまでにないパターンのURLに対して、検出漏れが発生してしまう可能性が高い。そこで本研究では、そのような検出漏れを減らすために、フィッシングやXSSなどのURLにアクセスしたユーザーに直接的に被害を及ぼす恐れのある有害なURLの検出を行う機械学習モデルを提案する。具体的には、URLを文字列データとして扱い、そのURL内に見られる検出対象の攻撃によく利用されると考えられる文字の有無や個数などを元に特徴量を作成し、複数の学習器をスタッキングさせて検出を行う。