情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

1N-07
レーベンシュタイン距離行列シルエット分析クラスタリングによるスパム判定モデル
○赤澤優佑,大槻 明(日大)
本研究では,スパムレビュー検知のための機械学習スクリプトを研究開発した.具体的に,ECサイトのレビューを数千件取得したうえでサンプル調査を行い,スパムレビューの特徴として「レビューテキストの一部が類似する」ことと「極端に商品を褒めるもしくは貶す」という2点を明らかにした.ゆえに,本提案スクリプトでは,レーベンシュタイン距離を用いてレビューの一部が類似する2レビューを抽出し,さらにこれらのレビューを極性分析にかけることで上記2点の特徴を持つレビューを検出するスクリプトを研究開発した.このスクリプトによって,従来のスパム検知手法よりも意図的なスパムレビューを検出できると考えられる.