情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

6W-01
企業Webサイトからの事業情報の抽出と業種別の類似事業推定
○松浦 遼,藤井章博(法大)
近年,ウェブページの数は増加しており様々な情報を手に入れることができる一方で,膨大な情報の中から求めている情報の取得が困難である問題があげられる.本研究では企業の事業情報に着目し,web上にある企業の事業情報から類似事業を推定することを目的として,企業のホームページから企業が行っている事業に関する情報を抽出,推測する手法を提案する.本手法ではより細かな類似事業の推測をするために業種別に類似事業の推測を行った.業種分類にはBERTをファインチューニングしたモデル利用し,類似文書の推測にはfasttextを用いた分散表現を利用した.