情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

2D-07
社内文書検索システム適用を考慮した自然言語処理技術の比較
○齋藤靖二(東芝)
社内に蓄積された膨大な文書に対して類似しているか否かの情報を付与することで、関連文書をユーザーに提示し、効率よく検索することが可能となる。しかし、企業内にある文書は専門用語や言葉の揺らぎや構成の違いなどから、既存のシステムをそのまま適用した場合、必要とする文書を得られないことも多い。また、日々追加される文書とすでに登録された文書との類似情報を付与することが必要なため、検索対象の文書が増えるほど計算量は膨大となり、実務で活用できる速度で結果を得ることが難しくなる場合がある。
そこで、近年発達している自然言語処理を企業内の文書に適用したときの実用性に着目して評価した結果を報告する。