情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

7V-03
自己教師あり学習を用いた法文書の文書間検索
○関 泰明,濱上知樹(横浜国大)
法文書などの専門性の高い領域では文書検索のためのクエリの作成に専門知識を必要とするため,文書をクエリとして関連する文書を検索する文書間検索に需要がある.しかし文書間検索タスクでは公開されているデータセットが少なく,新たに作成するにはコストがかかる.そこで本研究では,アノテーションされたデータセットを用いずに検索学習を行うための自己教師あり学習を提案する.提案する自己教師あり学習では,文書から抽出した一部分から同じ文書自身の別の一部分を検索するように学習を行う.また実際の検索時にはクエリ文書に対してキーワード抽出を適用したすることで,不要な情報の除去と計算量の削減を行う.