情報処理学会 第88回全国大会

1Y-03
大規模言語モデルによる日本語文章の簡略化
○平井将貴,吉見毅彦(龍谷大)
難解で長い日本語の文章を読む際、従来は読者が内容を理解することを要約により支援することが多かった。しかし、要約のみでは表現の難しさが残る場合がある。そこで本研究では、要約に加えて表現の平易化も同時に行う簡略化を目的とした手法を提案する。本研究の主な課題は、簡略化のための学習コーパスの構築である。この課題を解決するために、NHKが公開する「NHK NEWS EASY」の簡略化記事と元記事を対応付けてコーパスを構築した。そのコーパスを用いて大規模言語モデルのファインチューニングを行った。