情報処理学会 第87回全国大会

1Q-05
Ada2 のテキストエンベディングにおける周辺情報の反映に関する考察
○福田朝陽(立教大)
本研究では、Ada2を用いたテキストエンベディングで、学習時に使用されたと考えられる文章と、それに近い性質の未知の文章について、埋め込みベクトルに含まれる周辺情報がどのように変化するかを検証した。特に、歌詞データを用いて、モデルが学習した可能性が高いデータ(知識カットオフ以前の曲)と未学習のデータ(カットオフ以後)でエンベディングの性質が異なるかを調査した。その結果、カットオフ以前のデータと以後のデータで、周辺情報(アーティスト名)の反映度合いに差異が確認された。これにより、学習済みモデルの利用について、一般的知識の埋め込みではカットオフ日時に起因する性質の変化を考慮する重要性が示唆された。