2A-03
位相的データ解析に基づく言語モデルが生成する埋め込みベクトルの特徴抽出
○佐藤 哲(パーソルキャリア)
自然言語処理では、単語や文章を数値のベクトルで表現する手法が一般的である.
しかし,言語モデルの大規模化と自然言語を表すベクトルの高次元化により,出力されたベクトルの意味を理解することが難しくなっている.
そこで本研究では,高次元ベクトルを多数の低次元ベクトルの集合で表す手法を導入し,低次元ベクトル集合の幾何的な特徴を抽出することで,
効果的に元の高次元ベクトルの特徴量を抽出する手法を提案する.