情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

6ZK-04
中国語と日本語の同形異義語の意味の違いの可視化
○韓  禾,伊藤貴之(お茶の水女子大)
中国語も日本語には同じ漢字を用いた熟語が多数ある。例えば「検討」「質問」「連想」が該当する。一方で、同じ漢字の熟語でも中国語と日本語で同じ意味になるとは限らない。このような単語は同形異義語(homographs)と呼ばれる。本研究では、中国語と日本語の同形異義語の意味の違いのパターンを可視化によって発見する。
この研究は3つのステップで構成される。まず、中国語と日本語の同形異義語を探し、中国語と日本語の意味を中国語で記述する。次に、simCSEモデルを用いて、これらの意味を表す「文埋め込み」を形成する。そしてこれらの「文埋め込み」を次元削減し、可視化する。本報告では可視化結果からいくつかの事例を紹介する。