抄録
E-017
ウイグル語からの自動辞書構築に関する研究
ZIPAER MAYINUER・吉田 稔・松本和幸・北 研二(徳島大)
本研究ではウイグル語辞書の自動構築をするため、ウイグル語ニュースサイトの記事中の単語をword2vecでベクトル化して、類似語のリストを作成した。
分類された類似語のリストを10単語と設定した時の結果は類似単語91%、関係ない単語 9%であり。
10、20、30、...、100単語まで設定して実行すると結果は類似語の平均正解率60%になった。
正解率を上げるため、今後の研究ではコーパスを増やし、分かち書きを行うことを考えている。