情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

2V-05
機械学習による英文の難易度推定手法の検討
○髙橋里紗,来住伸子(津田塾大)
英語を母国語としない英語学習者にとって、適した難易度の英語学習教材を利用することは非常に重要である。本研究では、英語学習者向けに英文の難易度(英語の運用能力の国際基準であるCEFRレベル)を推定することを目指している。今回は、機械学習による自然言語処理モデルBERTを使い、CLC(Cambridge Learner Corpus)コーパスから抽出したCLC FCE(First Certificate in English)データセットを使って、文書分類によってCEFRレベルを推定した。BERTによる分類結果を、CEFRレベルの語彙数を特徴量としたクラスタリングによる分類と比較し、結果を考察した。