4R-2
統計翻訳を用いた、古文、現代文間の機械翻訳
○一色克将(近畿大)
統計翻訳は対訳辞書や文法によらず、翻訳元言語と翻訳先言語の対訳コーパスから得られる統計量に基づいて翻訳を行う手法である。統計翻訳の性能は、翻訳元、翻訳先言語言語の類似性に強く依存することが知られている。古文と現代文は本来同じ言語であるため、共通の単語が多く、語順がほとんど変わらないため、類似度が高いと考えられる。
本研究では、この類似度の高さに着目し、古文、現代文に対し統計翻訳を行うことを試み、どの程度古文、現代文対訳コーパスを用いれば十分な性能が達成できるかの確認を行った。