6L-9
プログラミング言語 Ruby のための Unicode 正規化ライブラリの効率化
○野島 歩,松原俊一,Martin J. Duerst(青学大)
Rubyなどのインタプリタ言語では処理の遅さが問題視される.特に,国際化に必要な文字処理の場合に,効率的な実装が重要である.
本研究ではRubyの高度な組込み機能を利用し,効率の良い実装を実現する.Unicode正規化のパターンは理論上無限に存在する.単一の正規表現ですべてのパターンを検出し,分割する.しかし,置換の種類は実際に自然言語によって数種類から数千種類に限定される.これはハッシュに置換パターンをキャッシュすることで対応する.
結果として,他のRuby用ライブラリの性能を上回り,コンパイルされた言語の実装に近い速度を実現した.この手法による効率化は他の処理に応用することもできる.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について