5ZD-07
HTML5のセクショニング要素自動付与システムの提案
○今泉智博,斎藤裕佑,西山裕之(東理大)
2014年10月に正式勧告された新しいHTML規格であるHTML5では、セクショニング要素と呼ばれる新しいHTMLタグが導入されたことで、Webページ内コンテンツの抽出、特定や検索精度の向上が期待されている。
しかしセクショニング要素が規格化される以前に作成されたWebページが未だ数多く存在する。
そこで本研究では、セクショニング要素を持たないWebページに対して自動付与するシステムの提案を行う。
本提案手法では、セクショニング要素を持たないWebページにセクショニング・コンテンツが付与される過程を観測し、そのパターンを学習することで適切な挿入位置を予測可能となる。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について