2N-7
ウェブコンテンツへのセマンティクスの付与
○牛久陽介,久保田光一(中大)
今日ウェブコンテンツの総量はますます急速に増加してきている。
その膨大な情報量は人手に余るので、計算機で効率良く扱おうという試みで、
HTML5やRDF等、様々なセマンティクスを実現する仕組みが提案されているが、
既存コンテンツを修正する手間が大きい等の問題もあり、あまり普及していない。
そこで本研究の目的は、ある単語に関連して抽出されるウェブサイト群に対し、
テキストマイニング、自然言語処理、機械学習等を適切に用いて、
個々のサイトの話題によるクラスタリングやHTML5のセマンティックタグの自動付与を行い、
ウェブコンテンツをよりセマンティックにすることでユーザビリティを高め、また、計算機で扱いやすくするための手法を提案することである。