抄録
CF-006
試験問題画像からのXMLメタタグ検出
松本 涼・遠藤聡志(琉球大)
国立情報学研究所のプロジェクト「ロボットは東大に入れるか」(以下「東ロボ」)は、センター試験を計算機に自動で解かせる取り組みを行っており、2016年時点で、全教科合計の偏差値57.1を獲得した。しかしながら、東ロボくんの入力は画像ではなく、独自規格のXML(以下「東ロボXML」)に変換している。また、東ロボXMLへの変換は人手で行われている。このため、XML化に人手がかかっている。また、XML変換の自動化は難しく、自動化を試みた先行研究でも、全ての情報を取得できてない。そこで本研究は、試験問題のXML変換の自動化を最終目標とする。その第1段階として、Object Detection によるXMLメタ情報の抽出手法を提案する。