4P-5
様式の更新に対応した帳票のDB自動構成法の提案と評価
○大野雄也,伊藤久祥,伊藤憲三(岩手県大)
DBの知識が不要な帳票を電子化する手法として,レイアウトの事前登録が
不要なタイプの帳票解析手法が提案されてきた.しかし,DBのテーブルに
対応する表を複数内包し,かつ状況に応じて様式を更新される帳票の
解析手法は未だ提案されていない.本研究では,OCRソフトの利用等により
得られる罫線等の帳票の構成要素を用いて,上記特徴を持つ帳票の解析手法
及び帳票の様式変化前後で一貫性を保つDBの自動生成手法を提案する.
行(列)方向における繰り返し構造を表として検出し,項目名と記入データを
DBに格納する方法を用いる.この際,表構造の正規化処理,項目名の
類義語判定処理を加えることで,様式変更時に生じる文字列・セル構造の
微細な変化による誤検出を低減した.