2U-01
ドキュメント構造の自動抽出
○鵜飼理央,山本博史(近畿大)
文に対して,構文解析や係り受け解析を行うことは,文中の各形態素の文法的,あるいは意味的な役割を知る上で不可欠である.同様に,ドキュメントの構造を解析することで,文や文中の形態素のドキュメント内の意味的役割を知ることができると考えられる.そして,この情報はキーワードの使われ方に依存した検索や,複数ドキュメントの自動要約に有用であると考えられる.
本稿では統計量に基づいてドキュメント構造を自動的に抽出することを試みる.その結果,ドキュメントを自動で構造ごとに分割することが可能となった.得られた構造はずしも人間の感覚とは合わないが,同一内容の異言語のドキュメントに対しては,ほぼ同一の結果が得られた.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会