6U-6
デジタル放送の字幕情報と発話傾向を考慮した発話者アノテーション
○山室慶太,伊藤克亘(法大)
録画機器の発達に伴い、大量の映像コンテンツをアーカイブ化されている。
そのため、視聴者の要求する映像をすばやく提供するために、メタデータによる検索システムが数多く提案されている。
本研究では従来手法でメタデータの自動抽出が行われていないドラマ、アニメーション、バラエティ番組を対象とする。
これらの番組の全ての台詞に対して発話者情報をメタデータとして抽出する。
具体的には、デジタル放送に付与されている字幕情報を活用することで識別モデルの高精度化を行い、同時に発話傾向を考慮した話者の出現頻度を用いて識別結果を重み付けすることで効果的なディジタル放送の話者識別を実現する。
20番組を用いて評価を行った結果、従来手法より3.5%改善された。