6ZD-6
音声情報を用いたエンターテインメント動画のシーン分析と評価
○漆畑龍典,山内俊明,納富一宏(神奈川工科大)
近年,様々な動画がインターネット上の動画サイトで配信されている.本研究では,エンターテインメント動画の「笑い」の部分に着目した.例として漫才の動画を用い,ニューラルネットワークモデルのひとつである自己組織化マップ(SOM)による,音声トラック情報を用いたシーン分類を行った.観客の笑い声と漫才師の喋り声の音声情報を,動画内から一定区間抽出し,FFTによって演算したものを入力ベクトルとしてSOMに学習させた.学習結果を用いてシーンのクラスタリングを 行い,それに基づいて動画の評価を行った.さらに評価が人間の感性の面からみて有効かを確かめるためにアンケート調査と比較した.今後の展望として,感性検索への応用を考えている.