5T-8
音楽データを用いた発音時刻の検出
○高松 愛,小泉幸広(早大)
本稿では、音楽情報処理の中でも基本的な問題の一つである発音時刻の検出問題に対して、隠れマルコフモデルを用いたアプローチ手法の提案及び評価を行う。
隠れマルコフモデルは、音声認識をはじめとする音楽情報処理、タンパク質の機能・構造の予測や文字認識等、時系列データに対して幅広く適用されてきた確率モデルである。本稿では音楽特徴量を隠れマルコフモデルの出力とし、短時間フーリエ変換を用いて作成した複数の特徴量を考慮した予測を行う。
性能評価実験では音楽データから得ることの出来る特徴量及び発音時刻の正解値を用いてモデルの学習を行う。また、学習済みモデルに対して音楽データのみを与え、発音時刻の有無を確率値として出力し、精度の評価を行う。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について