6U-9
アクセント特徴量を用いた歌声と朗読音声の識別システム
○阿曽慎平(京大),齋藤 毅(金沢大),後藤真孝(産総研),糸山克寿,高橋 徹,尾形哲也,奥乃 博(京大)
アクセント特徴量を用いて歌声と歌詞の朗読音声を識別するシステムを開発した.
システムの入力は雑音を含まない単独音声,出力は歌声か朗読音声かの2値である.我々はリズム構造が歌声と朗読音声で聴感上異なることに着目し,リズムと関連が強いと考えられるアクセント特徴量を識別に用いた.この特徴量は音響的な時間変化の大きい部分,例えば音素境界や発話開始時間で極大値(ピーク)を持つ.隣り合うアクセントピークの時間間隔と,アクセント強度の分布をそれぞれ混合ガウス分布でモデル化し,2つの識別機を設計した.実験の結果,約10秒の音声に対し,ピーク時間間隔を用いた識別機では89.2%,アクセント強度を用いた識別機では59.7%の精度であった.