6U-4
音素決定木に基づくGMMを用いた話者認識
○趙 洪岩,酒向慎司,北村 正(名工大)
個人情報流出や不正アクセスが相次ぎ、情報保護への関心が高まっている。
その中で、利用者に低負担な個人認証の手法として話者認識が注目されている。
これまでに、ケプストラムをGMMによりモデル化する手法が提案されている。
この手法では全音素を統合して学習、認識を行うが、個人認証を行うには不十分な精度であった。
そこで、音素の情報によりモデルを分割し、GMMを学習することで精度の向上を図る。
しかしながら、全音素を分割した学習では、モデル数が増加し、学習データが不足するため、認識精度が低下する恐れがある。
本研究では、決定木により音素をクラスタリングし、類似した音素を連結学習することにより、この問題を解決する。