6U-3
若年話者判別法の音響特徴に対する聴覚フィルタバンクの導入
○宮森翔子,西村竜一,岡本恵里香,入野俊夫,河原英紀(和歌山大)
本研究では、対話インタフェースにおいて子どもに優しい振舞いを提供するために、
音声認識を用いた若年者判別技術に関する検討を行っている。
今回、従来から用いている音響特徴量であるMFCC(メル周波数ケプストラム係数)に、
ガンマチャープ聴覚フィルタバンク(GCFB)から抽出した特徴量を組み合わせ、判別性能の調査を行った。
MFCCは、音声認識に一般的に使用されている特徴量である。
一方、聴覚フィルタバンクは人間の聴覚特性を模擬しており、先行研究により、
音声モーフィングのための声道長正規化に有効であることがわかっている。
声道長と人間の身長には相関があることから、聴覚フィルタバンクの導入は若年話者判別にも有効であると考えられる。