情報処理学会第76回全国大会講演要旨

5S-4

複数スマートフォンで収録された多人数会話音声の話者決定

○米山修平，齋藤かの子，岩野公司（東京都市大）

現在，一人が一台以上のスマートフォンを携帯することが通常となり，多人数での会話や会議音声を参加者それぞれのマイクで同時に録音することが容易になった．また，インターネットを介してこれらのデータを即座に統合し，利用できるクラウド環境も整備が可能である．本研究では，このような環境を想定して複数マイクで収録された多人数会話音声に対し，「いつ誰が話したか」という情報を自動推定するための「話者決定手法」の提案を行う．話者決定に先立って話者モデルを端末ごとに準備する手法と，事前知識なしで話者モデルを構築する手法を提案し，それらの性能比較を行うことで，性能向上に向けた今後の課題を検討する．

情報処理学会 第76回全国大会講演要旨

情報処理学会第76回全国大会講演要旨