4ZB-06
プロセス間通信と生成AIを用いた低コスト型音声対話システムの開発及び評価
○堀内大斗,有住匠真,原 碧来,安部惠一(神奈川工科大)
近年,生成AI技術の発展により人と音声対話するシステムが多く存在する.宅内で使用する音声対話のインターフェースには無機質なスピーカーや立体的なヒューマロイド(以下ロボットと呼ぶ)タイプなどがある.スピーカータイプは無機質なデザインのため,人によっては話しかけづらいという課題がある.一方のロボットタイプはスピーカなどの無機質なデザインよりは話しかけやすくなるが,利用者の好みに応じて,外観やキャラクタをフレキシブルに変更するのは困難である.この課題を解決するため,過去に我々は利用者に応じて会話する相手の姿形を自由に変更できるCGキャラクタを用いた音声対話型システムを提案した.しかし,このシステムはパソコンと組込み型マイコンの2つのシステムで音声対話とCGキャラクタの表示切替処理を分散処理で行っているため,高コストなシステムとなっていた.
そこで,この課題を解決するため,本研究では1台のパソコンで音声対話処理とCGキャラクタの処理を分散処理させ,それぞれの処理プロセスをTCP/IPを用いてプロセス間通信させることにより,過去の音声対話システムよりも低コストな音声対話システムを実現できた.また,音声対話に生成AIであるChatGPT-4oを使用することで、過去に開発した音声対話システムより人に近い自然な会話を実現できたので、その詳細について述べる.