問い合わせ対応の自動化や対話的な情報発信等を目的として,与えられた質問に応答する対話システムが注目を集めている.たとえば,AppleのSiriやGoogleアシスタント,行政機関ではゴミ分別案内サービス*1や観光案内サービス*2,学術機関では受験生向け対話システム*3,*4があり,オープンドメインの雑談や対話的指示,タスク指向対話に利用されている.
大学の学生生活においては,履修登録やシステムの操作方法,各種行事予定,就職活動,食堂の営業時間等,様々な情報を学生は把握する必要がある.学生生活に関する情報は大学・関連施設のWebサイトや,配布される手引き等に記載されている.ただし,内容により掲載場所が異なるため,情報収集には時間を要し,学生によっては目的の情報を発見できない場合がある.学務窓口を利用することも可能ではあるが,問い合わせが集中することで業務負担の増加が懸念される.
このような問題を解決するために,学びや課外活動等の学生生活を支援する対話システムを導入している大学がある.導入結果として,4月の問い合わせ件数が5割も減少したことが報告*5されている.多様な情報を収集する必要がある学生の支援や,窓口業務の負担軽減を実現するために,対話的な情報発信は有効である.特に,コロナ禍において対人コミュニケーションが困難な状況において,対話システムが果たす役割は大きい.一方で,無機質なインタフェース等によりシステムの親和性が低い場合,利用機会の減少や対話持続の困難さが懸念される.そのため,利用者と対話システム間の親和な関係を成立させる方法を検討する必要がある.なお,本研究では対話システムが親しみやすく質問しやすい状況を親和な関係とする.
対話システムの関連研究では,多様な分野を対象にした機能設計やシステム開発が報告されている[1].学術機関を導入対象とした研究では,ユーザの情報収集を支援する推薦型対話手法[2]や,講義中の学生の発言を促進する質問支援手法[3],eラーニングシステムに関する用例の作成手法[4]が提案されている.また,筆記具や飲食物等の購買支援[5]や,講堂やプロジェクター等の予約支援[6],学内イベントや地理情報等の情報発信[7]-[9]を目的とした対話システムがある.ただし,学生生活の支援を目的とした視覚的な試みや用例等の実用的な設計論,複数年度に渡る詳細な導入分析や改善提案はされていない.このような情報は,対話システムの導入を検討している組織には重要となる.
そこで,本研究では大学の学生生活に関する情報収集を親和的に支援する対話システムを開発する.本システムは通常の対話機能に加えて,ユーザの発話内容に応じた感情や動作を応答キャラクターが表現することで,利用者とシステム間の親和な関係を成立させる.本稿では開発する対話システムの設計論や導入後の分析結果,さらには感情や動作の表現設計の評価結果を述べる.
本研究の貢献は以下になる.
対話システムは特定の目標を持たず雑談を行う非タスク指向型と,明確な目標を持つタスク指向型に分類できる.たとえば前者は雑談ロボット,後者は航空券予約や出前注文システムが挙げられる.非タスク指向型を適用した場合,雑談により会話が広がり話が弾むと考えられる.ただし,本研究では主に大学の学生生活に関する情報を対話的に提供するため,タスク指向型の対話システムを対象とする.応答文に不自然な表現が含まれないように,事前に作成した発話文・応答文ペアを用いて対話する用例ベースとして,入出力の対象はテキストとする.
利用者と対話システム間の親和な関係を成立させる方法としては,応答文に着目した試みと視覚的な試みに大別できる.応答文に着目した試みとしては,聞き間違いによりユーモア表現を生成する対話システム[10], [11]がある.ただし,迅速に目的の情報を把握したい場合,ユーモア表現は対話の進行を妨げる可能性がある.視覚的な試みとしては,ヒューマノイドロボット[12]や擬人化エージェント等のインタフェース[13]を備える対話システムが開発されている.これらを参考にインタフェースを設計することで,対話の進行を妨げずに親和性を高めることが可能である.そのため,本研究では視覚的な試みにより親和な関係の成立を目指す.
サイバー犯罪件数が増加しており様々な事故や攻撃が報告されている.たとえば,情報セキュリティ10大脅威2022*6では,標的型攻撃による機密情報の搾取や脆弱性対策情報の公開に伴う悪用増加等が報告されている.本システムは学生生活に関する非公開情報も扱うため,機密性や完全性等を保つための十分なセキュリティ対策を備える必要がある.
以上より,本研究のシステム要件は以下とする.
要件1 用例ベースの対話機能の設計
要件2 視覚的な試みによる親和な関係の成立
要件3 安全性を高めるセキュリティ実装
以降では,主に要件1は2.3節~2.5節,要件2は2.2節,要件3は2.6節が対応する.
徳島大学のマスコットキャラクターであるとくぽん*7は,タヌキがモデルであり愛くるしさを感じることを狙いとしてデザインされている.とくぽんには,徳島大学に住み着いているタヌキで学生と一緒に勉学に励む毎日を送る,という設定がある.先輩として学生生活の質問に応じることは自然であり,とくぽんが応答することでユーザの興味や関心を高められる可能性がある.そのため,本システムの応答キャラクターはとくぽんとする.
次に,視覚的な試みに関して設計する.なお,2020年4月に本研究で開発したシステムから感情や動作の表現機能を除いたシステムを徳島大学に導入しており,本機能は2020年10月に実装した.徳島大学が公開するとくぽんの画像は静止画であり種類が少ないため,これらの画像を用いた場合,ユーザは飽きを感じる.そこで,本研究では応答文と合わせて,ユーザの発話内容に応じた感情や動作をとくぽんが表現するアニメーション画像を出力する.アニメーションにより応答キャラクターの表情や動きが柔軟に変化することで,自然な会話感を実現できる.
アニメーション画像の種類を決めるために,2020年4月から9月までの発話履歴1,616件を対象として,発話を受けた際にとくぽんが抱くであろう感情や動作を調査した.たとえば,発話文が“ありがとう”の場合は『喜び』の感情,“全然回答できてない!”の場合は『悲しみ』,“土曜日に食堂は利用できますか?”等の学生生活に関する発話は『通常』,“こんにちは”の場合は『挨拶』の動作とする.本調査や後述する感情表現等のラベル付けは筆者と事務職員の2人で行い,ラベルの種類や結果が異なる場合は話し合いにより決定した.調査結果としては,通常は90.41%,喜びは5.94%,怒りは0.62%,悲しみは1.42%,驚きは0.06%,挨拶は1.18%,別れの挨拶は0.37%を占めていた.そこで,感情表現は通常,喜び,怒り,悲しみ,驚き,動作表現は挨拶,別れの挨拶として,さらには回答不可になる場合の動作も加えてラベルの種類は8種類とした.表1に感情や動作の定義を示す.これらの感情や動作を表現するアニメーション画像を作成した*8.図1にアニメーション画像の例を示す.徳島大学で公開される通常の画像(図1の左上)を加工することで,各アニメーション画像を作成している.アニメーション画像はAPNG形式で,幅が142 px,高さが166 px,フレームレートが30 fps,1回の動作が5秒程度,アニメーションの繰り返し設定を有効にしている.
発話を受けたときのとくぽんの感情や動作を表現するために分類モデルを作成する.本モデルは前述した発話履歴と,学習データの件数を増やすために日本語評価極性辞書[14]と単語感情極性対応表[15]を用いて作成する.これら極性辞書・対応表には単語が良い・悪い印象であるかを示す評価極性タグ,または実数値が登録されている.ただし,“欣喜雀躍”等,使用頻度が低いであろう単語も多く含まれているため,“面白い”や“楽しい”等の発話文として用いられる可能性が高い338件の単語を抽出した.収集した発話文や単語に対して該当するラベルを前述した調査方法と同様に2人で付与して,fastText*9を用いて感情や動作の分類モデルを作成した.fastTextで用いる分散表現は,Wikipedia日本語記事全文から作成されたモデル[11]を使用した.発話履歴と抽出した単語により,学習データは1,954件(カテゴリ数8)になった.なお,システムの導入後は,たとえば“とても笑顔がいいね!”等の未知となる発話文を用いて,定期的に分類モデルを再学習している.
大学の退学者問題が深刻化しており,ここ数年は増加傾向にある[16].この解決事例としては,GPAと欠席率による退学者の予測方法[17]が提案されており,迅速な面談等により学生が支援されている.一方で,成績優秀で勤勉な学生にも退学や休学を検討している者がいるため,多様な観点で支援すべき学生を発見する必要がある.対話システムは気軽に利用できるため,悩みの相談や健康に関して発話する学生もいると考えられる.そのため,発話履歴を分析することで,支援すべき学生を迅速に発見できる可能性がある.
徳島大学では統合認証システムとしてShibboleth [18]が導入されている.本学構成員には専用アカウントが発行されており,教務システムや図書館システム等の学内システムを横断的に利用できる.Shibbolethを利用することで氏名や所属等の属性情報を取得できるため,誰が何を発話したかを把握できる.そこで,本システムではShibbolethを用いて認証機能を実装して,発話者を特定できる仕組みを構築した.なお,この仕組みの利用には個人情報の取り扱いを十分に検討する必要があるため,第3章で述べる本システムの導入期間では発話者の特定はしていない.
用例の内容は,ユーザが学生生活を送るうえで参考になる情報が網羅される必要がある.そこで,徳島大学の新入生に配布している学生生活の手引き*10や,本学学部・学科が公開するWebサイト等を参考にして用例を作成した.また,参考にした情報源には忘れ物の保管場所等,学生生活に必要ではあるが記載されない情報があるため,各学部・学科の学務担当者に用例の確認や追加登録の依頼をした.
履修期間や時間割,履修上限等,履修登録に関する情報は複雑である.また,学部・学科により内容が異なるため,すべての情報を用例に反映させるのは困難である.そのため,履修登録に関する発話文を複数作成して,これらに対応する応答文には,学部・学科が発行する履修の手引き*11の公開場所と目的の情報の検索方法のみを記載した.
ユーザは学生生活に限らず多様な発話をする可能性がある.実際,受験生向け対話システムでは大学の特徴や入試のほかに,応答キャラクターに関する発話が多いことが報告されている[2].たとえば,応答キャラクターの名前や出身地等に関する内容である.このような発話にも対応することで,ユーザはシステムに親しみを抱きやすくなる可能性がある.そこで,徳島大学が公開するプロフィール情報を参考にして,とくぽんに関する用例を作成した.用例の発話文の例としては“生い立ちは?”や“お腹のマークは何ですか?”等になる.“兄弟はいるの?”等の未設定であり回答できない場合は,すべて“秘密です.”と返す.
本研究で作成した用例の項目と発話文(例)を表2に示す.用例の例としては,“情報センターはどこ?”は“情報センターへのアクセス情報はこちら(リンク)を確認ください.”,“寮に入りたいときは?”は“退寮者が出た場合等により追加募集をすることがあります.追加募集については掲示板を確認してください.”になる.1つの応答文に紐づく発話文は,表記ゆれを考慮して複数作成している.たとえばアカウントに関する発話文は,“アカウントについて”や“ID・パスワードについて”等になる.学生生活の手引きではキャンパスマップ等の画像が使用される場合や,内容により説明が長文になる場合がある.このような情報は,該当ページをpdfファイルとして保存して,本ファイルへのリンク情報を応答文に記載する.2022年4月時点で用例の登録件数は2,327件で応答文は301種類になる.用例は運用を通して更新している.
開発するシステムの対話処理の流れを図2に示す.用例データベースには管理者が登録する発話文・応答文ペアが登録される.発話文の解析では,ユーザの発話文から形態素解析器のMeCab*12で名詞や感嘆詞等の単語を抽出する.辞書はNEologd辞書*13を用いる.応答文の選択では用例2,327件(カテゴリ数301)を学習データとして,fastTextで作成した分類モデルを用いて応答文を選択する.システムの導入後は,対話履歴を用いて応答文の分類モデルを定期的に再学習している.なお,より応答文の正答率を高めるために,手動生成した同義語・類義語辞書を用いて分類前に発話文を単語変換する.たとえば,“応化”を“応用化学システムコース”に変換して表記ゆれを解決する.感情・動作の分類で発話内容に応じた応答キャラクターの感情や動作を決定した後に,応答文と分類結果に対応するアニメーション画像を出力する.
本システムの開発には表3のソフトウェアを使用した.効率的に作業するためにVMware ESXiを用いて仮想マシン上に開発した.携帯端末の利用者を考慮して,レスポンシブ対応によりPCと携帯端末に対応した画面を設計した.とくぽんのアニメーション画像は,静止画像を立体的に動かせるLive2Dを用いて作成した.発話文と応答文はAjaxによる非同期通信で表示する.本システムの参考画面を図3に示す.対話は下から上に流れており,応答文にはユーザが回答内容を評価するためにGood/Badボタンを設置している.ボタン押下は任意であるが,求めた情報が得られた場合にGoodボタンが,回答不可や誤回答の場合にBadボタンが押されることで,システムに評価結果が記録される.応答文には回答内容に関連する情報も記載している.
情報処理推進機構が提供するガイドブック*14等を参考に,SQLインジェクションやクロスサイト・スクリプティング等の対応を行った.また,徳島大学情報センターのセキュリティ責任者を通して,自然災害や盗聴等の様々な脅威に対するリスク評価や,ネットワークやOS等の脆弱性診断*15を受けた.本システムの利用者は徳島大学の学生・教職員に限定して,自宅等からの利用を考慮して学外からのアクセスは可能としている.本システムの名称は,応答キャラクターがとくぽんであるため学内版とくぽんtalkとした.
2020年4月から徳島大学に学内版とくぽんtalkを導入している.そこで,2020年4月から2022年3月までを対象に導入後の分析を行う.なお,感情や動作の表現機能は2020年10月から実装している.本分析ではログ等の調査に加えて対話履歴を視覚的に分析できるシステム[19]を用いる.学内版とくぽんtalkは教務システム等の学内サービスが纏められたポータルサイトに登録しており,メールや掲示板等を用いた導入案内はしていない.属性情報として導入期間では統合認証システムから利用者のアカウント名のみを取得している.そして,命名規則に従いアカウント名から入学年度と所属を特定し,留年者や休学者は考慮できないが入学年度から学年を求めている.
2020年度の利用者数の累計は2,319,月あたりの平均利用者数(標準偏差,以下略)は193.25(204.59),一人あたりの平均利用回数は2.32(3.18),発話件数は2,498,一人あたりの平均発話件数は5.38(9.18),利用者の内訳は学部生が87.17%,大学院生(修士課程)が11.44%,大学院生(博士課程)が1.39%であった.2021年度の利用者数の累計は1,565,月あたりの平均利用者数は130.42(97.43),一人あたりの平均利用回数は2.43(3.47),発話件数は1,975,一人あたりの平均発話件数は5.23(8.67),利用者の内訳は学部生が89.01%,大学院生(修士課程)が9.83%,大学院生(博士課程)が1.16%であった.なお,本システムにアクセスしたが一度も発話しなかった者がいる.これは対話的な情報収集の困難さや興味本位での訪問等が理由として考えられるが,利用時期等の分析で参考になるため利用者数の累計に含めている.平均利用回数と平均発話件数においては,実際に発話した者の利用状況を調査するために,発話件数0件の利用者を除いて算出している.各年度の利用者数の累計については,2021年度の学部2年生以上の学生には前年度に本システムの利用機会があったことが,2021年度の利用者数の減少に影響を与えた可能性がある.実際,2021年度の学部1年生の減少率は18.72%であったが,学部2年生以上は39.71%であった.
回答不可と誤回答は不正解としてすべての対話履歴を手作業で確認した結果,両年度の発話件数4,473において正確に回答できた件数は3,205であり,応答文の正答率は71.65%であった.各年度の正答率は2020年度が69.66%,2021年度は74.18%であり,運用を通した用例の更新により正答率が高まっていると判断できる.
月・時間帯別の利用者数の累計を図4に示す.棒グラフが月別,折れ線グラフが時間帯別の利用者数になる.時間帯は気象庁が公開する1日の時間細分図*16を参考にしている.各年度の月別では,前期授業が始まる4月の利用者数が最も多く,冬季休業が始まる12月は最も少なかった.年度・時間帯別の利用者数の累計を表4に示す.両年度において夕方(15時~18時),昼過ぎ(12時~15時),昼前(9時~12時)の順に利用者数が多くなった.昼前から夕方は授業が実施される時間帯であり,空き時間にシステムを利用する学生が多いと考えられる.両年度において夜遅くから明け方(21時~6時)の利用者数は全体の22.40%を占めていた.また,未明から明け方(0時~6時)の利用者数は全体の8.88%で,その内70.82%が2年生以上の学生であった.これは,学生生活の慣れや研究等により夜間の活動が主となることで,未明等にシステムを利用する学生が増えた可能性がある.このような学生に対しては,対話中に注意喚起することで,生活習慣の改善を促すことが可能である.
学部学生の学年別利用者数の累計を図5に示す.徳島大学では,大半の学生が4年制の学部・学科に所属しているため4年生までを対象にしている.大半の月において1年生の利用者数が多く,両年度の全学年において4月の利用者数が1年を通して最も多くなった.4月においては,1年生は入学直後であり大学生活に関する情報が不足しているため,2年生以上は新たなカリキュラムで履修登録が始まるため,利用者数が増えたと考えられる.
発話件数0件を除いて本システムを1回以上利用した学部生と大学院生の割合*17は,2020年度が16.57%,2021年度が10.69%であったが,学部1年生においては2020年度が31.75%,2021年度が26.35%であった.入学後は履修登録の方法や施設利用等の様々な情報を把握する必要があるため,特に学部1年生の学生生活に関する情報収集を支援できたと判断できる.
両年度において,在学者数における利用者の累計が占める割合は,全学部・学科(学生数は計5,715)では29.71%になるが,3つの学部・学科(学生数は計1,371)では約40%であった.全学部・学科の女性が占める割合は37.76%であるが,利用率が高い3つの学部・学科は62.30%であり女性が多く在籍している.導入期間では取得している属性情報が限られるため性別調査は困難ではあるが,女性が多く在籍している学部・学科の利用率が高い傾向であった.
両年度において最も多く入力された上位10件の発話文の内容,発話件数と応答文の正答率を表5に示す.学生生活に直接関係はしないが,とくぽんへの質問が最も多くあった.たとえば,“とくぽんって何?”や“あなたのお名前は?”,“何の動物?”,“何歳ですか?”等が入力されていた.感情や動作の表現機能の実装前である2020年4月~2020年9月と実装後の2021年4月~2021年9月において,各年の学部1年生が入力したとくぽんへの質問件数(全発話件数に占める割合)は,前者が23(3.62%)で後者が78(13.98%)であった.ユーザとの親和な関係が成立したことで,機能実装後のとくぽんへの質問件数が多くなったと考えられる.一方で,“肉と魚どっちが好き?”や“音楽は何を聞くの?”等の回答が困難な発話文も多く入力されていた.とくぽんへの質問に対する応答文の正答率は66.48%であり,上位10件の発話文の中で最も低くなった.とくぽんの設定情報は限られるため,一部の発話には正確に回答できていないが,学びや研究を妨げない程度に対応することで,より利用機会の増加や本システムの認知度向上に繋げられる可能性がある.次に,履修登録に関する発話が2番目に多くあり,“履修登録上限”や“A学科の時間割が知りたい”等が発話されていた.この様な発話文は履修登録が始まる4月や9月に多く入力されていた.3番目には無線LANの接続方法が,4番目には食堂等の営業時間に関する発話が多くあった.徳島大学ではノートパソコンの必携化により学内ネットワークに接続する機会が増えたことや,食堂や売店の利用は学生生活には欠かせないことが要因として,これらの発話が多くされたと考えられる.就職相談に関する発話は7番目に多くあり,特に3年生が“就職ガイダンスの予約方法は?”や“就職活動で求められる推薦書について”等を,12月や1月に多く入力していた.
導入後の分析期間において,徳島大学ではコロナにより遠隔授業が中心となったため,窓口の問い合わせ件数の減少率は調査していない.そこで,徳島大学の医学系と生物系学部の学務担当者に過去5年の問い合わせ内容を確認した結果,履修登録やコロナ禍における授業実施,無線LANの接続方法,パスワードの有効期限が切れた場合の対応方法,が多いことを確認できた.これら問い合わせに正確に回答できた件数(全体に占める割合)は651(20.31%)であり,本システムは窓口の問い合わせ件数の減少にも貢献できている可能性がある.
正確に回答できなかった発話1,268件の内,雑談が49.84%を占めていた.たとえば,“明日の天気を教えて”や“周辺に美味しいラーメン屋はある?”が挙げられる.他には,とくぽんへの質問が9.62%,“TOEICの試験時間”等の英語検定に関する発話が2.37%,“学内のコロナ感染者数”等のコロナに関する発話が1.81%,“Zoomの使い方”等の遠隔授業の実施方法に関する発話が1.42%を占めていた.学生の発話は多様であり用例の作成において想定外の内容が多くあるが,正答率やシステムの信頼性を高めるために運用を通して用例を拡充させている.
発話内容に応じた感情や動作の表現設計の評価を行った.まず,図1のアニメーション画像が,『喜び』や『怒り』等を表現できているかを評価した.被験者は大学生24人で,アニメーション画像と対応するラベルを提示して,1(表現できていない)~5(とても表現できている)の5件法での評価を依頼した.各アニメーション画像の平均評価値(標準偏差)を表6に示す.全体的に平均評価値はやや高くなったが,『驚き』と『回答不可』はやや低い結果となった.特に『驚き』については,驚いている感じがあまり感じられない,画像が小さく表情が読み取りづらいため汗を流したりしてもっと驚いた表情がよい,等のコメントがあった.該当画像と“びっくりだね!”や“すみません,回答できません….”等の応答文を組み合わせることで,想定する表現が伝わりやすくなると考えられる.ただし,感情や動作が適切に表現されない画像では,ユーザが戸惑いを感じる可能性が高くなるため,特に両画像のデザインを改善する必要がある.
次に,発話内容に応じた感情や動作の表現がユーザに与える影響を調査するために比較評価を行った.比較のために応答キャラクターの画像のみが異なる3つのシステム(A~C)を用いた.図1の画像を対象に,Aでは提案手法により選ばれたアニメーション画像,BではAと同じ種類の画像(静止画),Cではランダムに選ばれたアニメーション画像が表示する.被験者は大学生28人になる.学内版とくぽんtalkの発話履歴からランダムに発話文10件を抽出して,各システムでの対話を記録した動画を作成した.そして,作成した動画の視聴と各システムの評価を依頼した.各システムに入力する発話文は同一として,順序による影響を避けるためにシステムの評価順は被験者ごとに異なる.対話システムの親和性を高める研究[20]の評価実験を参考にして,評価項目は以下の5つで1(感じない)~5(とても感じた)の5件法で評価した.検定にはウイルコクソンの符号順位検定(α=0.05)を用いて,Bonferroni法による多重比較を行った*18.
各システムの平均評価値(標準偏差)を表7に示す.全項目でAはB・Cより平均評価値が高くなった.A・B間とA・C間のp値は,(1)0.19×10−3,0.01,(2)0.18×10−3,0.58×10−3,(3)0.21×10−3,0.58×10−2,(4)0.23×10−2,0.33×10−2,(5)0.01,0.02×10−1であり,(1)~(5)のAとB・C間で有意差が認められた.B・C間のおいては有意差は認められなかった.(1)のA・Bにおいて,BではAと同じ種類の画像(静止画)が出力されるが,Aではアニメーション画像により飽きが軽減され面白さや楽しさ等が増すことで,より親しみが感じられたと考えられる.(1)のA・Cにおいて,Cではランダムにアニメーション画像が出力されたため,対話の流れの中でとくぽんが不自然な表現をする場面があった.たとえば,“かわいいね!”に対して,Cでは怒りの画像,Aでは喜びの画像が出力された.発話内容に応じて感情や動作を表現したことで,Aではより自然な会話感が生まれて(1)の平均評価値が高まったと考えられる.(2)~(5)の質問のしやすさや苛立ちにくさ等においても,より親しみが感じられたことでAはB・Cより平均評価値が高まったと判断できる.情報収集する際に感情や動作の表現がどのような影響や効果があるか,を自由記述(複数回答可)で質問した結果,親しみやすく楽しく質問できる旨を14人,気軽に様々な質問ができる旨を12人が回答していた.以上の結果より,発話内容に応じた感情や動作を応答キャラクターが表現することは,親和な関係の成立に有用であると判断できる.
一方で,2人の被験者からはアニメーション画像に注意が向いてしまい回答内容が頭に残りにくい,静止画のほうが表情が分かりやすい,という意見があった.この意見に対しては,たとえばアニメーション有無の設定機能を設けて,ユーザに対話環境の選択肢を与えることで対応できる.また,1人の被験者からは,不自然さはあるが普通の質問でも異なる動きをするCのほうがより人間味を感じ質問しやすかった,という意見があった.この意見に対しては,多様なアニメーション画像を作成することで,とくぽんの反応に対する機械的な印象を軽減できる.たとえば,同じ喜びであっても,対話の流れに沿って喜びの大小を表現することで,より自然な会話感を実現できる.また,『笑う』等,アニメーション画像の種類を増やすことで,ユーザはより親しみを感じやすくなると考えられる.
本研究では学内用対話システムを開発したが,感情や動作の表現機能を別の対話システムに実装することは可能である.特に,ユーザに好印象を与える場面において有効と考えられる.たとえば,本学では受験生向け対話システム*19を導入しており,受験生やその関係者に入試制度や大学生活等に関して対話的な情報発信をしている.この対話システムに本機能を実装して,感情や動作の表現と合わせて大学の特色や魅力を伝えることで.本学の興味や志望度を高められる可能性がある.今後は受験生向け対話システムに本機能を実装して,志願者確保にどのような影響があるかを調査したい.
本システムはオンライン環境での利用を想定して開発した.入力対象はテキストのみであるが,学生の利用機会を高めるために,音声対話や画像認識にも対応させたマルチモーダル対話システムの開発を進めている.本システムを対話ロボットとしてキャンパス内に設置することで,気軽に学生生活に関して質問できる環境を構築できる.今後は本システムの開発に加えて,フロア案内やおすすめの書籍等,設置場所を考慮した用例の設計を検討したい.
一部の学生は“独り身がつらい”や“大学が面白くない”等の消極的な発話をしていた.本システムの導入期間では2.3節で述べた発話者の特定はしていないが,不安やストレスを感じる学生を発見して学生生活を支援することは重要である.そのため,対話システムの発話履歴から学生の状態を推測して,面談等に活用することで学生を支援する仕組みを検討したい.
本研究では,大学の学生生活に関する情報収集を親和的に支援する対話システムを開発して,2020年4月から徳島大学に導入を開始した.本システムは,通常の対話機能に加えてユーザの発話内容に応じた感情や動作を応答キャラクターが表現することで,利用者とシステム間の親和な関係を成立させている.2020年4月から2022年3月までを対象とした分析結果として,4月に利用する学部1年生が多いこと,9時~12時の利用者数が最も多いが0時~6時の利用者もいること,とくぽんへの質問が最も多いこと,応答件数の20.31%は調査対象の学務窓口での主な問い合わせ内容であること等が明らかになった.また,比較評価の結果,感情や動作を応答キャラクターが表現することは,対話システムへの親しみや質問のしやすさの向上に繋がり,親和な関係の成立に有用であることが示された.
本研究の課題の1つに音声や画像への対応があるが,マルチモーダル対話の関連研究としてCGエージェントを用いた対話システムがある[21].この研究では,音声・表情・ジェスチャ認識やキャラクター性に基づく応答生成等により,リアルで自然な対話を実現している.応答キャラクターの無機質さを軽減することで,より親和的に情報収集を支援できる.そのため,たとえば口動作映像や音声合成のアクセント制御,応答の個性付け等,今後はシステムへの親しみやすさをより高める機能面の充実が求められる.
対話システムは多様な領域に展開でき,たとえば徳島大学教職員や本学への留学希望者向けに開発することで,業務効率化や海外の学生への情報発信に活用できる.徳島大学アドミッション部門では四国5国立大学で入試業務を共同実施[22]している.18歳人口が減少する中でより多くの志願者を確保するために,5大学共通の対話システムを導入することで,各大学の特徴,さらには四国の魅力を発信することが可能である.ユーザの情報収集や広報活動を支援するために,今後も対話システムを積極的に活用したい.
謝辞 とくぽんのアニメーション化の支援をいただいた徳島大学デザイン型AI教育研究センターの高石先生と,画面デザインに協力いただいた妻に深く感謝いたします.本研究はJSPS科研費JP19K14317の助成を受けたものです.
徳島大学高等教育研究センター准教授.2008年甲南大学理工学部情報システム工学科卒業.2014年徳島大学大学院博士前期課程修了.2017年同大大学院博士後期課程単位修得退学.博士(工学).2008年4月からIT系企業での勤務を経て,2011年3月から徳島大学情報センター特任助教.2017年5月より同大学総合教育センター(現高等教育研究センター)特任研究員.特任講師を経て2022年4月より現職.対話システム,大学入学者選抜等の研究に従事.情報処理学会,電子情報通信学会,日本教育工学会,人工知能学会各会員.
会員種別ごとに入会方法やサービスが異なりますので、該当する会員項目を参照してください。