第74回 音声言語情報処理研究会(SIG-SLP)
(第10回 音声言語シンポジウム)
日時: 平成20年12月9日(火)・10日(水)
会場: 早稲田大学 小野記念講堂(早稲田キャンパス)
(〒169-8050 新宿区西早稲田1-6-1)
地理案内 http://www.waseda.jp/jp/campus/waseda.html
主催: 電子情報通信学会および日本音響学会 音声(SP)研究会
情報処理学会 音声言語情報処理(SLP)研究会
電子情報通信学会 言語理解とコミュニケーション(NLC)研究会
協賛: 人工知能学会 言語・音声理解と対話処理(SLUD)研究会
IEEE SP Society Japan Chapter
概 要:
9日(火)
午前 10:00 - 12:05 【Session-1 音響処理・話者同定】
午後 13:10 - 14:00 【Session-2】〔招待講演〕音声言語運用が必要とする認知的能力と音声言語工学が構築した計算論的能力
午後 14:10 - 15:00 【Session-3 音声認識・音響モデル】
午後 15:10 - 16:25 【Session-4 言語モデル・システム】
午後 16:40 - 18:10 【Session-5 企画】
10日(水)
午前 9:00 - 10:40 【Session-6 音声合成・声質変換】
午前 10:50 - 12:05 【Session-7 対話】
午後 13:10 - 14:00 【Session-8】〔招待講演〕音声認識応用システム開発の新パラダイム
午後 14:10 - 15:50 【Session-9 ドキュメント処理・翻訳・言語獲得】
午後 16:00 - 18:00 【Session-10 一般】(ポスターセッション)
【プログラム】
●9日午前 10:00 - 12:05 【Session-1 音響処理・話者同定】
(1)スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識
○西亀健太,和泉洋介(東大),渡部晋治(NTT),小野順貴,西本卓也,嵯峨山茂樹(東大)
(2)ロボットのためのハンズフリー音声対話システム
○細谷耕佑,小川哲司,藤江真也,渡辺大地,市川悠飛,谷山 輝,小林哲則(早大)
(3)音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識
○藤本雅清,石塚健太郎,中谷智広(NTT)
(4)ベイジアンネットワークを用いた単一チャネル信号による背景音楽の抑圧
○伊藤弘章,西野隆典,北岡教英,武田一哉(名大)
(5)音響情報と映像情報の統合による多人数会話における話者決定技術
○石塚健太郎,荒木章子,大塚和弘,藤本雅清,中谷智広(NTT)
●9日午後 13:10 - 14:00 【Session-2】
(6)[招待講演]音声言語運用が必要とする認知的能力と音声言語工学が構築した計算論的能力
○峯松信明(東大)
●9日午後 14:10 - 15:00 【Session-3 音声認識・音響モデル】
(7)重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法
○井島勇祐,橘 誠,能勢 隆,小林隆夫(東工大)
(8)制約付き非負行列因子分解を用いた音声特徴抽出の検討
○朴 玄信,滝口哲也,有木康雄(神戸大)
●9日午後 15:10 - 16:25 【Session-4 言語モデル・システム】
(9)PLSA言語モデル適応におけるアニーリングスケジュールの評価
○加藤正治,小坂哲夫(山形大),伊藤彰則,牧野正三(東北大)
(10)話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識
○佐古 淳,有木康雄(神戸大),岩田具治,渡部晋治,堀 貴明(NTT)
(11)音声認識システムの満足度評価におけるユーザモデル
○原 直,北岡教英,武田一哉(名大)
●9日午後 16:40 - 18:10 【Session-5 企画】
10周年企画「音声言語研究関連分野の10年の歩み」
趣旨:本シンポジウムは開催10年目の節目を迎える.
このセッションでは,関連研究分野ごとの10年の進展を
リレー形式でまとめて紹介するとともに,今後の発展に向けた
ディスカッションを行う.
●10日午前 9:00 - 10:40 【Session-6 音声合成・声質変換】
(12)音響的特徴を用いた話し言葉の断片発話単位への分割
○瀬戸山勝義(奈良先端大),柏岡秀紀,ニック キャンベル(奈良先端大/NICT/ATR)
(13)Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis
○Kei Hashimoto,Heiga Zen,Yoshihiko Nankaku,Keiichi Tokuda(NITECH)
(14)Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching
○Kaori Yutani,Yoshihiko Nankaku(NITECH),Tomoki Toda(NAIST),Keiichi Tokuda(NITECH)
(15)基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出につい
○河原英紀(和歌山大),森勢将雅(関学大),高橋 徹(京大),坂野秀樹(名城大),西村竜一,入野 俊夫(和歌山大)
●10日午前 10:50 - 12:05 【Session-7 対話】
(16)実世界における人とロボットの共有信念に基づいた相互適応的な発話生成
○中村慎也(電通大),岩橋直人(NICT/ATR),長井隆行(電通大)
(17)POMDPを利用した思考喚起型対話の制御
○南 泰浩,澤木美奈子,東中竜一郎,堂坂浩二(NTT)
(18)音声対話用音声認識システム
○谷口 徹,藤江真也,小林哲則(早大)
●10日午後 13:10 - 14:00 【Session-8】
(19)[招待講演]音声認識応用システム開発の新パラダイム
○小林哲則(早大)
●10日午後 14:10 - 15:50 【Session-9 ドキュメント処理・翻訳・言語獲得】
(20)SLP音声ドキュメント処理ワーキンググループ活動報告
○秋葉友良(豊橋技科大),相川清明(東京工科大),伊藤慶明(岩手県立大),河原達也(京大),南條浩輝(龍谷大),
西崎博光(山梨大),安田宜仁(NTT),山下洋一(立命館大),胡 新輝(NICT/ATR),中川聖一(豊橋技科大),伊藤克亘(法政大)
(21)会議録作成支援のための国会審議の音声認識システム
○秋田祐哉,三村正人,河原達也(京大)
(22)音声翻訳単位の推定における読点情報の効果
○清水 徹,中村 哲(NICT),河原達也(京大)
(23)モデル選択による言語獲得手法
○田口 亮(ATR/名工大),岩橋直人(ATR/NICT),能勢 隆(ATR),船越孝太郎,中野幹生(HRI)
●10日午後 16:00 - 18:00 【Session-10 一般】(ポスターセッション)
(24)対乳児発話におけるピッチアクセントの性質について 〜 理研日本語母子会話コーパスを用いた分析 〜
○北原真冬(早大/理研),西川賢哉(理研/慶大),五十嵐陽介(国語研/理研),新谷敬人(上智大/理研),馬塚れい子(理研/デューク大)
(25)効果音を用いた感性伝達における条件付加による受信感性情報の変化
○佐藤真梨,相川清明(東京工科大)
(26)軟らかい素材による軟口蓋を伴う声道の物理模型
○荒井隆行,田中希美(上智大),片岡竜太(昭和大)
(27)Articulatory feature extraction based on 3-stage MLNs and Inhibition/Enhancement Network
○Mohammad Nurul_Huda,Hiroaki Kawashima,Tsuneo Nitta(Toyohashi_Univ._of_Tech.)
(28)TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討
○板垣英恵(和大),森勢将雅(関学大),西村竜一,入野俊夫,河原英紀(和大)
(29)スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討
○室井貴司,滝口哲也,有木康雄(神戸大)
(30)声道情報を用いたニューラルネット話者照合システム
○渡辺優介,松本直樹(明大)
(31)位相情報を利用した話者識別・照合法の評価
○王 龍標(静大),南 和江,山本一公,中川聖一(豊橋技科大)
(32)Dialect-based speaker classification of Chinese using acoustic features invariant with extra-linguistic factors
○XueBin Ma,Nobuaki Minematsu,Yu Qiao,Keikichi Hirose(Univ._of_Tokyo),Akira Nemoto,Feng Shi(Nankai_Univ.)
(33)Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method
○Tatsuya Ito,Kei Hashimoto,Yoshihiko Nankaku,Akinobu Lee,Keiichi Tokuda(NITECH)
(34)音声の動的特徴のモデルを使った突発性雑音の除去
○三宅信之,滝口哲也,有木康雄(神戸大)
(35)距離マトリクス画像のハフ変換を用いた単語音声区間検出
○西 宏之,木村義政,グエン ヴァン・ドン(崇城大)
(36)音声の構造的表象と判別分析を用いた単語音声認識
○朝川 智,喬 宇,峯松信明,広瀬啓吉(東大)
(37)アフィン変換不変性を有する局所的特徴量を用いた音声認識
○鈴木雅之,喬 宇,峯松信明,広瀬啓吉(東大)
(38)HMM音声合成における共分散パラメータの共有に関する検討
○大浦圭一郎,全 炳河,南角吉彦,李 晃伸,徳田恵一(名工大)
(39)Speech recognition based on statistical models including multiple decision trees
○Sayaka Shiota,Kei Hashimoto,Yoshihiko Nankaku,Akinobu Lee,Keiichi Tokuda(NITECH)
(40)話速管理機能を持った原稿提示収録システム(ReCoK5)と話速バリエーション型音声データベース(SRV-DB)の公開について
○高橋弘太,蔦木圭悟,吉原 亨(電通大)
(41)音声の高速再生のための話速推定法と高速発話時の特性解析 〜話速バリエーション型データベースの活用例〜
○吉原 亨,蔦木圭悟,高橋弘太(電通大)
(42)音声の雑音比とスペクトルQを用いた全疲労検知 〜話者への効率や安全への助言を考えて〜
○岡田一秀(トヨタ)
(43)Driver's irritation detection using speech recogntion results
○Lucas Malta,Chiyomi Miyajima,Akira Ozaki,Norihide Kitaoka,Kazuya Takeda(Nagoya_Univ.)
(44)単語出現順序を考慮したトピックモデルによる言語モデル適応
○佐古 淳,滝口哲也,有木康雄(神戸大)
(45)単語誤り最小化に基づく識別的リスコアリングによる音声認識
○小林彰夫,奥 貴裕,本間真一,佐藤庄衛,今井 亨,都木 徹(NHK)
(46)条件付き確率場を用いた発話内容の分類による音声認識結果の検証
○大田 健紘,江原 暉将(諏訪東京理科大)
(47)質問応答データベースの自動作成に基づく音声対話システムの評価
○森本高弘,伊藤 仁(東北大),鈴木基之(徳島大),伊藤彰則,牧野正三(東北大)
(48)ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現
○成松宏美(津田塾大),中野幹生,船越孝太郎,長谷川雄二,辻野広司(HRI-JP)
シンポジウム実行委員:
実行委員長: 小林隆夫(東工大),
副委員長: 井ノ上直己(ATR/NICT),河原達也(京大)
幹事: 間野一則(芝浦工大),伊藤敏彦(北大),中野幹生(HRI-JP),
委員: 伊藤慶明(岩手県立大),李晃伸(名工大),堀貴明(NTT),北村達也(甲南大),
加藤直人(NHK),山本和英(長岡技科大),増市博(富士ゼロックス),
村上浩司(奈良先端大),竹内孔一(岡山大学),
北岡教英(名大),山下洋一(立命館大)
問合先:
間野 一則(SP)
芝浦工業大学
mano [at] sic.shibaura-it.ac.jp
伊藤 敏彦(NLC)
北海道大学
t-itoh [at] media.eng.hokudai.ac.jp
中野幹生(SLP)
(株)ホンダ・リサーチ・インスティチュート・ジャパン(HRI-JP)
nakano [at] jp.honda-ri.com
|