情報処理学会60年のあゆみ
第3編―情報技術の発展と展望
[MUS]音楽情報科学研究会

 

1. 最近10年間の動向

最近10年間のMUSは変革期であった.統計的機械学習に基づくデータ駆動型アプローチが台頭し,同じ技術基盤を持つ分野間の交流が進む一方,分野間の問題意識の相違が顕在化する事例もあった.MUSの光と影を振り返ってみたい.

1.1 音学シンポジウムの創設

最大のターニングポイントは,2013年に亀岡弘和氏(NTT/東大)を発起人として,「音学シンポジウム」が産声をあげたことである.音「学」という命名には,音楽に限定されないあらゆる音・聴覚・言語に関連するさまざまな研究分野を含む学際分野であるという意味が込められている.視覚メディアでは,コンピュータビジョンとイメージメディア研究会(CVIM)が主催する「画像の認識・理解シンポジウム(MIRU)」が成功を収めており,いわばMIRUの聴覚メディア版が企画された.

音学シンポジウムは,多様な分野の第一線で活躍する研究者による招待講演10件程度と,50件以上のポスターセッションがシングルトラック形式で進行する.初年度の2013年は200名以上の参加者があり,以降毎年開催されてきた.当初はMUS単独の主催であったが,音声言語情報処理研究会(SLP)や,音響学会 音声研究会(SP)・聴覚研究会(H),電子通信音響学会 応用(電気)音響研究会(EA)など徐々に協賛研究会の数を増やし,2018年からは,MUSとSLPとの共催研究会となった.

1.2 インターカレッジコンサートとの連携終了

別のターニングポイントは,「インターカレッジ(IC)コンピュータ音楽コンサート」との連携を,MUS発足20周年の節目である2013年12月の研究会との連催をもって終了したことである.音楽はその性質上,創造性にかかわる芸術的側面は重要な役割を果たしている.そのため,MUS発足以降,音楽を計算機上で取り扱うという共通点から,音楽を解析する工学系の研究者と,音楽を創作する芸術系の研究者(音楽家)とが同じコミュニティで議論することが有意義であるという意識があった.しかし,計算機処理能力の飛躍的向上とともに,機械学習に基づく音響信号解析に関する研究発表が急増し,音楽の芸術的側面を切り離したドライなデータ駆動型の手法が台頭してきた.その技術的難解さに加えて,歌声合成技術の誕生で,コンピュータ音楽が大衆化したことにより,音楽の創作では,より芸術的な側面に注力せざるを得なくなった.このため,工学系研究者と芸術系研究者の間に問題意識の相違が生まれ,両サイドに造詣の深い平田圭二(当時NTT)と当時MUS主査の平賀瑠美(筑波技術大)を中心とした議論の末,袂を分かつ決断を下した.

1.3 音楽情報処理を研究する学生の広がり

音学シンポジウムの成功もあって,年間発表件数自体は堅調ではあるが,会員登録数は近年減少傾向にある(表1参照).2000年代初頭に日本各地の大学にできた音楽情報処理の研究拠点から多くの学生が育ち,2000年代後半には研究の質・量ともに飛躍的に向上した.実際,MUSで発表された研究で,音楽・音響・音声情報処理のトップカンファレンスであるISMIR,ICASSP,Interspeechなどに採択されたものは数多い.しかし,2012年以降,多くの学生を輩出してきた研究室を率いてきた嵯峨山茂樹(東大),奥乃博(京大),河原英紀(和歌山大)が相次いで退職された影響は大きい.2012年からは研究会の年間開催数が5回から4回に減少したが,平田圭二(はこだて未来大),平井重行(京産大),片寄晴弘(関西学院大),長嶋洋一(静岡文化芸術大),伊藤彰則(東北大),伊藤貴之(お茶の水女子大),馬場哲晃(東京首都大)などの研究室がMUSの屋台骨となってきた.また,後藤真孝(産総研)は,2000年代からさまざまな大学から学生を実習生として広く受け入れ,彼らが切磋琢磨することで分野の技術レベルの向上に寄与した.現在では,前述した研究室出身の若手研究者らが各地に新しい研究室を立ち上げつつあり,次世代の発展途上にある.

表1 登録者数と発表件数

2. 研究分野の変遷

情報学分野全体で機械学習技術の発展がもたらしたインパクトは甚大で,MUSでも研究分野および研究アプローチともに劇的な変化があった.

2.1 認識系の研究・生成系の研究

MUSでは,「認識系」の研究が活発である.自動採譜システムを実現するため,メロディ・各パートの音高推定,リズム推定,テンポ推定,ビート推定,コード推定,音楽構造解析などの技術が研究されてきた.最近は,ピアノ演奏に加えて,ポピュラー音楽のような複雑な音楽音響信号を取り扱うことができつつあり,解析精度も着実に向上している.認識系の研究は,「正解」が定義できるため,この10年で国際的な共通ベンチマーク(例:音楽解析コンペティションMIREX)が整備され,研究の進展が加速している.

研究アプローチの面では,今や統計的機械学習を用いることが当たり前となっている.たとえば,多重音解析においては,2000年代初頭に,後藤や亀岡によって,確率的生成モデルの最尤推定としての枠組みが考案されて以来,2010年頃からベイズ学習(階層ベイズ・ノンパラメトリックベイズ)が積極的に導入され,さらに最近では,深層学習の導入・融合が進んでいる.

一方,「生成系」の研究は,その問題定義や生成物の評価の難しさと戦いつつ,技術面や品質面で着実な進歩を遂げてきた.2010年以前の遺伝的アルゴリズムやその変種を技術的な核としていた従来のアプローチでは,生成物の良さを評価する関数を手動で定義し,最適解を試行錯誤的に探索するのが一般的であった.近年は,歌詞・コード・メロディなどの確率モデルを定式化することで,ビタビ探索やMCMCなどを用いて,確率空間上で解を効率的に探索する試みが出現しつつある.

2.2 工学系の研究・芸術系の研究

最近のMUSは,認識系・生成系ともに「工学系」の研究が多くなっている.かつてICコンサートが連携していた12月の研究会では,「芸術系」の研究・作品が多数発表されていたが,連携終了以降,音楽作品の発表は確かに大幅に減少した.しかし,芸術系の研究に造詣が深い長嶋や馬場らはMUSのコミュニティに残り,工学系の知識を活かしつつ,新しい楽器やインタフェースを生みだそうとする生成系の研究は今なお健在である.

3. 今後の展望

人間の脳では,「認識系」と「生成系」は表裏一体のフィードバック機構を構成していると考えられ,雨降って地固まるというが,深層学習という嵐が一段落したあと,「工学系」と「芸術系」の研究者がまた密に協働する未来はそう遠くない.昨今の深層学習の発展は著しく,他分野では,自然な画像や文章の自動生成ができつつあり,芸術性を持つ絵画や物語の自動生成も視野に入りつつある.音楽情報処理分野でも,簡単な構造であれば,無難な楽譜の自動生成は可能になってきている(例:DeepBach).この次は,芸術的な音楽作品を自動創作すること,さらに創造性を定量することがグランドチャレンジになるだろう.「認識系」と「生成系」,「工学系」と「芸術系」,いずれかに軸足を置きつつも,深い技術と広い見識を持つ学生・研究者の育成が望まれる.

(吉井和佳)

« PrevNext »

 

目次に戻る

All Rights Reserved, Copyright (C) Information Processing Society of Japan