(邦訳:確率的定式化による日本語歌詞からの自動作曲の研究)
深山 覚 産業技術総合研究所 研究員 |
[背景]音楽は与えられたものを楽しむだけでなく自分なりに編集加工しアップロードする時代になった
[問題]誰でも手軽に歌詞から歌唱曲を質と多様性を持って自動作曲できることを実現する
[貢献]人々のオリジナルコンテンツ制作をサポートでき,結果として世の中のコンテンツが豊かになる
本研究では日本語歌詞の入力から歌唱曲の自動作曲を実現する方法を議論した.
歌唱曲は一般に馴染み深い音楽ジャンルであり,また歌詞と曲想を通じて感情豊かにメッセージを伝えられる魅力的なメディアである一方,その作曲には専門技能が必要である.歌唱曲の自動作曲が実現できれば人々がより手軽に歌唱曲を創作できるようになる.
歌唱曲自動作曲の難しさとは?それは多様な作曲結果を得ることと,妥当な質の楽曲を作曲することの両立であると考えられる.実際,自動作曲システムにおいて生成される旋律を過剰に多様にすると生成楽曲の質が担保されにくく,質を担保するあまり常に似た楽曲が生成されるようでは多様な楽曲が生成できない.
そこではじめに,多様な歌唱曲を自動作曲するための方法を議論した.歌唱曲は旋律・和声・リズム・伴奏などの音楽要素に分解して解釈でき,また,これら音楽要素の組合せにより曲想が変化する.そこで旋律以外の音楽要素の組合せによって多様な楽曲を生成する作曲条件が構成できる.特に和声進行については,任意の和声進行を用いた場合でも,実際に楽曲で使われる音を自動で決定(ヴォイシング)できるよう,隠れマルコフモデルによる定式化と解法を論じた.またフランス国立情報学自動制御研究所に滞在して行った自動和声付けの共同研究の内容についても記載した.
次に,妥当な質の歌唱曲を自動作曲するための方法を議論した.「妥当な質の歌唱曲作曲」とは,人々が曲を音楽的に妥当であると判断する確率を最大化することとしてモデル化できることを議論した.歌詞の韻律と音楽理論の多くの制約が局所的な制約であることから,旋律の自動作曲は,旋律を構成する各音への局所的な制約下で,確率最大の旋律を求める変分法的な問題に帰着された.音高経路が離散的な本問題の場合,これは動的計画法に基づく経路探索によって解けることが示された.自動作曲結果は,専門家2人によって評価され,音楽的に妥当な質を持っていることが確認された.
最後に,実際に日本語歌詞を入力とする歌唱曲自動作曲システムOrpheus(オルフェウス)の設計法を論じた.Orpheus Ver. 2,Orpheus Ver. 3, Orpheus BBという3つのシステムの設計が議論された.ユーザが歌詞を入力し曲調を選択すると伴奏付歌声を聞くことができるwebアプリケーションを設計した.このうちOrpheusBBは関西学院大学・日本大学との共同研究である.また,作編曲支援システムの設計研究事例として,亜細亜大学と行ったピアノ譜からギター譜へ編曲する手法の共同研究についても記載した.
以上,本研究の成果は,多様な自動作曲結果を得ることと,妥当な質の楽曲を生成することを両立する方法を実現し,その効果と実用性を専門家による評価と,webアプリケーションによる大規模実験を通じて検証したことである.実際,本研究の手法に基づく自動作曲により年間12万曲以上のペースで作曲され,動画投稿サイトにも多数投稿されるに至っている.作曲という創造活動を含む音楽情報処理を題材として,高い難度の人工知能的課題を実際的に解く第一歩を踏み出せた.
[問題]誰でも手軽に歌詞から歌唱曲を質と多様性を持って自動作曲できることを実現する
[貢献]人々のオリジナルコンテンツ制作をサポートでき,結果として世の中のコンテンツが豊かになる
本研究では日本語歌詞の入力から歌唱曲の自動作曲を実現する方法を議論した.
歌唱曲は一般に馴染み深い音楽ジャンルであり,また歌詞と曲想を通じて感情豊かにメッセージを伝えられる魅力的なメディアである一方,その作曲には専門技能が必要である.歌唱曲の自動作曲が実現できれば人々がより手軽に歌唱曲を創作できるようになる.
歌唱曲自動作曲の難しさとは?それは多様な作曲結果を得ることと,妥当な質の楽曲を作曲することの両立であると考えられる.実際,自動作曲システムにおいて生成される旋律を過剰に多様にすると生成楽曲の質が担保されにくく,質を担保するあまり常に似た楽曲が生成されるようでは多様な楽曲が生成できない.
そこではじめに,多様な歌唱曲を自動作曲するための方法を議論した.歌唱曲は旋律・和声・リズム・伴奏などの音楽要素に分解して解釈でき,また,これら音楽要素の組合せにより曲想が変化する.そこで旋律以外の音楽要素の組合せによって多様な楽曲を生成する作曲条件が構成できる.特に和声進行については,任意の和声進行を用いた場合でも,実際に楽曲で使われる音を自動で決定(ヴォイシング)できるよう,隠れマルコフモデルによる定式化と解法を論じた.またフランス国立情報学自動制御研究所に滞在して行った自動和声付けの共同研究の内容についても記載した.
次に,妥当な質の歌唱曲を自動作曲するための方法を議論した.「妥当な質の歌唱曲作曲」とは,人々が曲を音楽的に妥当であると判断する確率を最大化することとしてモデル化できることを議論した.歌詞の韻律と音楽理論の多くの制約が局所的な制約であることから,旋律の自動作曲は,旋律を構成する各音への局所的な制約下で,確率最大の旋律を求める変分法的な問題に帰着された.音高経路が離散的な本問題の場合,これは動的計画法に基づく経路探索によって解けることが示された.自動作曲結果は,専門家2人によって評価され,音楽的に妥当な質を持っていることが確認された.
最後に,実際に日本語歌詞を入力とする歌唱曲自動作曲システムOrpheus(オルフェウス)の設計法を論じた.Orpheus Ver. 2,Orpheus Ver. 3, Orpheus BBという3つのシステムの設計が議論された.ユーザが歌詞を入力し曲調を選択すると伴奏付歌声を聞くことができるwebアプリケーションを設計した.このうちOrpheusBBは関西学院大学・日本大学との共同研究である.また,作編曲支援システムの設計研究事例として,亜細亜大学と行ったピアノ譜からギター譜へ編曲する手法の共同研究についても記載した.
以上,本研究の成果は,多様な自動作曲結果を得ることと,妥当な質の楽曲を生成することを両立する方法を実現し,その効果と実用性を専門家による評価と,webアプリケーションによる大規模実験を通じて検証したことである.実際,本研究の手法に基づく自動作曲により年間12万曲以上のペースで作曲され,動画投稿サイトにも多数投稿されるに至っている.作曲という創造活動を含む音楽情報処理を題材として,高い難度の人工知能的課題を実際的に解く第一歩を踏み出せた.

自動作曲システムOrpheus(オルフェウス)のWebインタフェース:
歌詞を入力して自動作曲を行い伴奏付の歌声を楽譜付で聴くことができる.
(2013年6月14日受付)