(邦訳:歌詞の談話構造のモデル化)
渡邉 研斗 国立研究開発法人産業技術総合研究所 研究員 |
[背景]散文と異なり歌詞は特有構造を持つ
[問題]言語的特徴と音楽的特徴を併せ持つ歌詞をどのようにモデル化するか
[貢献]歌詞特有の性質の分析および新しい作詞支援技術を開発
ポピュラー音楽において,歌詞は感情やメッセージを伝えるための重要な要素である.特にメロディに対して歌詞を作る作業は,一般的な散文を作る作業と比べ,言語的な要素とメロディの音符・休符やリズム,くり返しなどの音楽的な要素の両方を考慮する必要があるため,難易度の高い作業である.たとえば,休符をまたいで単語を配置すると「あし・た」のように不自然な歌詞になるため,「あした・」のように休符をまたがないように単語を配置する必要がある.また,作詞家は「話の場面設定→回想→主張」のようにストーリーを展開させ,さらには1番や2番のように類似したフレーズを繰り返している.このような複数の文や段落からなる構造を本研究では談話構造と呼ぶ.仮に,メロディなどの音楽構造と,ストーリーや繰り返し等の談話構造を同時に考慮して単語列を探索するシステムが実現できれば,膨大な可能性から単語列を探す手間が簡略化できると考えられる.本研究の目的は,歌詞の談話構造について(1)繰り返し,(2)ストーリー展開,(3)メロディの3つの観点から分析し,計算機で扱えるようにモデル化することである.
本研究では,以下の3つの観点について歌詞の談話構造を分析・モデル化する.
(1)歌詞は散文とは異なり繰り返しを多用するため,「歌詞の繰り返しパターンが談話構造のモデル化に寄与する」という仮説を立てた.具体的には「Aメロ,Bメロ,サビ」のような繰り返しパターンを捉えることが可能である音楽情報処理技術と融合することで,歌詞の段落の境界を推定するモデルを提案する.
(2)作詞家は歌詞の内容を考える際に,テーマやストーリーを考慮している.このとき,人間であれば歌詞の背後にあるストーリーを思い描くことができるが,どんなストーリー展開かは明示的に記載されておらず,計算機が歌詞の背後にある意味構造を捉えることは難しい.本研究では歌詞の背後に存在する各段落の話題を,潜在変数zと定義した確率モデルを設計し,大規模データからストーリー展開を機械学習する.
(3)テキスト解析により得られる言語情報と,音楽音響信号解析により得られる音楽情報の関係性を分析・モデル化し,その法則性を明らかにする.特にメロディと歌詞の談話構造を対応付けるデータを大量に作成することで初めて分析やモデル化が可能となる.
さらに,これらの談話構造モデルを応用した研究として,ストーリー性を持ち,音楽として歌いやすく,文章としても正しい歌詞の自動生成手法を深層学習を活用すること実現する.また,談話構造を考慮した世界初の作詞支援インタフェースも提案する.従来の支援技術では数行の歌詞の創作に限定されていたが,本インタフェースによってストーリー展開のある1曲分の歌詞が創作可能となる.
このように,本研究では歌詞の談話構造に関するさまざまな性質を世界で初めて数理的にモデル化し,大規模データからこれらの性質を読み解くことで実世界の歌詞の言語現象を定量的・定性的に分析してきた.我々は歌詞の談話構造に関する基礎から応用技術まで,広範囲に渡って分野を切り開き,歌詞情報処理の拡大に貢献した.
本研究では,以下の3つの観点について歌詞の談話構造を分析・モデル化する.
(1)歌詞は散文とは異なり繰り返しを多用するため,「歌詞の繰り返しパターンが談話構造のモデル化に寄与する」という仮説を立てた.具体的には「Aメロ,Bメロ,サビ」のような繰り返しパターンを捉えることが可能である音楽情報処理技術と融合することで,歌詞の段落の境界を推定するモデルを提案する.
(2)作詞家は歌詞の内容を考える際に,テーマやストーリーを考慮している.このとき,人間であれば歌詞の背後にあるストーリーを思い描くことができるが,どんなストーリー展開かは明示的に記載されておらず,計算機が歌詞の背後にある意味構造を捉えることは難しい.本研究では歌詞の背後に存在する各段落の話題を,潜在変数zと定義した確率モデルを設計し,大規模データからストーリー展開を機械学習する.
(3)テキスト解析により得られる言語情報と,音楽音響信号解析により得られる音楽情報の関係性を分析・モデル化し,その法則性を明らかにする.特にメロディと歌詞の談話構造を対応付けるデータを大量に作成することで初めて分析やモデル化が可能となる.
さらに,これらの談話構造モデルを応用した研究として,ストーリー性を持ち,音楽として歌いやすく,文章としても正しい歌詞の自動生成手法を深層学習を活用すること実現する.また,談話構造を考慮した世界初の作詞支援インタフェースも提案する.従来の支援技術では数行の歌詞の創作に限定されていたが,本インタフェースによってストーリー展開のある1曲分の歌詞が創作可能となる.
このように,本研究では歌詞の談話構造に関するさまざまな性質を世界で初めて数理的にモデル化し,大規模データからこれらの性質を読み解くことで実世界の歌詞の言語現象を定量的・定性的に分析してきた.我々は歌詞の談話構造に関する基礎から応用技術まで,広範囲に渡って分野を切り開き,歌詞情報処理の拡大に貢献した.

(2018年5月29日受付)