next up previous
次へ: 変動する音長とリズム単語 上へ: リズム語彙によるリズム認識 戻る: リズム語彙によるリズム認識


リズム語彙と文法

音長に揺らぎがある演奏でも、聴き手は演奏者が意図したリズムを理解できるの は、聴き手が出現しうる音符列に関する常識として持っているからであると考え られる。例えば、図1右のような楽譜は理論上は可能ではあるが常識 に合わないであろう。これを反映させるため、これらの常識をリズムパターンの 表れ易さの確率を与えるモデル化を行う。これは音声認識における言語モデルあ るいは文法に相当する部分である。連続音声認識の場合と同様に、$N$-gram モ デルを用いることができる。 リズム $W=\{w_1,\cdots,w_N\}$が演奏される確率は、bigram モデルの場合

\begin{displaymath}
P(W) = P(w_1) \prod_{n=2}^N P(w_n \vert w_{n-1})
\end{displaymath}

これらのリズム語彙の文法モデルのパラメータ値は、楽曲データから学習するこ とができる。これは、人間の音楽経験による常識の形成に譬えられる。このよう ないわば「リズム文法」は、複雑に精度良く作成するほど、リズムパターン認識 精度は向上する。また、これらはモデル楽曲のジャンルやスタイルに依存する。 また、音声認識の未知語に相当する問題として、学習で使用した楽曲に含まれな かったパターンを認識することが出来ない。リズム語彙の単位は、一小節のリズ ムパターン(リズム単語)、ひとつの音符、複数の音符の組などがいろいろなモデ ルを提案した。



平成16年9月23日