next up previous
次へ: テンポ推定、拍子推定、拍節推定 上へ: MIDI信号からのリズム、テンポ、拍子の認識 戻る: リズム認識技術の研究

連続音声認識手法によるリズム認識

上述のHMMに基づく我々のリズム認識の手法 [5,6,9,10]を紹介す る。「ありふれたリズム」や「殆んどあり得ないリズム」などの確率的な言語モ デルを考慮することがポイントである。この考え方は人間のリズム認知の計算モ デルとも捉えられる。

まず、テンポ既知の単旋律のMIDI信号から楽譜を復元するため、HMMの隠れ状態 を意図された音価に対応づける。HMMの状態出力分布は図4に示すよ うに、観測された音長(実際はIOI(inter-onset interval)を用いる)の分布モデ ル (音響モデルに対応) とし、状態間の遷移は、あり得る音価列(リズム単語と 呼ぶ)の集合(リズム語彙: 図2)を並列に持つ言語モデル(図 4)、あるいは音価の$n$-gram 確率(図5)により与える (言語モデルに相当)。こうして、Bayesの定理により事後確率最大の経路を Viterbi アルゴリズムにより求める (経路探索に対応)ことにより、事後確率最 大の音価列が得られる。

演奏者のスキルあるいは演奏のスタイルなどにより音長の確率変動が大きい場合 は、音長分布の分散を大きくする。音楽のジャンルやスタイルによりリズムに 「くせ」がある場合には、リズム語彙の構成や確率に反映する。



平成16年9月23日