テンポ推定、拍子推定、拍節推定

次へ: 多声音楽のリズム推定 上へ: MIDI信号からのリズム、テンポ、拍子の認識 戻る: 連続音声認識手法によるリズム認識

テンポ推定、拍子推定、拍節推定

テンポが未知の場合は、以上のテンポ既知のモデルを複数のテンポ候補について並列に持つ(図6)ことで、事後確率最大のテンポと音価列を得ることができる[5,6,9]。テンポが変動する場合は、異テンポ間の遷移確率を与えてViterbi探索することにより、音価列とともに部分的なテンポが推定できる。あるいは、音符の連鎖の音長比(リズムベクトル)を観測量とすることにより、テンポに依存しない扱いも可能である[10]。

2拍子系と3拍子系のリズム語彙を並列に持ち(図8)、Viterbi経路を探索することで拍子を推定することもできる。また、揚げ拍リズムのモデルを先頭に加える(図9)ことにより、小節線位置を推定することも可能である。

また、リズム認識とテンポ推定を交互に繰り返すことで不可分な両者を分離推定することができる。テンポの変化部分のセグメンテーションも、セグメンタル -means法やone-pass DP法などの音声認識の手法に帰着することができる。

連続認識手法に基づく種々のモデルについて、人間の演奏をMIDI信号で記録したデータを収集し、モデルの性能評価を行った一例 [9,10]を挙げると、MIDIキーボードによる単旋律の演奏では、市販のシーケンサソフトの量子化機能40.7 $\sim$ 59.7%を上回る正解率85.9 $\sim$ 97.3%を得た。また、多声音楽の電子ピアノ演奏に対しても市販ソフトの14.4%～45.4%を上回る36.8%～92.2%の正解率を得た。

平成16年9月23日