テンポが未知の場合は、以上のテンポ既知のモデルを複数のテンポ候補について
並列に持つ(図6)ことで、事後確率最大のテンポと音価列を得る
ことができる[5,6,9]。テンポが
変動する場合は、異テンポ間の遷移確率を与えてViterbi探索することにより、
音価列とともに部分的なテンポが推定できる。あるいは、音符の連鎖の音長
比(リズムベクトル)を観測量とすることにより、テンポに依存しない扱いも可能
である[10]。
2拍子系と3拍子系のリズム語彙を並列に持ち(図8)、Viterbi経路 を探索することで拍子を推定することもできる。また、揚げ拍リズムのモデルを 先頭に加える(図9)ことにより、小節線位置を推定することも可能であ る。
また、リズム認識とテンポ推定を交互に繰り返すことで不可分な両者を分離推定
することができる。テンポの変化部分のセグメンテーションも、セグメンタル
-means法やone-pass DP法などの音声認識の手法に帰着することができる。
連続認識手法に基づく種々のモデルについて、人間の演奏をMIDI信号で記録した
データを収集し、モデルの性能評価を行った一例
[9,10]を挙げると、MIDIキーボードによる単旋
律の演奏では、市販のシーケンサソフトの量子化機能40.759.7%を上回る
正解率85.9
97.3%を得た。また、多声音楽の電子ピアノ演奏に対しても市
販ソフトの14.4%〜45.4%を上回る36.8%〜92.2%の正解率を得た。