next up previous
次へ: 今後のリズム認識研究 上へ: リズム語彙によるリズム認識 戻る: 変動する音長とリズム単語

逆問題としての音符列推定

演奏情報$X$が音符列$W$を意図したものである確率$P(W\vert X)$は、Bayesの定理

\begin{displaymath}P(W\vert X)=\frac{P(X\vert W)P(W)}{P(X)} \end{displaymath}

によって、$P(X\vert W)P(W)$を求める問題と考えることができる。ここで$P(X\vert W)$$P(W)$は先に述べたモデルから計算される。これは、HMMネットワーク上での探 索問題であり、連続音声認識で用いられている探索アルゴリズムを利用すること ができる。例えば、図[*]に示すように、$P(X\vert w)$は Viterbi探索を行い、さらに上位の階層$W$のネットワーク探索をLevel building 法で行うことができる。

図: Level building 法による音符列の探索
\resizebox{0.95\linewidth}{!}{\includegraphics{eps/search_all_v2.eps}}



表: 音声認識とリズム認識の対応
             連続音声認識 リズム認識 
入力単位 文音声 楽曲
語彙 辞書 リズム語彙
単位モデル 単語 リズム単語 $w$
隠れ状態 音素の状態 音符 $q$
観測値 スペクトル列 音長系列 $x$



平成16年9月23日