next up previous
次へ: 連続音声認識手法によるリズム認識 上へ: MIDI信号からのリズム、テンポ、拍子の認識 戻る: リズム認識の問題

リズム認識技術の研究

音の長さに「忠実」すぎる音符の変換を行ってしまう量子化処理に代わる手法に ついては、人工知能の研究者らの研究対象として興味が持たれた。Desainら [3]は、隣接する音の長さの比が有理数になれば安定するエネルギー 関数、安定するまで処理を繰り返す方法などを提案した。また、Rosenthal [4]は、様々な規則を用いてリズムの持つ階層的な構造を 表現するモデルを用いて推定する手法を提案した。

我々[5,6]は、リズム認識を音声認識と同型の認 識の問題として定式化し、音声認識で用いられる確率モデルの枠組 を利用して隠れマルコフモデル(Hidden Markov Model, HMM) によりリズム認識を行うことを提案した。 Cemgil ら[7]は、テ ンポを内部変数としたKalman Filter を用いることにより、 Raphael[8]は テンポと音長の依存関係を表現したグラフモデル を用いることで、やはり音長やテンポの変動を確率的にモデル化し推定を行った。

図 1: 単純な量子化による不自然なリズム認識の例
\resizebox{1.05\linewidth}{!}{\includegraphics{eps/ryou1.eps}}

% latex2html id marker 1658
$\textstyle \parbox{0.28\linewidth}{\tabcolsep=0.2e...
...ar}\vspace{1ex}
\caption{音価列の出現頻度例(4/4拍子): 単語に対応}
\end{center}}$% latex2html id marker 1659
$\textstyle \parbox{0.25\linewidth}{\begin{center}\...
...s}}\vspace{1ex}
\caption{各音符音長の変動モデル: 音響モデルに対応}\end{center}}$ % latex2html id marker 1660
$\textstyle \parbox{0.2\linewidth}{\begin{center}\r...
...s}}\vspace{1ex}
\caption{2拍単位リズムモデル例:
言語モデルに対応}\end{center}}$ % latex2html id marker 1661
$\textstyle \parbox{0.2\linewidth}{\begin{center}\r...
...}\vspace{1ex}
\caption{音符連接のリズムモデル例: 任意音素列に対応}\end{center}}$

% latex2html id marker 1662
$\textstyle \parbox{0.2\linewidth}{\begin{center}\r...
...aphics{eps/tempoesti2.eps}}\vspace{1ex}
\caption{一定テンポモデル}\end{center}}$ % latex2html id marker 1663
$\textstyle \parbox{0.2\linewidth}{\begin{center}\r...
...aphics{eps/tempotran3.eps}}\vspace{1ex}
\caption{変動テンポモデル}\end{center}}$ % latex2html id marker 1664
$\textstyle \parbox{0.2\linewidth}{\begin{center}\r...
...hics{eps/BEATesti.eps}}\vspace{1ex}
\caption{モデルによる拍子推定}\end{center}}$ % latex2html id marker 1665
$\textstyle \parbox{0.3\linewidth}{\begin{center}\r...
...aphics{eps/bar2.eps}}\vspace{1ex}
\caption{モデルによる小節線推定}\end{center}}$



平成16年9月23日