next up previous
次へ: 逆問題としての音符列推定 上へ: HMMによる音符列推定 戻る: 音符列モデル

音長の伸縮変動モデル

同一の音価の音符でも、既に述べたさまざまな要因により、その物理的音長が 変動する。単純化して考えるため、これらを確率変動と見なそう。

5に、テンポ指定つき演奏実験で得られた約50の演奏のデー タから、4分音符、8分音符、符点4分音符の音長ヒストグラムの例を示す。横 軸(tick)は指定テンポにおいての4分音符の分解能を示す。今回は4分音符を 480 ticksとして統計をとった。

本稿では、各音符の音長の分布を正規分布で近似する。正規分布の平均$\mu$ は各音符長の正規の長さとし、標準偏差$\sigma$は正規の音符長に比例する分 と、固定分の和 $\sigma = a\mu + b$の形で与えられると仮定する。$a$は、統 計結果から、各音符の分散が音符が長い程広がるということに基づいた音符間 での分散の相違を示し、$b$はどの音符でも人間の演奏内に含まれる固定分の 物理的なずれを表す。図5から最小二乗法で得られた実験式 は $\sigma = 0.05 \mu + 0.011$ (秒単位)である。

しかし、実際の演奏テンポとモデルが仮定するテンポとにミスマッチがあるこ と、この分布は演奏者に依存すること、また統計サンプル数が多くないことな どを考慮して、モデルの標準偏差を若干広めに設定し、以下では $\sigma =
0.06 \mu + 0.0114 $(秒)として以下でモデル化に用いている。これを図 6に示す。このように音符$j$が音長$x$で演奏される正規分布 確率密度を$b_j(x)$と書く。確率モデルパラメータは、上のように演奏データ から学習することができる。これは、人間の音楽経験による音長の揺らぎの常 識の形成に譬えられる。

図 5: テンポ指定時の演奏の音長分布 (1/960秒単位)
$\textstyle \parbox{0.45\textwidth}{
\resizebox{0.45\textwidth}{!}{\includegraphics{Figure/Totalstatic.eps}}}$
図 6: 各音符音長の変動モデル
$\textstyle \parbox{0.4\textwidth}{
\resizebox{0.4\textwidth}{!}{\includegraphics{Figure/seiki_rate.eps}}}$
図 7: HMMによる音符列推定の原理
$\textstyle \parbox{0.48\textwidth}{
\resizebox{0.48\textwidth}{!}{\includegraphics{Figure/HMMscoring2.eps}}}$



平成16年9月15日