next up previous
次へ: 和声進行モデル 上へ: 転調認識と和声づけ 戻る: 転調認識と和声づけ

定式化

和声進行(和声系列) $ H=({h(1),\cdot\cdot\cdot,h(L)})$が生成される確率$P(H)$を、これらすべてが生起する同時確率として

$\displaystyle P(H)$ $\textstyle =$ $\displaystyle P\left(h(1),\cdot\cdot\cdot,h(L)\right)$  
  $\textstyle =$ $\displaystyle \prod_{i=1}^L P(h(i)\mid h(1),\cdot\cdot\cdot,h(i-1))$ (1)

と表現する。ここで$h(i)$は和声進行$H$$i$番目の和声(chord)を表す。条件付き確率 $P(h(i)\mid h(1),\cdot\cdot\cdot,h(i-1))$の値を、有限長の$n$-gramモデルでモデル化する。 これにより、既存の楽曲の和声進行の統計から学習推定することができる。 また和声進行 $H=(h(1),\cdots,h(L))$から、旋律$M=(n(1),$ $\cdots,n(K))$が生成される確率$P(M\vert H)$を条件付き確率
\begin{displaymath}
P(M\vert H)=P(n(1),\cdot\cdot\cdot,n(K)\vert H)
\end{displaymath} (2)

により表現する。ここで、$n(i)$は旋律$M$$i$番目の音(音高や音長などの情報を含む)を表す。 旋律は各区間ごとに対応する和声があると考えられる。 そこで、旋律はその背後の和声の影響のみを受けて確率的に生成されると仮定する。 つまり、ある和声進行$H$から旋律$M$が生成される確率を、 旋律の断片が、対応する和声進行の断片から生成される確率の積でモデル化する。

上記の二つのモデルはHMMとして一つのモデルに統合することができる。 旋律のみが与えられたとき、旋律の背後にある和声は直接には観測できず、マルコフ過程に従って遷移する。これがHMMの状態遷移に対応する。 また、旋律は背後の和声から確率的に生成される。これがHMMの状態出力に対応する。 そして与えられた旋律$M$に対する適切な和声$H$を推定する問題を、旋律$M$を観測したときの事後確率を最大化する(maximum a posteriori)和声$\hat{H}$を求める問題とする。 即ち、

\begin{displaymath}
\hat{H}=\mathop{\rm argmax}_{H} P(H\vert M)
\end{displaymath} (3)

と定式化する。ここでBayesの定理
\begin{displaymath}
P(H \mid M) = \frac{P(M \mid H)P(H)}{P(M)}
\end{displaymath} (4)

より、式([*])は
\begin{displaymath}
\hat{H} = \mathop{\rm argmax}_{H}P(M\vert H)P(H)
\end{displaymath} (5)

と表される。 最も尤もらしい和声進行$\hat{H}$はHMMの状態ネットワークの最適な状態遷移系列として、Viterbi探索を用いて効率的に求めることができる。 このようにして、和声付け問題を 旋律$M$を生成したと考えられる和声進行$H$を推定する逆問題として考える。
図: 和声進行から旋律を生成するHMMの概念図
\includegraphics[keepaspectratio=true,height=25mm]{eps/HMM.eps}



平成16年9月23日