next up previous
次へ: Harmonic Clustering 上へ: 多重音の認識・分離・MIDI変換 戻る: 多重音解析の研究

Specmurt法

図 10: Specmurt法による``J. S. Bach: Ricercare a 6 aus Musikalisches Opfer, BWV 1079'' (RWC研究用音楽データベース収録: 管弦混合 演奏)の音高可視化結果例 (5声部部分)
\includegraphics[width=.97\linewidth,height=30mm]{/lab/common/publications/kameoka/Fig/MIDIn12-specmurt.eps}

(a) Specmurt法による基本周波数分布の濃淡表示

\includegraphics[width=.97\linewidth,height=30mm]{/lab/common/publications/kameoka/Fig/n12_cut.eps}

(b) 付属の参照用標準MIDI信号のピアノロールウィンドウ表 示

我々は、音声分析の基本的手法であるCepstrum分析をヒントにして、 多声音楽信号の高調波周波数成分を抑圧低減して基本周波数のみを強調 することでピアノロールに似た音高を可視化する信号処理方法``Specmurt法'' [37]を開発した。その原理は以下のようである。

対数周波数$x$の上では、$n$次高調波周波数は基本周波数の値に関わらず基本周 波数から$\log{n}$だけ離れて位置する。ここで、周波数成分間のパワー比が基 本周波数に関わらず共通である調波構造を想定し、基本周波数に相当する位置を 原点とし基本波パワーを$1$とした共通調波構造パターン$h(x)$を定義する。基 本周波数がどの値でどれだけの成分をもつかを表した基本周波数分布$u(x)$を定 義し、パワースペクトルの加法性を仮定すると、多重音スペクトル$v(x)$$u$$h$の畳み込み $v(x)=h(x)*u(x)$になる。Wavelet変換などにより観測された $v(x)$に対して$h(x)$の逆畳み込みを、Fourier変換領域(Specmurt領域)の除算 により行えば、基本周波数分布$u(x)$が得られる。

実際には調波構造は共通ではないが、平均的な特性を$h(x)$に仮定することによ り、高調波を抑圧して基本周波数を強調する効果はある。 例えば、$h(x)$$1/f$特性とした場合の実演奏信号に対する音高可視化結果の 例を図10に示す。また、共通調波構造パターンを自動的に決 定する方法[38]は効果が大きい。



平成16年9月23日