next up previous
次へ: HMMによる音符列推定 上へ: 隠れマルコフモデルによる音楽演奏からの音符列の推定 齋藤 直樹  戻る: 隠れマルコフモデルによる音楽演奏からの音符列の推定 齋藤 直樹 

まえがき

楽譜の浄書やMIDI演奏を目的にして、コンピュータへ楽譜を投入するソフトウェ アツールが普及している。しかし、鍵盤入力から演奏者(ユーザ)の意図した楽 譜に変換するのは単純な問題ではない。たとえばMIDI鍵盤入力の場合、音高情 報は正確に得られるが、音価(音符の長さ)は(MIDIの時間分解能を単位として) ほぼ連続的な値として得られ、それを単純に処理しただけでは、意図された音 符は得られない。その理由は、ユーザの演奏において、意図した音符の正規の 長さから、実際に演奏した音符長には長短のずれを含むからである。 よほどの熟達者ですら、2分音符から16分音符までを機械的に正確に弾き分け るのは困難である。まして、音楽初心者が演奏する場合、テンポや正規の音符 長に対し忠実に演奏することができない場合が多い。

音響信号入力からの自動採譜[1]では、この問題はさらに困難になる。 採譜システムとしては主にMIDI信号を対象とし音楽的分析を行うシステムと音 響信号から周波数解析・音楽的分析を行い、様々な音楽解釈から楽譜を推定す る手法がある[1]。これらは一般に人間の演奏情報を対象としている。 楽譜化を目的とした演奏でない限り、曲のスタイル・表情付け、演奏者の音楽 意図などにより、テンポや音長は意識的な変動を受ける。

以上のように、さまざまな音長変動要因が音長系列から音符シンボル列への変 換を困難にする。従来手法や市販品の殆どは閾値処理をベースとしている。し かしそのような単純な処理では、ある市販ソフトウェアによる図1 の例のように誤って音符推定される。演奏者の音楽的意図は同図左のようであ り、同図右の物理的演奏情報に忠実な変換は必ずしも実用的ではない。この揺 らぎに対して補正する研究は幾つか報告されており、閾値処理をベースとして、 ヒストグラム処理による基準拍の設定手法、音楽的・文法的な強制或いはフレー ズなどのルールの付加、またはテンポ情報を閾値設定に用いるものなどがある [2,3,4,5]。また自動演奏という視点から、演奏情報と楽 譜情報との比較から演奏の表情規則を抽出し、その規則により表情付けされた 演奏からの採譜システムとして応用しているもの[6]や曲のビートを 解析するビートトラッキングをマルチエージェントによりモデルベースで音楽 的解析を行う報告もされている[7,8]。

本稿では、同種の問題を扱っている連続音声認識分野の方法論をこの問題に適 用し、音符列推定(リズム認識)、演奏テンポ推定、拍子・拍節認識についてそ の定式化と実験結果について述べる。



平成16年9月15日