- A: 音響信号の読み込みと時間周波数解析
音響信号を読み込み,短時間フーリエ変換
(STFT)により時間周波数解析を行ってスペクトログラムを出力
する。出力された観測スペクトログラムはウィンドウ1上にカラーマップ表示される。
- B: 観測信号からパーツを獲得するアルゴリズムの実行
出力された振幅スペクトルパーツをウィンドウ2に,
出力されたエンベロープパーツをウィンドウ4に,
振幅スペクトルパーツのアクティベーションをウィンドウ3ににそ
れぞれ表示する。また,最適推定されたスペクトログラムモデルをウィンドウ5
にカラーマップ表示する。
上図には,提案法の実際の実行結果の例を示しているが,ウィンドウ1と5を見比べてみると,
観測スペクトログラムが最適化アルゴリズムを通してスペクトログラムモデルに
よって適切に再現されていることが確認できる。
- C: 音響信号の生成
D,E,Fの操作を介して加工されたスペクトログラムから
Griffin-Lim の反復STFT法[1]を用いて音響信号を合成し,再生する。
- D: トランスポーズ機能
ウィンドウ2に表示される個々の振幅スペクトルパーツを+/−ボタンにより
100cent(半音) 単位でトランスポーズできる。ここで言うトランスポーズとはスペクト
ルを周波数方向に線形に伸縮する操作をさす。ウィンドウ2 の下部には,各スペクトル
パーツがどの音名に最も対応しているらしいかをSubharmonic Summation (SHS)[2]により
推定した結果を表示している。この音高表示を手がかりにすれば,例えば長調の曲を短調の
曲に信号を加工するためにはどのスペクトルパーツをどのようにトランスポーズすれば
良いかといったようなことが判断できるようになる。
- E: ボリュームコントロール機能
各スペクトルパーツに対応するノートの音量をスライダ
により自由に調節できる。
- F: サステイン・リリースタイムコントロール機能
各エンベロープパーツに対応するノー
トのサステインないしリリースタイムを+/−ボタンにより自由に調節できる。またこ
の他に,各ノートの発音開始のタイミングをコントロールすることも可能である。