初期フレームは``検出処理''を実行し,以降のフレームでは,直前フレームでの多 重音モデルとのKL(Kullback-Leibler)情報量が一定閾値以上の場合 は``追跡処理''を,閾値より大きい場合は新たなフレーズの開始直後あるいは新たな話 者による音声の介入直後と見なして改めて``検出処理''を行う. ただし,フレームごとの処理選択方法は今後改善の余地がある。 なお,各フレームで求まるの推定値をもとに話者ごとの音声信号を分離 合成することもできる.