next up previous
次へ: 周波数領域での幾何学的処理 上へ: Okajima04ASJ03v2 戻る: Okajima04ASJ03v2

はじめに

実環境での自動音声認識では、周囲雑音や残響が認識性能の劣化の原因となる。 マイクロホンアレーを用いることにより、 対象音と雑音の空間的情報を利用し、 それらの影響を抑制し、遠隔発話音声の認識性能を向上させることができる。

マイクロホンアレーについては様々な技術が研究されてきている。 基本的な方法であるDelay-and-Sum (DS) は学習を必要としないが、 その性能は十分とはいえない。 Griffith-JimやAMNORなどの適応フィルタ型マイクロホンアレーでは、 予め無音声区間を入力し学習させることが必要である[1]。 しかし、雑音や残響が時々刻々変化する環境では、 学習による環境への追従が間に合わず、性能が低下することがある。

また、それら従来の手法は信号波形の推定を主な目的としているが、 音声認識に通常用いられるMFCCのような音響特徴量を計算するためには 信号の短時間スペクトルを推定すれば十分である。

そこで本稿では、音声認識の性能向上を目指し、 マイクロホンアレーを用い、 周波数領域での幾何学的な考察に基づいた 高性能かつ学習の必要のない短時間スペクトル推定の方法 について検討したので報告する。



平成16年3月25日