next up previous
次へ: Delay-and-Sum型マイクロホンアレー 上へ: Kamamoto04ASJ03 戻る: Kamamoto04ASJ03

はじめに

近年, 自動音声認識(Automatic Speech Recognition; ASR)が, 擬人化エージェントや カーナビゲーションシステムなどへ応用されてきている. 実環境では雑音や残響の影響で認識率が大幅に低下することから, 雑音や残響に頑 健なASRシステムを目指す研究がなされてきている[1]. マイクロホンアレーを用いることで, 対象音源と雑音源の空間的位相差を利用し, 雑音や残響を抑圧することにより, 遠隔発話音声の認識性能を向上さ せることができる.

マイクロホンアレーには様々な技術があるが, Griffith-JimやAMNORなどの適応型マイクロホンアレーでは, 無音声区間を予め 入力し学習させることが必要である[2]. 実際に音声認識を行う場合に, 雑音環境下で 学習のための無音声区間を検出することは必ずしも容易ではない. また, 定常雑音に対して頑健な雑音除去を行うことはできるが, 非定常雑音に対 しては性能が低下する. このような雑音や残響が時々刻々変化する環境では, 認識性能 が低下してしまう.

そこで本研究では, ASRの性能と利便性の両立を目指し, 学習を必要とせず, 雑 音および残響の抑制に効果のあるDelay-and-Sum(DS)に着目し, そのマイクロホ ン間隔と配置に関して改良を試みたので報告する.



平成16年3月25日