計算機上のシミュレーションにより, マイクロホンアレーを用いた場 合の雑音環境下の音声信号を作成し, そのデータをもとに音声認識実験を行った.
マイクロホンアレーのパラメータとしては, マイクロホンの列に正面から音声を 入力し, 30度傾いた方向から予備検討と同じ雑音を入力した. マイクロホンを4個とし, 通常のDSと提案手法である最短 ゴロム定規間隔型Delay-and-Sum(OGR-DS)を比較した. ここで, マイクロホン間隔は2つの手法において同規模とするために, DSでは, {0cm-6cm-12cm-18cm}にマイクロホンを配置し, OGR-DSでは4個のマークのOGRを もとにして, {0cm-3cm-12cm-18cm}にマイクロホンを配置した. また, 対照実験としてマイクロホンアレーを用いない場合, つまりマイクロホン 1個の場合の認識率も求めた.
各発声ごとに, 各マイクロホンの重みを0.1ずつ変化させ, 処理後の 音声区間と無音声区間を検出し, 比較して得られるSNR が全84通りの中で最も高くなるものを音声認識への入力とした.
音声認識エンジンにはJulius3.1p2を用い, IPA-testsetの200文の新聞朗読音声を評価 データとして用いた[3] . 音響特徴量は12次のMFCCとそのΔMFCCお よびΔPowerの計25次元とし, フレーム長25ms・フレームシフト10msで分析した.