共同研究案    
システム情報学第一研究室

東京大学産学連携提案テーマデータベースより:

マイクロフォンアレイを用いた環境雑音の抑制 この研究室では、マイクロフォンアレイを用いて周囲の雑音を抑制し必要な音声だけをSN比よく抽出する方式について研究を進めている。この方式には、この研究室で開発したCSCC法(複素スペクトル円心法) が使われ、これは複数マイクからの信号をフーリエ変換し複素平面に表したときにノイズベクトルが円形に分布するとの性質を利用し、その中心を求めることにより信号を精度よく抽出するものである。実験の結果からも従来のマルチマイク方式を上回る性能を示し、周波数毎に別の到来角度であっても、また動く音源に対しても抑制効果があるとの特長を有する。自動車運転中に音声で情報機器を制御する等、多くの応用が期待され、この技術の応用を目指した共同研究を希望している。
音楽音響信号のMIDI信号への変換 この研究室では、多重音からなる音楽音響信号を解析・分離し、MIDI信号あるいは楽譜に変換する技術に関して研究を進めている。この研究室が提案するSpecmurt法(対数周波数逆畳み込み)およびHarmonic Clustering法を用いることにより、多重音を構成するそれぞれの音の基本周波数を検出しピッチを特定できる。また、同時発音数を推定し音源楽器の分離を行う等のアルゴリズムの開発を進め、その基本機能を実験により確認済である。音響信号をMIDIに変換することにより音楽の編集、加工、音色変換、楽譜への変換等が可能となり、音楽制作に広い応用が期待できる。この技術に関心を有する企業と、実用を目指した共同研究を希望している。
手書き数式の認識技術 手書きされた数式には多くの曖昧さが含まれ、これを正しく機械認識することは難しく、数式を含む情報を扱う上でのひとつのネックとなっている。数理的なモデルに基づく情報処理が専門のこの研究室では、手書き数式の認識に関して研究を進め、HMM(隠れマルコフモデル)および数式構造文法、確率文脈文法等を用いて、曖昧さを含むオンライン手書き数式を正しく認識するための新しい方式を開発している。これにより、手書き文字の清書や、それを使っての計算等が可能となり、数式を含む情報処理の効率向上に大きな貢献が期待できる。この研究に関心を有する企業との共同研究を希望している。
擬人化音声対話エージェントシステム この研究室では、今後の高度なヒューマンインタフェースとして、人間と同じように対話するコンピュータの実現を目指し、擬人化音声対話エージェントの研究を進めている。対話の進行に合わせたエージェントの視線方向制御、表情・ジェスチャ合成、使用者の反応(応答、割り込み、あいづちなど)に応じて各モジュールを即時に制御する統合システムの開発が狙いである。すでに、音声対話擬人化エージェントの共通基盤を作るプロジェクト(代表者:嵯峨山)により、国内主要大学研究室と共同で研究をすすめ、基本ソフトウェアを公開している。将来、このようなエージェントシステムは自動車運転における助手の役割や、各種の接客業務、教育訓練等に広く使われることが期待される。この研究室が持つこれらの技術に関する多くの研究実績およびノウハウを基に、企業との共同研究を希望している。
文字認識とヒューマンインタフェースの研究開発 この研究室では北陸先端大と共同で、オンライン手書き漢字認識技術を、長年培ってきた連続音声認識技術の応用により、新たな展開を行っている。文字構造辞書と隠れマルコフモデルを組み合わせた確率統計的アプローチによる高精度・高速・小記憶容量の文字認識、文字入力ヒューマンインタフェースの新しい展開、50万字を超える手書き文字データ収集などを行っている。この手法に関して、関心と意欲を持つ企業との共同研究を希望する。
音楽情報処理(楽譜化、和声づけなど)の研究開発 この研究室では、音楽に関連する情報処理を進めている。楽譜をコンピュータに投入したり、演奏された音楽を採譜して楽譜を得るなどのプロセスは現状では非常に煩瑣であるが、この研究室では、連続音声認識に関して長年培ってきた技術(アルゴリズム等)を応用して、MIDI(Music Instrument Digital Interface)楽器の演奏を精度良く楽譜に変換する手法を開拓した。また、自動編曲などの研究も進めている。この分野に関心を持つ企業に対してアルゴリズム面を中心としたサポートが可能である。