外部資金 

文部科学省/学術振興会科学研究補助費

期間名称内容
2008.04

2011.03
基盤研究A 「数理モデルに基づく音楽信号と音楽情報の解析・認識・加工・生成の研究」
課題番号 20240017
  • 嵯峨山(代表)・小野・西本
  • 予算: 1050万(H20) + 940万(H21) + 890万(H22)
  • 本研究は、確率モデル化を中心に据えて音楽信号及び音楽情報の解析・認識・加工・生成に関する広汎な技術を開発するものである。特にpolyphonicな音楽(多声音楽)の自動採譜を中心技術として確立することを目標にし、その要素技術・周辺技術・応用技術を開発する。申請者の音声認識における長い経験と寄与をこの分野に生かす。常時十数名の大学院生がこの分野に取り組む。
    (a) 多重音解析技術:当グループが重点を置いてきた本問題を、新しい観点(NMF理論、音色、二次元フーリエ領域、調波分離など)からさらに追求する。
    (b) ステレオ音楽信号からの解析:当グループの音響信号処理技術に音楽信号モデルと音楽構造モデルを統合して自動採譜、音源分離、強調加工などを行う。
    (c) 音楽モデルの確立:音声認識における「言語モデル」に対応する「音楽モデル」を文法理論に基づく作曲理論の数理モデル化により確立し、自動採譜、自動編曲などで広汎に用いる。
    (d) 楽譜と演奏の精密な対応付けにより開かれる応用を開発:楽譜上で指定した音符加工、パート消去:楽器カラオケ自動作成、自動伴奏など。
    (e) 音楽検索技術:上記の音楽信号解析技術を音楽検索の問題へ積極的に応用する。
2006.04

2008.03
若手研究B 「音声の時間周波数領域スパース性に基づくブラインド音源分離の研究」
課題番号 18760303
  • 小野(単独)
  • スパース性に基づくブラインド音源分離は,マイクロフォンの数より多 くの音源信号を分離することができる枠組として近年注目を集めている が,実環境下においては残響や背景雑音等,種々の性能劣化要因がある。 本研究ではこれに対し,スパース性を最大化する最適フィルタバンクの 導入や,残響環境下での信頼度付音源定位等を具体的な解決策とし、よ り実用的な技術を確立することを目的とする。
2005.04

2007.03
萌芽研究 「複素スペクトル円心法(CSCC法)によるマイクロホンアレー信号処理に関する研究」
課題番号 17650045
  • 嵯峨山(代表)、西本
  • カーナビの音声認識、ハンズフリー電話機、会議の録音などにおいて、マイクロホンアレーを用いて雑音を抑圧し目的音声を強調する研究が盛んに行われている。本研究の目的は、このような用途での信号処理において、新しい着想に基づく手法(CSCC法)を確立することである。
2005.04

2008.03
若手研究B 「テレマティックス音声対話における安全性と快適性の評価に関する研究」
課題番号 17700173
  • 西本(単独)
  • 目的は、テレマティックス音声対話におけるドライバの操作負荷を定量化することである。これにより、マインド・ディストラクションを防ぐためのさまざまな手法が、どのようなドライバに対してどの程度効果的なのか、といった判断が可能となる。 このような定量的評価は、機器メーカーや業界団体がリファレンスモデルの標準化を行うための客観的な指針となる。
2005.04

2008.03
基盤研究B 「音楽解析・認識・生成のための多重音の信号処理と情報処理の研究」
課題番号 17300054
  • 嵯峨山(代表)、小野、西本、金子、de Cheveigne
  • 主に多重音(和音など)や同時並行(伴奏など)を含む音楽信号と音楽情報を扱うために、多重音信号、多重音構造、時間並行構造を持つ対象の信号処理および情報処理の技術を確立する。典型的な応用分野としては、音楽の自動採譜、自動編曲、音楽情報検索、音楽の加工がある。
2002.04

2004.03
基盤研究B 「連続音声認識手法を用いた音楽情報処理の研究」
課題番号 14380156
  • 嵯峨山(代表)、西本、de Cheveigne
  • 自動採譜、和声づけ、対位法などの音楽情報処理を、音声認識手法により解く
  • 和音を統計学習アルゴリズムによって解析
  • 確率モデルに基づく音声認識の手法が音楽情報処理にも適してい ることを立証するとともに、それにより新しい音楽情報処理の手法を確立する。
    • 時間構造の推定、テンポ・拍節・拍子推定: 確率モデル(隠れマルコフ モデル, HMM)に基づいて、(MIDIなどの)演奏から拍子、小節線位置、 テンポ変化を推定
    • 音響入力からの楽譜推定、調の推定: 確率モデルと信号処理を組み合わ せる手法により、音楽音響信号入力から自動MIDI変換
    • 自動和声づけ、調性推定と転調検出: 確率モデル(HMM)と統計的学習に より、与えられた旋律へ和声づけし、同時に楽曲の調性、転調などを最適に推定
2000.04

2003.03
萌芽的研究 「微分幾何学に基づく音声認識モデル適応法の研究」
課題番号 12878056
  • 嵯峨山(代表)、下平、中井
  • 音声認識の問題を幾何学的な思想で解決する
  • 話者適応、雑音適応などの問題を空間の微分的な変形と捉えるユニークな発想
2000.04

2003.03
基盤研究C 「時間構造共有化による状態遷移非同期型隠れマルコフモデルによる音声認識」
課題番号
  • 下平(代表)、嵯峨山、中井
  • HMMの状態遷移を非同期に扱う新しいHMM構造
  • 順序つき非同期遷移を実現する temporal tying 構造
  • 音素パターンの音素環境依存性がさらに特徴量に依存することを利用する高い効率のモデル
2000.04

2003.03
基盤研究C 「?」
課題番号
  • 中井(代表)
  • 韻律のモデル
1999.04

2002.03
基盤研究B 「連続音声認識手法を用いた走り書き・非目視手書き漢字認識の研究」
課題番号 11480074
  • 嵯峨山(代表)、下平、中井
  • 高度に発達した連続音声認識手法を文字認識に全面的に利用
  • 新しい文字入力のモダリティを提案

科学技術振興機構(旧・科学技術振興事業団)

期間名称内容
2005.10.01

2011.03.31
戦略的創造研究推進事業(CREST)
研究領域「デジタルメディア作品の制作を支援する基盤技術」(研究総括 原島博)
研究課題「時系列メディアのデザイン転写技術の開発」
  • 研究代表者 片寄 晴弘 (関西学院大学理工学部 教授)
  • 分担課題「数理的アプローチに基づく音楽デザイン転写」(嵯峨山、酒向)
  • 確率統計と学習理論に基づく数理的アプローチにより,音楽音響信号中の構成音の音高と音長を推定する技術を研究する.また,音楽の和声付けや伴奏自動生成において,事例中に内在する音楽デザインを転写する研究を行なう。
  • 2005 嵯峨山、酒向; 2006 嵯峨山、小野、西本、武田、亀岡; 2007 嵯峨山、小野、西本、Le Roux, 山本, 米林, Raczynski; 2008 ...; 2009 ...; 2010 ...
1999

2000.03
戦略的創造研究推進事業(CREST)
研究領域「脳を作る」
研究課題「聴覚の情景分析に基づく音声・音響処理システム」
  • 代表者:和歌山大学 河原英紀教授 1997-2000 ??
  • 分担課題「聴覚情景のオブジェクトレベルでの記述方法の研究」(嵯峨山) 1999-2000
  • 音楽からリズムを感じとる聴覚脳の機能を計算論的にモデル化

情報処理振興事業協会 (IPA)(現・独立行政法人 情報処理振興推進機構)

期間名称内容
2000.?

2003.03
2000年度 独創的情報処理技術育成事業
  • 「擬人化音声対話エージェント基本ソフトウェアの開発」
  • 2000〜2003年、当初総予算1億5000万円、 研究代表者:北陸先端大 嵯峨山茂樹。 その後、嵯峨山は東大に移り、またIPAのこの制度が廃止され、 最後の年は「重点領域情報技術開発事業」を適用。 結局、総額は約1億3000万円。
  • 音声認識、音声合成、顔画像生成、統合制御からなる
  • 成果はフリーソフトウェアとして配布中
  • 嵯峨山(研究代表者)、下平、西本、他に多数の大学、公共研究機関
1997.?

1999.03
1997年度 独創的情報処理技術育成事業
  • 「日本語ディクテーション基本ソフトウェアの開発」
  • 1997〜2000年、総予算1億5000万円、 研究代表者:奈良先端大 鹿野清宏教授
  • 成果はフリーソフトウェアとして配布中
  • VFSアルゴリズムによる話者適応(プログラムを納入)
  • MLLRアルゴリズムによる話者適応(プログラム作成済み)
  • 嵯峨山が分担者として参加

(財)石川県産業創出支援機構(ISICO)

期間名称内容
2000.6

2003.3
平成12年度 地域産学官連携豊かさ創造研究開発プロジェクト

共同研究/奨学寄付金

(詳細は未掲載)

主な相手先: NTT, Microsoft Research Asia, ユニバーサルロボット, 他 数社

メインページへ