期間 | 名称 | 内容
|
---|
2008.04 | 2011.03 | 基盤研究A
「数理モデルに基づく音楽信号と音楽情報の解析・認識・加工・生成の研究」
課題番号 20240017
|
- 嵯峨山(代表)・小野・西本
- 予算: 1050万(H20) + 940万(H21) + 890万(H22)
- 本研究は、確率モデル化を中心に据えて音楽信号及び音楽情報の解析・認識・加工・生成に関する広汎な技術を開発するものである。特にpolyphonicな音楽(多声音楽)の自動採譜を中心技術として確立することを目標にし、その要素技術・周辺技術・応用技術を開発する。申請者の音声認識における長い経験と寄与をこの分野に生かす。常時十数名の大学院生がこの分野に取り組む。
(a) 多重音解析技術:当グループが重点を置いてきた本問題を、新しい観点(NMF理論、音色、二次元フーリエ領域、調波分離など)からさらに追求する。
(b) ステレオ音楽信号からの解析:当グループの音響信号処理技術に音楽信号モデルと音楽構造モデルを統合して自動採譜、音源分離、強調加工などを行う。
(c) 音楽モデルの確立:音声認識における「言語モデル」に対応する「音楽モデル」を文法理論に基づく作曲理論の数理モデル化により確立し、自動採譜、自動編曲などで広汎に用いる。
(d) 楽譜と演奏の精密な対応付けにより開かれる応用を開発:楽譜上で指定した音符加工、パート消去:楽器カラオケ自動作成、自動伴奏など。
(e) 音楽検索技術:上記の音楽信号解析技術を音楽検索の問題へ積極的に応用する。
|
2006.04 | 2008.03 | 若手研究B
「音声の時間周波数領域スパース性に基づくブラインド音源分離の研究」
課題番号 18760303
|
- 小野(単独)
- スパース性に基づくブラインド音源分離は,マイクロフォンの数より多
くの音源信号を分離することができる枠組として近年注目を集めている
が,実環境下においては残響や背景雑音等,種々の性能劣化要因がある。
本研究ではこれに対し,スパース性を最大化する最適フィルタバンクの
導入や,残響環境下での信頼度付音源定位等を具体的な解決策とし、よ
り実用的な技術を確立することを目的とする。
|
2005.04 | 2007.03 | 萌芽研究
「複素スペクトル円心法(CSCC法)によるマイクロホンアレー信号処理に関する研究」
課題番号 17650045
|
- 嵯峨山(代表)、西本
- カーナビの音声認識、ハンズフリー電話機、会議の録音などにおいて、マイクロホンアレーを用いて雑音を抑圧し目的音声を強調する研究が盛んに行われている。本研究の目的は、このような用途での信号処理において、新しい着想に基づく手法(CSCC法)を確立することである。
|
2005.04 | 2008.03 | 若手研究B
「テレマティックス音声対話における安全性と快適性の評価に関する研究」
課題番号 17700173
|
- 西本(単独)
- 目的は、テレマティックス音声対話におけるドライバの操作負荷を定量化することである。これにより、マインド・ディストラクションを防ぐためのさまざまな手法が、どのようなドライバに対してどの程度効果的なのか、といった判断が可能となる。
このような定量的評価は、機器メーカーや業界団体がリファレンスモデルの標準化を行うための客観的な指針となる。
|
2005.04 | 2008.03 | 基盤研究B
「音楽解析・認識・生成のための多重音の信号処理と情報処理の研究」
課題番号 17300054
|
- 嵯峨山(代表)、小野、西本、金子、de Cheveigne
- 主に多重音(和音など)や同時並行(伴奏など)を含む音楽信号と音楽情報を扱うために、多重音信号、多重音構造、時間並行構造を持つ対象の信号処理および情報処理の技術を確立する。典型的な応用分野としては、音楽の自動採譜、自動編曲、音楽情報検索、音楽の加工がある。
|
2002.04 | 2004.03 | 基盤研究B
「連続音声認識手法を用いた音楽情報処理の研究」
課題番号 14380156
|
- 嵯峨山(代表)、西本、de Cheveigne
- 自動採譜、和声づけ、対位法などの音楽情報処理を、音声認識手法により解く
- 和音を統計学習アルゴリズムによって解析
- 確率モデルに基づく音声認識の手法が音楽情報処理にも適してい
ることを立証するとともに、それにより新しい音楽情報処理の手法を確立する。
- 時間構造の推定、テンポ・拍節・拍子推定: 確率モデル(隠れマルコフ
モデル, HMM)に基づいて、(MIDIなどの)演奏から拍子、小節線位置、
テンポ変化を推定
- 音響入力からの楽譜推定、調の推定: 確率モデルと信号処理を組み合わ
せる手法により、音楽音響信号入力から自動MIDI変換
- 自動和声づけ、調性推定と転調検出: 確率モデル(HMM)と統計的学習に
より、与えられた旋律へ和声づけし、同時に楽曲の調性、転調などを最適に推定
|
2000.04 | 2003.03 | 萌芽的研究
「微分幾何学に基づく音声認識モデル適応法の研究」
課題番号 12878056
|
- 嵯峨山(代表)、下平、中井
- 音声認識の問題を幾何学的な思想で解決する
- 話者適応、雑音適応などの問題を空間の微分的な変形と捉えるユニークな発想
|
---|
2000.04 | 2003.03 | 基盤研究C
「時間構造共有化による状態遷移非同期型隠れマルコフモデルによる音声認識」
課題番号
|
- 下平(代表)、嵯峨山、中井
- HMMの状態遷移を非同期に扱う新しいHMM構造
- 順序つき非同期遷移を実現する temporal tying 構造
- 音素パターンの音素環境依存性がさらに特徴量に依存することを利用する高い効率のモデル
|
2000.04 | 2003.03 | 基盤研究C
「?」
課題番号
| |
1999.04 | 2002.03 | 基盤研究B
「連続音声認識手法を用いた走り書き・非目視手書き漢字認識の研究」
課題番号 11480074
|
- 嵯峨山(代表)、下平、中井
- 高度に発達した連続音声認識手法を文字認識に全面的に利用
- 新しい文字入力のモダリティを提案
|