Kameoka Laboratory, Graduate School of Information Science and Technology, The University of Tokyo

Please visit here for a more complete list of our publications.

2015年

Journal papers

Ryosuke Sugiura, Yutaka Kamamoto, Noboru Harada, Hirokazu Kameoka, Takehiro Moriya, "Resolution warped spectral representation for low-delay and low-bit-rate audio coder," IEEE/ACM Transactions on Audio Speech and Language Processing, vol. 23, issue 2, pp. 288-299, Feb. 2015. (to appear)

Conference papers

Hirokazu Kameoka, "Multi-resolution signal decomposition with time-domain spectrogram factorization," Accepted for publication in Proc. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2015), pp. 86-90, Apr. 2015. (PDF)
Tomohiko Nakamura, Hirokazu Kameoka, "Lp-norm non-negative matrix factorization and its application to singing voice enhancement," in Proc. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2015), pp. 2115-2119, Apr. 2015. (PDF)
Daichi Kitamura, Nobutaka Ono, Hiroshi Sawada, Hirokazu Kameoka, Hiroshi Saruwatari, "Efficient multichannel nonnegative matrix factorization exploiting rank-1 spatial model," in Proc. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2015), pp. 276-280, Apr. 2015.

Book chapters

Hirokazu Kameoka, "Probabilistic modeling of pitch contours towards prosody synthesis and conversion," in Speech Prosody in Speech Synthesis: Modeling and generation of prosody for high quality and flexible speech synthesis, K. Hirose, J. Tao (eds.), Springer-Verlag Berlin Heidelberg, 2015.

2014年

Journal papers

Hideyuki Tachibana, Hirokazu Kameoka, Nobutaka Ono, Shigeki Sagayama, "Harmonic/Percussive sound separation based on anisotropic smoothness of spectrograms," IEEE Transactions on Audio, Speech and Language Processing, vol. 22, no. 12, pp. 2059-2073, 2015.

Peer reviewed conference papers

Ryosuke Sugiura, Yutaka Kamamoto, Noboru Harada, Hirokazu Kameoka, Takehiro Moriya, "Golomb-Rice coding optimized via LPC for frequency domain audio coder," in Proc. of The 2nd IEEE Global Conference on Signal and Information Processing (GlobalSIP 2014), Dec. 2014. (PDF)
Takuya Higuchi, Hirokazu Kameoka, "Unified approach for underdetermined BSS, VAD, dereverberation and DOA estimation with multichannel factorial HMM," in Proc. of The 2nd IEEE Global Conference on Signal and Information Processing (GlobalSIP 2014), Dec. 2014. (PDF)
Daichi Kitamura, Hiroshi Saruwatari, Satoshi Nakamura, Yu Takahashi, Kazunobu Kondo, Hirokazu Kameoka, "Hybrid multichannel signal separation using supervised nonnegative matrix factorization with spectrogram restoration," in Proc. Asia Pacific Signal and Information Processing Association Annual Summit and Conference 2014 (APSIPA ASC 2014), Dec. 2014.
Hirokazu Kameoka, Norihiro Takamune, "Training restricted Boltzmann machines with auxiliary function approach," in Proc. The 24th IEEE International Workshop on Machine Learning for Signal Processing (MLSP2014), Sep. 2014. (PDF)
Norihiro Takamune, Hirokazu Kameoka, "Maximum reconstruction probability training of restricted Boltzmann machines with auxiliary function approach," in Proc. The 24th IEEE International Workshop on Machine Learning for Signal Processing (MLSP 2014), Sep. 2014. (PDF)
Takuya Higuchi, Hirokazu Kameoka, "Joint audio source separation and dereverberation based on multichannel factorial hidden Markov model," in Proc. The 24th IEEE International Workshop on Machine Learning for Signal Processing (MLSP 2014), Sep. 2014. (PDF)
Tomohiko Nakamura, Kotaro Shikata, Norihiro Takamune, Hirokazu Kameoka, "Harmonic-Temporal Factor Decomposition incorporating music prior information for informed monaural source separation," in Proc. The 15th International Society for Music Information Retrieval Conference (ISMIR 2014), Oct. 2014. (PDF)
Kento Kadowaki, Tatsuma Ishihara, Nobukatsu Hojo, Hirokazu Kameoka, "Speech prosody generation for text-to-speech synthesis based on generative model of F0 contours," in Proc. The 15th Annual Conference of the International Speech Communication Association (Interspeech 2014), pp. 2322-2326, Sep. 2014. (PDF)
Takuya Higuchi, Hirofumi Takeda, Tomohiko Nakamura, Hirokazu Kameoka, "A unified approach for underdetermined blind signal separation and source activity detection by multichannel factorial hidden Markov models," in Proc. The 15th Annual Conference of the International Speech Communication Association (Interspeech 2014), pp. 850-854, Sep. 2014. (PDF)
Ryosuke Sugiura, Yutaka Kamamoto, Noboru Harada, Hirokazu Kameoka, Takehiro Moriya, "Direct linear conversion of LSP parameters for perceptual control in speech and audio coding," in Proc. The 2014 European Signal Processing Conference (EUSIPCO 2014), TU-L03-2, Sep. 2014. (PDF)
Ryosuke Sugiura, Yutaka Kamamoto, Noboru Harada, Hirokazu Kameoka, Takehiro Moriya, "Representation of spectral envelope with warped frequency resolution for audio coder," in Proc. The 2014 European Signal Processing Conference (EUSIPCO 2014), Sep. 2014. (PDF)
Tomohiko Nakamura, Hirokazu Kameoka, "Fast signal reconstruction from magnitude spectrogram of continuous wavelet transform based on spectrogram consistency," Accepted for publication in Proc. the 17th International Conference on Digital Audio Effects (DAFx-14), pp. 129-135, Sep. 2014. (PDF)
Daichi Kitamura, Hiroshi Saruwatari, Satoshi Nakamura, Yu Takahashi, Kazunobu Kondo, Hirokazu Kameoka, "Divergence optimization in nonnegative matrix factorization with spectrogram restoration for multichannel signal separation," in Proc. The 4th Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA 2014), May 2014.
Takuya Higuchi, Norihiro Takamune, Tomohiko Nakamura, Hirokazu Kameoka, "Underdetermined blind separation and tracking of moving sources based on DOA-HMM, Accepted for publication in Proc. 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp. 3215-3219, 2014. (PDF)
Yasunori Ohishi, Daichi Mochihashi, Hirokazu Kameoka, Kunio Kashino, "Mixture of Gaussian process experts for predicting sung melodic contour with expressive dynamic fluctuations," in Proc. 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp. 3742-3746, 2014. (PDF)
Masahiro Nakano, Yasunori Ohishi, Hirokazu Kameoka, Ryo Mukai, Kunio Kashino, "Mondrian hidden Markov model for music signal processing, in Proc. 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp. 2424-2428, 2014. (PDF)
Tomohiko Nakamura, Hirokazu Kameoka, Kazuyoshi Yoshii, Masataka Goto, "Timbre replacementof harmonic and drum components for music audio signals," in Proc. 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp. 7520-7524, 2014. (PDF)

2013年

Journal papers

Hirokazu Kameoka, Misa Sato, Takuma Ono, Nobutaka Ono, Shigeki Sagayama, "Bayesian nonparametric approach to blind separation of infinitely many sparse sources," IEICE Transactions on Fundamentals of Electronics, Vol.E96-A, No.10, pp. 1928-1937, Oct. 2013.

Peer reviewed conference papers

Masato Tsuchiya, Kazuki Ochiai, Hirokazu Kameoka, Shigeki Sagayama, "Probabilistic model of two-dimensional rhythm tree structure representation for automatic transcription of polyphonic MIDI signals," in Proc. The 2013 Asia Pacific Signal and Information Processing Association (APSIPA) Annual Summit and Conference (APSIPA-ASC 2013), Oct. 2013.
Nobukatsu Hojo, Kota Yoshizato, Hirokazu Kameoka, Daisuke Saito, Shigeki Sagayama, "Text-to-speech synthesizer based on combination of composite wavelet and hidden Markov models," in Proc. The 8th ISCA Speech Synthesis Workshop (SSW8), pp. 129-134, Aug. 2013. (論文)
Hirokazu Kameoka, Kota Yoshizato, Tatsuma Ishihara, Yasunori Ohishi, Kunio Kashino, Shigeki Sagayama, "Generative modeling of speech F0 contours," in Proc. The 14th Annual Conference of the International Speech Communication Association (Interspeech 2013), pp. 1826-1830, Aug. 2013. (論文)
Tatsuma Ishihara, Hirokazu Kameoka, Kota Yoshizato, Daisuke Saito, Shigeki Sagayama, "Probabilistic speech F0 contour model incorporating statistical vocabulary model of phrase-accent command sequence," in Proc. The 14th Annual Conference of the International Speech Communication Association (Interspeech 2013), pp. 1017-1021, Aug. 2013.