Time-frequency masking for large scale robust speech recognition

Mapping Intimacies ◽

10.21437/interspeech.2015-533 ◽

2015 ◽

Author(s):

Yuxuan Wang ◽

Ananya Misra ◽

Kean K. Chin

Keyword(s):

Speech Recognition ◽

Large Scale ◽

Robust Speech Recognition ◽

Download Full-text

Time–Frequency Correlation-Based Missing-Feature Reconstruction for Robust Speech Recognition in Band-Restricted Conditions

IEEE Transactions on Audio Speech and Language Processing ◽

10.1109/tasl.2009.2015080 ◽

2009 ◽

Vol 17 (7) ◽

pp. 1292-1304 ◽

Author(s):

Wooil Kim ◽

J.H.L. Hansen

Keyword(s):

Speech Recognition ◽

Robust Speech Recognition ◽

Frequency Correlation ◽

Time Frequency ◽

Missing Feature ◽

Feature Reconstruction

Download Full-text

On time-frequency mask estimation for MVDR beamforming with application in robust speech recognition

2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ◽

10.1109/icassp.2017.7952756 ◽

2017 ◽

Author(s):

Xiong Xiao ◽

Shengkui Zhao ◽

Douglas L. Jones ◽

Eng Siong Chng ◽

Haizhou Li

Keyword(s):

Speech Recognition ◽

Robust Speech Recognition ◽

Time Frequency ◽

Mask Estimation ◽

Mvdr Beamforming

Download Full-text

On binary and ratio time-frequency masks for robust speech recognition

10.21437/interspeech.2004-689 ◽

2004 ◽

Author(s):

Soundararajan Srinivasan ◽

Nicoleta Roman ◽

DeLiang Wang

Keyword(s):

Speech Recognition ◽

Robust Speech Recognition ◽

Download Full-text

Binary and ratio time-frequency masks for robust speech recognition

Speech Communication ◽

10.1016/j.specom.2006.09.003 ◽

2006 ◽

Vol 48 (11) ◽

pp. 1486-1501 ◽

Author(s):

Soundararajan Srinivasan ◽

Nicoleta Roman ◽

DeLiang Wang

Keyword(s):

Speech Recognition ◽

Robust Speech Recognition ◽

Download Full-text

Enhanced Running Spectrum Analysis for Robust Speech Recognition Under Adverse Conditions: A Case Study on Japanese Speech

ECTI Transactions on Computer and Information Technology (ECTI-CIT) ◽

10.37936/ecti-cit.2017111.81945 ◽

2017 ◽

Vol 11 (1) ◽

pp. 82-90

Author(s):

George Mufungulwa ◽

Hiroshi Tsutsui ◽

Yoshikazu Miyanaga ◽

Shin-ichi Abe

Keyword(s):

Speech Recognition ◽

Spectrum Analysis ◽

High Accuracy ◽

Point Of View ◽

Robust Speech Recognition ◽

Modulation Spectrum ◽

Time Frequency ◽

Adverse Conditions ◽

Running Spectrum Analysis

In any real environment, noises degrade the performance of Automatic Speech Recognition (ASR) systems. Additionally, in the case of similar pronunciations, it is not easy to realize a high accuracy of recognition. From this point of view, our work envisions an enhanced algorithm processing a speech modulation spectrum, such as Running Spectrum Analysis (RSA). It was also adequately applied to observed speech data. In the envisioned method, a modulation spectrum filtering (MSF) method directly modified the observed cepstral modulation spectrum by a Fourier transform of the cepstral time frequency. The method and experiments carried out for various passbands had favorable results that showed an improvement of about 1-4 % in recognition accuracycompared to conventional methods.

Download Full-text

Time-Frequency Masking: Linking Blind Source Separation and Robust Speech Recognition

Speech Recognition ◽

10.5772/6382 ◽

2008 ◽

Author(s):

Marco Khne ◽

Roberto Togneri ◽

Sven Nordholm

Keyword(s):

Speech Recognition ◽

Blind Source Separation ◽

Source Separation ◽

Robust Speech Recognition ◽

Download Full-text

Time-frequency convolutional networks for robust speech recognition

2015 IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU) ◽

10.1109/asru.2015.7404811 ◽

2015 ◽

Author(s):

Vikramjit Mitra ◽

Horacio Franco

Keyword(s):

Speech Recognition ◽

Robust Speech Recognition ◽

Time Frequency ◽

Convolutional Networks

Download Full-text

Time-frequency correlation based missing-feature reconstruction for robust speech recognition in background noise conditions

2009 Conference Record of the Forty-Third Asilomar Conference on Signals, Systems and Computers ◽

10.1109/acssc.2009.5470200 ◽

2009 ◽

Author(s):

Wooil Kim ◽

John H.L. Hansen

Keyword(s):

Speech Recognition ◽

Background Noise ◽

Robust Speech Recognition ◽

Frequency Correlation ◽

Time Frequency ◽

Missing Feature ◽

Feature Reconstruction

Download Full-text

Generation of Large-Scale Simulated Utterances in Virtual Rooms to Train Deep-Neural Networks for Far-Field Speech Recognition in Google Home

10.21437/interspeech.2017-1510 ◽

2017 ◽

Author(s):

Chanwoo Kim ◽

Ananya Misra ◽

Kean Chin ◽

Thad Hughes ◽

Arun Narayanan ◽

...

Keyword(s):

Neural Networks ◽

Speech Recognition ◽

Large Scale ◽

Deep Neural Networks ◽

Download Full-text

Exploring Low-Dimensional Structures of Modulation Spectra for Robust Speech Recognition

10.21437/interspeech.2017-611 ◽

2017 ◽

Author(s):

Bi-Cheng Yan ◽

Chin-Hong Shih ◽

Shih-Hung Liu ◽

Berlin Chen

Keyword(s):

Speech Recognition ◽

Robust Speech Recognition ◽

Low Dimensional

Download Full-text