Visual speech recognition: a solution from feature extraction to words classification

16th Brazilian Symposium on Computer Graphics and Image Processing (SIBGRAPI 2003) ◽

10.1109/sibgra.2003.1241036 ◽

2004 ◽

Author(s):

L.G. Da Silveira ◽

J. Facon ◽

D.L. Borges

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Visual Speech ◽

Visual Speech Recognition

Download Full-text

Comparison between different feature extraction techniques for audio-visual speech recognition

Journal on Multimodal User Interfaces ◽

10.1007/bf02884428 ◽

2007 ◽

Vol 1 (1) ◽

pp. 7-20 ◽

Author(s):

Alin G. Chiţu ◽

Leon J. M. Rothkrantz ◽

Pascal Wiggers ◽

Jacek C. Wojdel

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Visual Speech ◽

Extraction Techniques ◽

Visual Speech Recognition

Download Full-text

Feature extraction using multimodal convolutional neural networks for visual speech recognition

2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ◽

10.1109/icassp.2017.7952701 ◽

2017 ◽

Author(s):

Eric Tatulli ◽

Thomas Hueber

Keyword(s):

Neural Networks ◽

Feature Extraction ◽

Speech Recognition ◽

Convolutional Neural Networks ◽

Visual Speech ◽

Visual Speech Recognition

Download Full-text

CNN Based Feature Extraction for Visual Speech Recognition in Malayalam

10.1007/978-981-16-6285-0_1 ◽

2021 ◽

pp. 1-8

Author(s):

Shabina Bhaskar ◽

T. M. Thasleema

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Visual Speech ◽

Visual Speech Recognition

Download Full-text

A cascade gray-stereo visual feature extraction method for visual and audio-visual speech recognition

Speech Communication ◽

10.1016/j.specom.2017.01.005 ◽

2017 ◽

Vol 90 ◽

pp. 26-38 ◽

Author(s):

Chao Sui ◽

Roberto Togneri ◽

Mohammed Bennamoun

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Extraction Method ◽

Visual Speech ◽

Visual Feature ◽

Feature Extraction Method ◽

Visual Speech Recognition ◽

Visual Feature Extraction

Download Full-text

Study of different feature extraction method for visual speech recognition

2021 International Conference on Computer Communication and Informatics (ICCCI) ◽

10.1109/iccci50826.2021.9402357 ◽

2021 ◽

Author(s):

Saswati Debnath ◽

Pinki Roy ◽

Vijin Justin ◽

Shradha Naik

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Extraction Method ◽

Visual Speech ◽

Feature Extraction Method ◽

Visual Speech Recognition

Download Full-text

A hybrid visual feature extraction method for audio-visual speech recognition

2009 16th IEEE International Conference on Image Processing (ICIP) ◽

10.1109/icip.2009.5413573 ◽

2009 ◽

Author(s):

Guanyong Wu ◽

Jie Zhu ◽

Haihua Xu

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Extraction Method ◽

Visual Speech ◽

Visual Feature ◽

Feature Extraction Method ◽

Visual Speech Recognition ◽

Visual Feature Extraction

Download Full-text

Visual Speech Recognition with Lightweight Psychologically Motivated Gabor Features

Entropy ◽

10.3390/e22121367 ◽

2020 ◽

Vol 22 (12) ◽

pp. 1367

Author(s):

Xuejie Zhang ◽

Yan Xu ◽

Andrew K. Abel ◽

Leslie S. Smith ◽

Roger Watt ◽

...

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Recognition Rate ◽

Psychological Research ◽

Visual Speech ◽

Visual Speech Recognition ◽

Gabor Features ◽

Image Patches ◽

Low Dimensionality ◽

Extraction of relevant lip features is of continuing interest in the visual speech domain. Using end-to-end feature extraction can produce good results, but at the cost of the results being difficult for humans to comprehend and relate to. We present a new, lightweight feature extraction approach, motivated by human-centric glimpse-based psychological research into facial barcodes, and demonstrate that these simple, easy to extract 3D geometric features (produced using Gabor-based image patches), can successfully be used for speech recognition with LSTM-based machine learning. This approach can successfully extract low dimensionality lip parameters with a minimum of processing. One key difference between using these Gabor-based features and using other features such as traditional DCT, or the current fashion for CNN features is that these are human-centric features that can be visualised and analysed by humans. This means that it is easier to explain and visualise the results. They can also be used for reliable speech recognition, as demonstrated using the Grid corpus. Results for overlapping speakers using our lightweight system gave a recognition rate of over 82%, which compares well to less explainable features in the literature.

Download Full-text

Automatic visual feature extraction for Mandarin audio-visual speech recognition

2009 IEEE International Conference on Systems, Man and Cybernetics ◽

10.1109/icsmc.2009.5346011 ◽

2009 ◽

Author(s):

Tsang-Long Pao ◽

Wen-Yuan Liao ◽

Tsan-Nung Wu ◽

Ching-Yi Lin

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Visual Speech ◽

Visual Feature ◽

Visual Speech Recognition ◽

Visual Feature Extraction

Download Full-text

Robust Visual Lips Feature Extraction Method for Improved Visual Speech Recognition System

Engineering and Technology Journal ◽

10.30684/etj.36.2a.4 ◽

2018 ◽

Vol 36 (2) ◽

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Extraction Method ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Feature Extraction Method ◽

Visual Speech Recognition

Download Full-text

Lip feature extraction and reduction for HMM-based visual speech recognition systems

2008 9th International Conference on Signal Processing ◽

10.1109/icosp.2008.4697195 ◽

2008 ◽

Author(s):

S. Alizadeh ◽

R. Boostani ◽

V. Asadpour

Keyword(s):

Feature Extraction ◽

Speech Recognition ◽

Visual Speech ◽

Visual Speech Recognition ◽

Recognition Systems

Download Full-text