Enhancing quality and accuracy of speech recognition system by using multimodal audio-visual speech signal

2016 12th International Computer Engineering Conference (ICENCO) ◽

10.1109/icenco.2016.7856472 ◽

2016 ◽

Author(s):

Eslam E. El Maghraby ◽

Amr M. Gody ◽

M. Hesham Farouk

Keyword(s):

Speech Recognition ◽

Speech Signal ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System

Download Full-text

Enhancement Quality and Accuracy of Speech Recognition System Using Multimodal Audio-Visual Speech signal

The Egyptian Journal of Language Engineering ◽

10.21608/ejle.2017.59430 ◽

2017 ◽

Vol 4 (2) ◽

pp. 27-40

Author(s):

Eslam Elmaghraby ◽

Amr Gody ◽

Mohamed Farouk

Keyword(s):

Speech Recognition ◽

Speech Signal ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System

Download Full-text

Lips detection for audio-visual speech recognition system

2008 International Symposium on Intelligent Signal Processing and Communications Systems ◽

10.1109/ispacs.2009.4806689 ◽

2009 ◽

Author(s):

Siew Wen Chin ◽

Li-Minn Ang ◽

Kah Phooi Seng

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Visual Speech Recognition

Download Full-text

Audio-only backoff in audio-visual speech recognition system

The Journal of the Acoustical Society of America ◽

10.1121/1.3155497 ◽

2009 ◽

Vol 125 (6) ◽

pp. 4109

Author(s):

Jonathan H. Connell

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Visual Speech Recognition

Download Full-text

Lip-based visual speech recognition system

2015 International Carnahan Conference on Security Technology (ICCST) ◽

10.1109/ccst.2015.7389703 ◽

2015 ◽

Author(s):

Aufaclav Zatu Kusuma Frisky ◽

Chien-Yao Wang ◽

Andri Santoso ◽

Jia-Ching Wang

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Visual Speech Recognition

Download Full-text

Listening with Your Eyes: Towards a Practical Visual Speech Recognition System Using Deep Boltzmann Machines

2015 IEEE International Conference on Computer Vision (ICCV) ◽

10.1109/iccv.2015.26 ◽

2015 ◽

Author(s):

Chao Sui ◽

Mohammed Bennamoun ◽

Roberto Togneri

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Boltzmann Machines ◽

Visual Speech Recognition ◽

Deep Boltzmann Machines

Download Full-text

Development of audio-visual speech recognition system

ScienceRise ◽

10.15587/2313-8416.2017.118212 ◽

2017 ◽

Vol 12 (1) ◽

pp. 42-47

Author(s):

Alexandr Gornostal ◽

Yaroslaw Dorogyy

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Visual Speech Recognition

Download Full-text

Audio-Visual Speech Recognition System for Robots Based on Two-Layered Audio-Visual Integration Framework

Journal of the Robotics Society of Japan ◽

10.7210/jrsj.28.970 ◽

2010 ◽

Vol 28 (8) ◽

pp. 970-977

Author(s):

Takami Yoshida ◽

Kazuhiro Nakadai ◽

Hiroshi G. Okuno

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Integration Framework ◽

Visual Integration ◽

Visual Speech Recognition

Download Full-text

Lip Movement Synthesis In Audio-Visual Speech Recognition System

2005 International Conference on Natural Language Processing and Knowledge Engineering ◽

10.1109/nlpke.2005.1598781 ◽

2006 ◽

Author(s):

Junquan Li ◽

Yixin Yin

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Visual Speech Recognition ◽

Download Full-text

Voice-Based Speaker Identification and Verification

Advances in Library and Information Science - Handbook of Research on Knowledge and Organization Systems in Library and Information Science ◽

10.4018/978-1-7998-7258-0.ch016 ◽

2021 ◽

pp. 288-316

Author(s):

Keshav Sinha ◽

Rasha Subhi Hameed ◽

Partha Paul ◽

Karan Pratap Singh

Keyword(s):

Speech Recognition ◽

Automatic Speech Recognition ◽

Speech Signal ◽

Reference Model ◽

Speaker Identification ◽

Recognition System ◽

Speech Recognition System ◽

Primary Focus ◽

Dynamic Time ◽

Dynamic Time Wrapping

In recent years, the advancement in voice-based authentication leads in the field of numerous forensic voice authentication technology. For verification, the speech reference model is collected from various open-source clusters. In this chapter, the primary focus is on automatic speech recognition (ASR) technique which stores and retrieves the data and processes them in a scalable manner. There are the various conventional techniques for speech recognition such as BWT, SVD, and MFCC, but for automatic speech recognition, the efficiency of these conventional recognition techniques degrade. So, to overcome this problem, the authors propose a speech recognition system using E-SVD, D3-MFCC, and dynamic time wrapping (DTW). The speech signal captures its important qualities while discarding the unimportant and distracting features using D3-MFCC.

Download Full-text

AN AUDIO-VISUAL SPEECH RECOGNITION SYSTEM FOR TESTING NEW AUDIO-VISUAL DATABASES

Proceedings of the First International Conference on Computer Vision Theory and Applications ◽

10.5220/0001369101920196 ◽

2006 ◽

Keyword(s):

Speech Recognition ◽

Recognition System ◽

Visual Speech ◽

Speech Recognition System ◽

Visual Speech Recognition ◽

Visual Databases

Download Full-text