A probabilistic principal component analysis based hidden Markov model for audio-visual speech recognition

Informasi sinyal suara yang dikenali memiliki karakteristik yang unik. Dengan adanya keunikan pada sinyal suara dapat diimplementasikan untuk melakukan identifikasi suara pada bidang kesehatan yang difungsikan sebagai pengenalan suara pada tunawicara. Dimana pada pengembangannya aplikasi mampu untuk membantu pembelajaran pada tunawicara. Metode yang dapat melakukan ekstraksi ciri suara salah satunya adalah metode Principal Component Analsis. Metode Principal Component Analysis bekerja dengan melakukan ekstraksi ciri suara dan pengelompokan pada pola suara. Suara yang direkam melalui proses pre-processing audio sebelum dikelompokan menggunakan Principal Component Analysis untuk mendapatkan nilai koefisien suara. Hasil dari nilai koefisien disimpan sebagai sinyal referensi dan digunakan pada proses pencocokan sinyal suara menggunakan algoritma Hidden Markov Model. Sistem diuji sebanyak 3 sesi pengujian oleh 14 orang penguji. Berdasarkan hasil pengujian diketahui bahwa sistem yang dibangun mencapai tingkat akurasi 85% dari 3 sesi pengujian oleh 14 orang penguji.

Download Full-text

Hidden Markov Model Combined with Kernel Principal Component Analysis for Nonlinear Multimode Process Fault Detection

2019 IEEE 15th International Conference on Automation Science and Engineering (CASE) ◽

10.1109/coase.2019.8843205 ◽

2019 ◽

Author(s):

Peng Peng ◽

Jiaxin Zhao ◽

Yi Zhang ◽

Heming Zhang

Keyword(s):

Principal Component Analysis ◽

Fault Detection ◽

Markov Model ◽

Hidden Markov Model ◽

Hidden Markov ◽

Principal Component ◽

Component Analysis ◽

Kernel Principal Component Analysis

Download Full-text

Hidden Markov Model Based Visemes Recognition, Part I

Visual Speech Recognition ◽

10.4018/978-1-60566-186-5.ch011 ◽

2009 ◽

pp. 326-355

Author(s):

Say Wei Foo ◽

Liang Donga

Keyword(s):

Speech Recognition ◽

Markov Model ◽

Hidden Markov Model ◽

Hidden Markov ◽

Speech Sound ◽

Experimental Results ◽

Visual Speech ◽

Basic Unit ◽

Visual Speech Recognition ◽

Visual Domain

Visual speech recognition is able to supplement the information of speech sound to improve the accuracy of speech recognition. A viseme, which describes the facial and oral movements that occur alongside the voicing of a particular phoneme, is a supposed basic unit of speech in the visual domain. As in phonemes, there are variations for the same viseme expressed by different persons or even by the same person. A classifier must be robust to this kind of variation. In this chapter, the author’s describe the Adaptively Boosted (AdaBoost) Hidden Markov Model (HMM) technique (Foo, 2004; Foo, 2003; Dong, 2002). By applying the AdaBoost technique to HMM modeling, a multi-HMM classifier that improves the robustness of HMM is obtained. The method is applied to identify context-independent and contextdependent visual speech units. Experimental results indicate that higher recognition accuracy can be attained using the AdaBoost HMM than that using conventional HMM.

Download Full-text