Decision Fusion for Isolated Malay Digit Recognition Using Dynamic Time Warping (DTW) and Hidden Markov Model (HMM)

Now every day's speech recognition is utilized broadly in numerous packages. In software program engineering and electric constructing, speech recognition (SR) is the interpretation of verbally expressed words into textual content. it's miles otherwise referred to as "computerized speech recognition" (CSR), "pc speech reputation", or most effective "speech to text" (STT). A hid Markov model (HMM) is a measurable Markov model wherein the framework being verified is notion to be a Markov process with in mystery (shrouded) states. A HMM may be introduced as the least hard dynamic Bayesian system. Dynamic time warping (DTW) is a truly understood strategy to locate a really perfect arrangement among two given (time-subordinate) groupings underneath sure confinements instinctively; the groupings are distorted in a nonlinear manner to coordinate each other. ANN is non-immediately statistics driven self-versatile methodology. it can distinguish and research co-related examples between information dataset and evaluating target esteems. Within the wake of preparing ANN may be utilized to anticipate the end result of new unfastened facts.

Download Full-text

Isolated Malay Digit Recognition Using Pattern Recognition Fusion of Dynamic Time Warping and Hidden Markov Models

American Journal of Applied Sciences ◽

10.3844/ajassp.2008.714.720 ◽

2008 ◽

Vol 5 (6) ◽

pp. 714-720 ◽

Cited By ~ 16

Author(s):

S.A.R. Al-Haddad ◽

S.A. Samad ◽

A. Hussain ◽

K.A. Ishak

Keyword(s):

Pattern Recognition ◽

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Digit Recognition ◽

Dynamic Time

Download Full-text

Realization of Hidden Markov Model for English Digit Recognition

International Journal of Computer Applications ◽

10.5120/17278-7713 ◽

2014 ◽

Vol 98 (17) ◽

pp. 37-40

Author(s):

Ganesh SPawar ◽

Sunil S Morade

Keyword(s):

Markov Model ◽

Hidden Markov Model ◽

Hidden Markov ◽

Digit Recognition

Download Full-text

Application of dynamic time warping to connected digit recognition

IEEE Transactions on Acoustics Speech and Signal Processing ◽

10.1109/tassp.1980.1163422 ◽

1980 ◽

Vol 28 (4) ◽

pp. 377-388 ◽

Cited By ~ 41

Author(s):

L. Rabiner ◽

C. Schmidt

Keyword(s):

Dynamic Time Warping ◽

Time Warping ◽

Digit Recognition ◽

Dynamic Time

Download Full-text

Reconocimiento del habla mediante el uso de la correlación cruzada y una perceptrón multicapa

Nova Scientia ◽

10.21640/ns.v6i12.26 ◽

2014 ◽

Vol 6 (12) ◽

pp. 108

Author(s):

Carlos A. De Luna-Ortega ◽

Miguel Mora-González ◽

Julio C. Martínez-Romo ◽

Francisco J. Luna-Rosas ◽

Jesús Muñoz-Maciel

Keyword(s):

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Dynamic Time

En el presente artículo se da a conocer una alternativa algorítimica a los sistemas actuales de reconocimiento automático del habla (ASR), mediante una propuesta en la forma de realizar la caracterización de las palabras basada en una aproximación que usa la extracción de coeficientes de la codificación de predicción lineal (LPC) y la correlación cruzada. La implementación consiste en extraer las características fonéticas mediante los coeficientes LPC, después se forman vectores de patrones de la pronunciación conformados por el promedio de los coeficientes LPC de las muestras de las palabras obteniendo un vector característico de cada pronunciación mediante la autocorrelación de las secuencias de coeficientes LPC; estos vectores se utilizan para entrenar un clasificador de tipo perceptrón multicapa (MLP). Se realizaron pruebas de desempeño previo entrenamiento con los diferentes patrones de las palabras a reconocer. Se utilizó la fonética de los dígitos del cero al nueve como vocabulario objetivo, debido a su amplia aplicación, y para estimar el desempeño de este método se utilizaron dos corpus de pronunciaciones: el corpus UPA, que contempla en su base de datos la pronuncación de la región occidente de México, y el corpus Tlatoa, que hace lo propio para la región centro de México. Las señales en ambos corpus fueron adquiridas en el lenguaje español, y a una frecuencia de muestreo de 8kHz. Los porcentajes de reconocimiento obtenidos fueron del 96.7 y 93.3% para las modalidades de mono-locutor para el corpus UPA y múltiple-locutor para el corpus Tlatoa, respectivamente. Asimismo, se realizó una comparación contra dos métodos clásicos del reconocimiento de voz y del habla, Dynamic Time Warping (DTW) y Hidden Markov Models (HMM).

Download Full-text