Reconocimiento del habla mediante el uso de la correlación cruzada y una perceptrón multicapa

En el presente artículo se da a conocer una alternativa algorítimica a los sistemas actuales de reconocimiento automático del habla (ASR), mediante una propuesta en la forma de realizar la caracterización de las palabras basada en una aproximación que usa la extracción de coeficientes de la codificación de predicción lineal (LPC) y la correlación cruzada. La implementación consiste en extraer las características fonéticas mediante los coeficientes LPC, después se forman vectores de patrones de la pronunciación conformados por el promedio de los coeficientes LPC de las muestras de las palabras obteniendo un vector característico de cada pronunciación mediante la autocorrelación de las secuencias de coeficientes LPC; estos vectores se utilizan para entrenar un clasificador de tipo perceptrón multicapa (MLP). Se realizaron pruebas de desempeño previo entrenamiento con los diferentes patrones de las palabras a reconocer. Se utilizó la fonética de los dígitos del cero al nueve como vocabulario objetivo, debido a su amplia aplicación, y para estimar el desempeño de este método se utilizaron dos corpus de pronunciaciones: el corpus UPA, que contempla en su base de datos la pronuncación de la región occidente de México, y el corpus Tlatoa, que hace lo propio para la región centro de México. Las señales en ambos corpus fueron adquiridas en el lenguaje español, y a una frecuencia de muestreo de 8kHz. Los porcentajes de reconocimiento obtenidos fueron del 96.7 y 93.3% para las modalidades de mono-locutor para el corpus UPA y múltiple-locutor para el corpus Tlatoa, respectivamente. Asimismo, se realizó una comparación contra dos métodos clásicos del reconocimiento de voz y del habla, Dynamic Time Warping (DTW) y Hidden Markov Models (HMM).

Download Full-text

Gesture Recognition on Kinect Time Series Data Using Dynamic Time Warping and Hidden Markov Models

2016 18th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing (SYNASC) ◽

10.1109/synasc.2016.049 ◽

2016 ◽

Cited By ~ 6

Author(s):

Alina Delia Calin

Keyword(s):

Time Series ◽

Hidden Markov Models ◽

Gesture Recognition ◽

Dynamic Time Warping ◽

Time Series Data ◽

Markov Models ◽

Hidden Markov ◽

Series Data ◽

Time Warping ◽

Dynamic Time

Download Full-text

Combination of hidden Markov models with dynamic time warping for speech recognition

2004 IEEE International Conference on Acoustics, Speech, and Signal Processing ◽

10.1109/icassp.2004.1325950 ◽

2004 ◽

Cited By ~ 16

Author(s):

S. Axelrod ◽

B. Maison

Keyword(s):

Speech Recognition ◽

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Dynamic Time

Download Full-text

Other Measures for Face Recognition

10.2174/9781681080444115010011 ◽

2015 ◽

pp. 81-92

Keyword(s):

Face Recognition ◽

Hidden Markov Models ◽

Dynamic Time Warping ◽

Edit Distance ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Shape Comparison ◽

3D Data ◽

Dynamic Time

Other measures are employed to compute similarity between faces. Although some of them are very popular, such as edit distance or turning function distance, they may be more frequently used for object, vectors or shape comparison and less for faces. This paragraph collects all these measures and the works in which they are used for face recognition. Among them, Dynamic Time Warping (DTW), Hidden Markov Models (HMM), and Fréchet distance have been applied to 3D data.

Download Full-text

Automated recognition of bird song elements from continuous recordings using dynamic time warping and hidden Markov models: A comparative study

The Journal of the Acoustical Society of America ◽

10.1121/1.421364 ◽

1998 ◽

Vol 103 (4) ◽

pp. 2185-2196 ◽

Cited By ~ 170

Author(s):

Joseph A. Kogan ◽

Daniel Margoliash

Keyword(s):

Comparative Study ◽

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Bird Song ◽

Time Warping ◽

Automated Recognition ◽

Dynamic Time

Download Full-text

Isolated Malay Digit Recognition Using Pattern Recognition Fusion of Dynamic Time Warping and Hidden Markov Models

American Journal of Applied Sciences ◽

10.3844/ajassp.2008.714.720 ◽

2008 ◽

Vol 5 (6) ◽

pp. 714-720 ◽

Cited By ~ 16

Author(s):

S.A.R. Al-Haddad ◽

S.A. Samad ◽

A. Hussain ◽

K.A. Ishak

Keyword(s):

Pattern Recognition ◽

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Digit Recognition ◽

Dynamic Time

Download Full-text

Speaker recognition using hidden Markov models, dynamic time warping and vector quantisation

IEE Proceedings - Vision Image and Signal Processing ◽

10.1049/ip-vis:19952144 ◽

1995 ◽

Vol 142 (5) ◽

pp. 313 ◽

Cited By ~ 37

Author(s):

K. Yu

Keyword(s):

Hidden Markov Models ◽

Speaker Recognition ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Vector Quantisation ◽

Dynamic Time

Download Full-text

The Geometrical Based Lip-Reading Techniques of Multi-Dimensional Dynamic Time Warping MDTW and Hidden Markov Models HMMs in the Audio Visual Speech Recognition

International Journal of Advanced Trends in Computer Science and Engineering ◽

10.30534/ijatcse/2020/68912020 ◽

2020 ◽

Vol 9 (1) ◽

pp. 496-504

Author(s):

Muhammad Ismail Mohmand

Keyword(s):

Speech Recognition ◽

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Visual Speech ◽

Time Warping ◽

Visual Speech Recognition ◽

Lip Reading ◽

Dynamic Time

Download Full-text

Automated bird songs recognition using dynamic time warping and hidden Markov models

The Journal of the Acoustical Society of America ◽

10.1121/1.420820 ◽

1997 ◽

Vol 102 (5) ◽

pp. 3176-3176 ◽

Cited By ~ 2

Author(s):

Joseph A. Kogan ◽

Daniel Margoliash

Keyword(s):

Hidden Markov Models ◽

Dynamic Time Warping ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Bird Songs ◽

Dynamic Time

Download Full-text

Literacy by Way of Automatic Speech Recognition

Intelligent Information Technologies ◽

10.4018/978-1-59904-941-0.ch121 ◽

2011 ◽

pp. 2074-2118

Author(s):

Russell Gluck ◽

John Fulcher

Keyword(s):

Neural Networks ◽

Speech Recognition ◽

Automatic Speech Recognition ◽

Markov Models ◽

Hidden Markov ◽

Time Warping ◽

Oral Storytelling ◽

Pattern Recognition Techniques ◽

Dynamic Time ◽

Over Time

The chapter commences with an overview of automatic speech recognition (ASR), which covers not only the de facto standard approach of hidden Markov models (HMMs), but also the tried-and-proven techniques of dynamic time warping and artificial neural networks (ANNs). The coverage then switches to Gluck’s (2004) draw-talk-write (DTW) process, developed over the past two decades to assist non-text literate people become gradually literate over time through telling and/or drawing their own stories. DTW has proved especially effective with “illiterate” people from strong oral, storytelling traditions. The chapter concludes by relating attempts to date in automating the DTW process using ANN-based pattern recognition techniques on an Apple Macintosh G4™ platform.

Download Full-text

Surgical data processing for smart intraoperative assistance systems

Innovative Surgical Sciences ◽

10.1515/iss-2017-0035 ◽

2017 ◽

Vol 2 (3) ◽

pp. 145-152 ◽

Cited By ~ 7

Author(s):

Ralf Stauder ◽

Daniel Ostler ◽

Thomas Vogel ◽

Dirk Wilhelm ◽

Sebastian Koller ◽

...

Keyword(s):

Neural Networks ◽

Dynamic Time Warping ◽

Data Science ◽

Markov Models ◽

Context Aware ◽

Time Warping ◽

Surgical Assistance ◽

Surgical Data ◽

Assistance Systems ◽

Dynamic Time

AbstractDifferent components of the newly defined field of surgical data science have been under research at our groups for more than a decade now. In this paper, we describe our sensor-driven approaches to workflow recognition without the need for explicit models, and our current aim is to apply this knowledge to enable context-aware surgical assistance systems, such as a unified surgical display and robotic assistance systems. The methods we evaluated over time include dynamic time warping, hidden Markov models, random forests, and recently deep neural networks, specifically convolutional neural networks.

Download Full-text