Lexicon-free and context-free drug names identification methods using hidden markov models and pointwise mutual information

Author(s):  
Jacek MaByszko ◽  
Agata Filipowska
Author(s):  
Cinthia O. A. Freitas ◽  
Flávio Bortolozzi ◽  
Robert Sabourin

Este artigo descreve uma metodologia para seleção de classes de símbolos a partir de classesde grafemas em um sistema de reconhecimento de palavras manuscritas do extenso de cheques bancáriosbrasileiros baseado em HMM (Hidden Markov Models). Este artigo discute as definições de primitivas,grafemas e símbolos considerando um enfoque Global para o reconhecimento das palavras, o qual evita asegmentação das palavras em letras ou pseudo-letras utilizando HMM. Assim, a entrada para os modelosconsiste em uma descrição da palavra a partir de um alfabeto de símbolos gerados a partir dos grafemasextraídos das imagens das palavras, sendo esta a representação visível para o HMM. Portanto, a idéia éintroduzir uma conceituação de alto nível, tais como primitivas perceptivas (laços, ascendentes,descendentes, concavidades e convexidades) e fornecer um modo de retro-alimentação rápido e informativosobre a informação contida em cada classe de grafema, permitindo uma seleção de classes de símbolos. Oartigo apresenta o algoritmo com base na Informação Mútua (Mutual Information) e HMM, ambostrabalhando em um mesmo processo de avaliação. Os resultados experimentais demonstram que é possívelselecionar a partir de um conjunto “original” de grafemas (composto por 94 grafemas) um alfabeto desímbolos (composto por 29 símbolos). O artigo conclui que o poder discriminante dos grafemas é muitoimportante para a consolidação de um alfabeto de símbolos.


2010 ◽  
Vol 34 (5-6) ◽  
pp. 328-333 ◽  
Author(s):  
Daniel Reker ◽  
Stefan Katzenbeisser ◽  
Kay Hamacher

Sign in / Sign up

Export Citation Format

Share Document