Desenvolvimento do Módulo de Pre-processamento da ferramenta SentimentALL
. Os sistemas que utilizam em seu processo de análise a linguagem natural (por exemplo, sistemas que analisam comentários de sites, reviews de filmes, posts em redes sociais etc.) geralmente usam técnicas relacionadas ao Processamento de Linguagem Natural (PLN). Neste artigo, serão apresentadas as etapas de PLN utilizadas no desenvolvimento do Módulo de Pré-Processamento da Ferramenta SentimentALL, que tem como propósito realizar análises de textos que emitem opiniões sobre produtos. O módulo foi desenvolvido para ser usado em qualquer contexto, mas neste trabalho foi utilizado na análise dos comentários extraídos do site de turismo TripAdvisor. O módulo é composto das etapas de normalização, correção ortográfica, pos-tagging e identificação de expressões compostas. Para a sua implementação, foi utilizada a biblioteca NLTK, da linguagem de Programação Python.