A machine learning approach to literary genre classification on Portuguese texts: circumventing NLP’s standard varieties
Keyword(s):
Avaliamos e classificamos quali-quantitativamente gêneros literários do corpus BDCamões. Crônicas, romances, histórias curtas e contos, anotados em UD, são classificados por florestas aleatórias, e analisados com base na versão português-brasileira do LIWC. Os resultados por classe são reportados pela média, juntamente com uma medida de desvio padrão. Os resultados das características por classe, rótulos LIWC, classes gramaticais e rótulos UD destacam características positivas altas e negativas baixas. A adaptação desta metodologia à fluidez e mutabilidade dos gêneros literários contorna as dificuldade normalemnet encontradas em NLP, apresentando consistência e poucos erros nos resultados.
2008 ◽
Vol 14
(3)
◽
pp. 7-18
◽
2012 ◽
pp. 124-138
2008 ◽
Vol 14
(3)
◽
pp. 7-18
◽
Keyword(s):
2013 ◽
Vol 133
(6)
◽
pp. 1259-1268
Keyword(s):
2014 ◽
Vol 9
(12)
◽
pp. 1956
Keyword(s):