Diferentes análises estatísticas podem levar a conclusões categoricamente distintas
[PORTUGUESE ABSTRACT] Neste estudo, demonstramos como significância estatística pode variar a partir da comparação de quatro métodos distintos: teste t, ANOVA (seguida de Tukey HSD), modelo linear simples, e modelo linear de efeitos mistos. Em nossa demonstração, modelamos tempos de reação em função de diferentes afixos em dinamarquês, e mostramos como nossas conclusões a respeito do efeito de certos afixos podem mudar categoricamente dependendo de qual dos métodos mencionados acima decidimos utilizar. Por fim, reiteramos o que dizem estudos recentes, e sugerimos que modelos de efeitos mistos devam ser a norma sempre que dados agrupados forem analisados. Esperamos, com este estudo, alertar pesquisadores da área para a importância de decisões analíticas bem informadas e éticas em estudos linguísticos.[ENGLISH ABSTRACT] In this study, we illustrate the potential variability of statistical significance by comparing four different methods, namely, t-test, ANOVA (followed by Tukey HSD), simple linear regression, and mixed effects linear regression. In our demonstration, we model reaction times as a function of different affixes in Danish, and show how our conclusions regarding the effect of certain affixes can change categorically depending on which of the aforementioned methods we choose to use. Finally, we echo recent studies and suggest that mixed effects models be the norm whenever grouped data is analyzed. With our comparison, we hope to raise researchers’ awareness to the need for well-informed and ethical analytical decisions in linguistic studies.