scholarly journals Типологія задач машинного аналізу текстів у сучасній соціології

2021 ◽  
pp. 53-62
Author(s):  
Roman Kyrychenko

У статті розглянуто можливості використання сучасних методів обробки текстів для соціологічного аналізу. Основну увагу приділено трьом завданням, які наразі можна вирішити засобами обчислювального ана­лізу текстів: аналіз змістовної близькості, моделювання тем та сенти­мент-аналіз (аналіз тональностей). В останні роки методи обробки природної мови настільки прогресували, що це дає змогу соціологам автоматично фіксувати семантику текстів, порівнювати її в часі, групувати на підставі схожості. Також це уможливлює масштабування аналізу вели­ких масивів документів, що відкриває нову сторінку в розвитку контент-аналізу, за якої ми наближаємося до відмови від ручного кодування документів, а дослідники зможуть сконцентруватися на аналізі. Ми продемонстрували ці можливості на прикладі аналізу новин із ресурсу «Українська правда» за 2001–2020 рр. Методи, застосовані в статті, дали нам змогу повністю автоматизовано виявити, які семантичні зрушення щодо слів, пов’язаних із діяльністю правоохоронних органів, відбувалися під дією соціальних факторів протягом останніх двадцяти років. Також ми згрупували новини за основними темами повідомлень про поліцію в матеріалах видання й проаналізували, чи змінювалося ставлення до неї протягом його існування.

Sign in / Sign up

Export Citation Format

Share Document