data mining tool
Recently Published Documents


TOTAL DOCUMENTS

178
(FIVE YEARS 37)

H-INDEX

16
(FIVE YEARS 1)

Author(s):  
Serhii Fokin

У статті представлено результати експерименту зі впорядкування електронного тезаурусу перекладознавчих термінів, що підготовлено у рамках практичних занять з перекладної комп’ютерної лексикографії і термінографії. Тезаурус поповнюється термінами з галузі перекладознавства українською, іспанською і португальською мовами. Потреба в упорядкуванні тезарусу продиктована значною невпорядкованістю перекладознавчої термінології, відсутністю дефініції для використовуваних термінів або ж суттєвими розбіжностями між наявними дефініціями. Тезарус дозволяє добувати такі парадигматичні характеристики терміна: гіперонім, гіпонім, меронім, голонім, причина, наслідок, характеризація та інші. З-поміж синтагматичних характеристик терміна у тезаурусі надаються прикметникові і дієслівні колокації. Перші можуть пролити світло на якісні характеристики явища/предмета, позначуваного терміном; другі здатні охарактеризувати дії, виконувані предметом або ж дії, впливу яких зазнає цей предмет. Отже, семантична парадигма терміна ґрунтується переважно на його зв’язках з іншими термінами; частково парадигматичні відношення можуть бути виведені з його синтагматичних характеристик: прикметникові колокації терміна закономірно вказують на його гіпоніми. Характеризація терміна за вказаними характеристиками (зокрема, гіперонім, а також інші суттєві семи: причина, наслідок, меронім, голонім та інші) можуть бути використані для розробки дефініції терміна за інтенсіоналом.  На підставі зв’язків між тезарурсними статтями можуть генеруватися нові знання, зокрема, завдяки транзитивності більшості тезаурусних функцій можуть автоматично створюватися ланцюги тезаурусних зв’язків; завдяки інверсійному пошуку можна знаходити не лише статті, в якій вихідний термін зазначено у лемі, а й його вживання у глосі й відповідні семантичні зв’язки з іншими термінами.


2021 ◽  
Author(s):  
S Rajath ◽  
Amit Kumar ◽  
Mayank Agarwal ◽  
Sanjana Shekar ◽  
VR Badri Prasad

2021 ◽  
Author(s):  
Narciso F. Sousa ◽  
Flavius L. Gorgônio ◽  
Huliane M. Silva

A necessidade de transformar dados em informação e informação em conhecimento, impulsionou o surgimento da área de mineração de dados, cujo objetivo é fornecer técnicas de interpretação de grandes volumes de dados. Embora as atuais ferramentas computacionais de análise e processamento de informação possam analisar imensos volumes de dados em questões de segundos, aplicações do mundo real costumam ser bem mais complexas e possuir bases de dados muito mais desafiadoras do que as comumente apresentadas na literatura. Este trabalho apresenta um estudo comparativo entre algoritmos de agrupamento de dados a partir de bases de dados da FCPS (Fundamental Clustering Problem Suite) e da ferramenta YADMT (Yet Another Data Mining Tool), que simulam variadas situações presentes em problemas do mundo real. Os algoritmos escolhidos nesta pesquisa foram: colônia de formigas, k-means, mapas auto-organizáveis e métodos hierárquicos. Para avaliação dos mesmos foram utilizados a Medida F, o Índice R e a Variância Intra-Grupos.


Small Methods ◽  
2021 ◽  
Vol 5 (9) ◽  
pp. 2170040
Author(s):  
Fengsheng Li ◽  
Jia Song ◽  
Yingkun Zhang ◽  
Shuaikang Wang ◽  
Jinhui Wang ◽  
...  

Small Methods ◽  
2021 ◽  
pp. 2100206
Author(s):  
Fengsheng Li ◽  
Jia Song ◽  
Yingkun Zhang ◽  
Shuaikang Wang ◽  
Jinhui Wang ◽  
...  

2021 ◽  
Vol 23 (1) ◽  
pp. 16-19
Author(s):  
Anna L. Shparberg

The Google Books Ngram Viewer is a data mining tool that searches datasets derived from Google Books to generate frequency charts of language usage from the dawn of print until the present time. The available languages are English, French, German, Hebrew, Italian, Spanish, Chinese, and Russian. With a database in excess of two trillion words, it is the largest corpus of linguistics information in existence. In spite of concerns about the reliability of metadata used in Ngram Viewer, it is still viewed as a valuable resource for research into long-term cultural trends.


Sign in / Sign up

Export Citation Format

Share Document