scholarly journals Utilização de Modelos Computacionais Baseados em Classificadores Para Predição da Dislexia em Crianças

Author(s):  
Ronieri Nogueira de Sousa ◽  
Roney Nogueira de Sousa ◽  
Rhyan Ximenes de Brito ◽  
Janaide Nogueira de Sousa Ximenes

A dislexia é uma das dificuldades de aprendizagem mais comum nas salas de aula. Dessa forma o estudo teve como finalidade a classificação de crianças com ou sem dislexia através da aplicação de técnicas de Inteligência Computacional (IC). Para a metodologia utilizou-se de uma base de dados pública e da aplicação das arquiteturas neurais, Multilayer Perceptron (MLP), Radial Basis Function (RBF) e Extreme Learning Machine (ELM) e dos classificadores estatísticos, Support Vector Machine (SVM), Random Forest (RF) e K-Nearest Neighbors (K-NN), assim como das técnicas k-fold, SMOTE e normalização z-score. Os resultados demonstraram que o classificador SVM obteve a melhor taxa média de acerto com 98,03% de acurácia.

2021 ◽  
Vol 12 (3) ◽  
pp. 31-38
Author(s):  
Michelle Tais Garcia Furuya ◽  
Danielle Elis Garcia Furuya

The e-mail service is one of the main tools used today and is an example that technology facilitates the exchange of information. On the other hand, one of the biggest obstacles faced by e-mail services is spam, the name given to the unsolicited message received by a user. The machine learning application has been gaining prominence in recent years as an alternative for efficient identification of spam. In this area, different algorithms can be evaluated to identify which one has the best performance. The aim of the study is to identify the ability of machine learning algorithms to correctly classify e-mails and also to identify which algorithm obtained the greatest accuracy. The database used was taken from the Kaggle platform and the data were processed bythe Orange software with four algorithms: Random Forest (RF), K-Nearest Neighbors (KNN), Support Vector Machine (SVM) and Naive Bayes (NB). The division of data in training and testing considers 80% of the data for training and 20% for testing. The results show that Random Forest was the best performing algorithm with 99% accuracy.


2018 ◽  
Author(s):  
Wylken S. Machado ◽  
Pedro H. Barros ◽  
Eliana S. Almeida ◽  
Andre L. L. Aquino

Neste trabalho apresentamos a avaliação do desempenho de algoritmos de machine learning para identificar Atividades de Vida Diária (ADLs) e quedas. Nós avaliamos os seguintes algoritmos: K-Nearest Neighbors, Naive Bayes, Support Vector Machine, Decision Tree, Random Forest, Extra-Trees e Redes Neurais Recorrentes. Utilizamos um conjunto de dados coletados por uma Body Sensor Networks com cinco dispositivos sensores conectados através da interface Bluetooth Low Energy, chamado UMAFall. Obtivemos resultados satisfatórios, principalmente para as atividades saltar e queda frontal, com 100 % de acurácia, utilizando o algoritmo Extra-Trees.


2020 ◽  
Author(s):  
Laércio Mesquita ◽  
Antônio De C. Filho ◽  
Alcilene De Sousa ◽  
Patrícia Drumond

Os sistemas CADx têm ganhado cada vez mais atenção devido sua importância na área médica, tornando o diagnóstico por parte dos especialistas mais preciso. Para criação dessas ferramentas são utilizados métodos computacionais, processamento digital de imagens e conhecimentos sobre a doença. Neste trabalho utilizam-se índices de diversidade filogenética para extração de características baseada na textura. Tais índices são utilizados como características para os classificadores: Support Vector Machine, Random Forest, Random Basis Function e MultiLayer Perceptron identificando em tecidos de mamografias a presença de massa e não massa, perfazendo assim parte de um Computer-Aided Diagnosis. Para validação da metodologia, foram utilizadas 200 imagens de mamografia, onde 100 contêm massa e as demais não massa. Os resultados mostram-se promissores, pois os melhores resultados alcançam uma acurácia de 91,5%, sensibilidade de 89,5%, especificidade de 94% e uma taxa de falsos positivos de 0,085 por exame.


2017 ◽  
Author(s):  
Ιωάννης Τσιμπερίδης

Αντικείμενο μελέτης της παρούσας Διδακτορικής Διατριβής είναι η ανάπτυξη μίας μεθόδου με την οποία θα αποκαλύπτεται μέρος της ταυτότητας ενός ατόμου που συνδιαλέγεται μέσω Διαδικτύου. Η ανωνυμία πίσω από την οποία μπορεί να κρυφτεί ένας χρήστης, αυξάνει το βαθμό ασφάλειας για τη μη διαρροή προσωπικών ή και ευαίσθητων δεδομένων του. Ωστόσο, όταν αυτή η ανωνυμία χρησιμοποιείται ως παραπέτασμα συγκάλυψης παράνομης δραστηριότητας, τότε γίνεται επιτακτικό να προστατευθούν οι ανυποψίαστοι χρήστες από κακόβουλες επιθέσεις που θέτουν σε κίνδυνο την ασφάλεια που σχετίζεται με προσωπικά, κοινωνικά και οικονομικά θέματα.Αν και έχουν προταθεί διάφοροι τρόποι για να επιτευχθεί κάτι τέτοιο, ο καθένας τους παρουσιάζει από μία τουλάχιστον αδυναμία που τον καθιστά μη κατάλληλο για γενίκευση. Αντίθετα, στην παρούσα έρευνα, όλα τα απαραίτητα δεδομένα προέρχονται από τους χρόνους συμβάντων που λαμβάνουν χώρα επί του πληκτρολογίου. Τα σημαντικότερα πλεονεκτήματα της προτεινόμενης μεθόδου είναι πρώτον ότι μελετάται η συμπεριφορά του χρήστη κατά την πληκτρολόγηση κειμένου, που αποτελεί το κύριο μέσο επικοινωνίας χρηστών στο Διαδίκτυο. Δεύτερον, ότι όλη η έρευνα διεξήχθη βασισμένη στο πληκτρολόγιο QWERTY, που είναι η επικρατέστερη διάταξη πληκτρολογίου και συναντάται κατά το πλείστον τόσο στις «παραδοσιακές» συσκευές διασύνδεσης χρηστών (desktops και laptops), όσο και στις πιο «σύγχρονες» (tablets και smartphones), όπου έχει τη μορφή πληκτρολογίου οθόνης. Και τρίτον, ότι οι παράμετροι που χρησιμοποιούνται για την επίτευξη των στόχων δεν σχετίζονται με κάποια συγκεκριμένη γλώσσα, αφού έχουν να κάνουν με το πώς πληκτρολογεί ένας χρήστης και όχι με το τι πληκτρολογεί. Συνέπεια όλων αυτών είναι η προτεινόμενη μέθοδος να δύναται να χρησιμοποιηθεί καθολικά, αφού αφορά το κύριο μέσο επικοινωνίας χρηστών, την κύρια συσκευή σύνταξης κειμένου και είναι ανεξάρτητη γλώσσας πληκτρολόγησης.Το πεδίο της επιστήμης των υπολογιστών που ασχολείται με τη μελέτη των χρόνων των συμβάντων επί του πληκτρολογίου, ονομάζεται δυναμική της πληκτρολόγησης (keystroke dynamics) και έχει χρησιμοποιηθεί σχεδόν αποκλειστικά για την αυθεντικοποίηση χρηστών. Οι παράμετροι της δυναμικής της πληκτρολόγησης που μπορούν να αξιοποιηθούν για την εξαγωγή ενός αποτελέσματος είναι πάρα πολλές σε αριθμό, κάθε μία όμως από αυτές περικλείει μικρή ποσότητα πληροφορίας. Σε αυτή την έρευνα, η δυναμική της πληκτρολόγησης χρησιμοποιήθηκε για την κατηγοριοποίηση των χρηστών βάσει κάποιων χαρακτηριστικών τους και οι παράμετροι που εκμεταλλεύτηκαν ήταν οι διάρκειες πατήματος πλήκτρου (keystroke durations) και οι λανθάνοντες χρόνοι διγράμματος (digram latencies).Με σκοπό την επιτυχή πρόβλεψη των χαρακτηριστικών ενός άγνωστου χρήστη, ώστε να αποκαλυφθεί μέρος της ταυτότητάς του, δημιουργήθηκαν συστήματα που δέχονται δεδομένα προερχόμενα από τον τρόπο πληκτρολόγησής του και εξάγουν ένα αποτέλεσμα κατάταξής του σε μία κατηγορία. Τα συστήματα αυτά βασίστηκαν σε ταξινομητές (classifiers), η επιλογή των οποίων έγινε κατά περίπτωση με κριτήρια το ποσοστό ορθής πρόβλεψης, την ταχύτητα λειτουργίας και την σταθερότητα στην απόδοση. Συγκεκριμένα χρησιμοποιήθηκαν ταξινομητές Bayesian, Ευκλείδειας απόστασης, απόστασης Manhattan, μηχανής διανυσμάτων υποστήριξης (support vector machine, SVM), πολυστρωματικού perceptron (multilayer perceptron, MLP) και νευρωνικού δικτύου συνάρτησης ακτινωτής βάσης (radial basis function network, RBFN).Τα απαραίτητα για τη μελέτη δεδομένα λήφθηκαν με δύο τρόπους. Πρώτον, ζητώντας από ομάδες εθελοντών να καταγραφούν κατά τη διάρκεια πληκτρολόγησης δοσμένου κειμένου, δηλαδή με καταγραφή καθορισμένου κειμένου (fixed text). Δεύτερον, ζητώντας από εθελοντές να καταγραφούν κατά την καθημερινή χρήση των υπολογιστών τους, δηλαδή με καταγραφή ελεύθερου κειμένου (free text). Με τα δεδομένα του καθορισμένου κειμένου ακολουθήθηκε μια διαδικασία, που χαρακτηρίστηκε ως πρώτο στάδιο της έρευνας, κατά την οποία μελετήθηκε η κατηγοριοποίηση χρηστών βάσει της συσκευής όπου πληκτρολογούν και βάσει του φύλου τους. Με τα δεδομένα του ελεύθερου κειμένου ακολουθήθηκε αντιστοίχως μια άλλη διαδικασία, που χαρακτηρίστηκε ως δεύτερο στάδιο της έρευνας, κατά την οποία μελετήθηκε η κατηγοριοποίηση χρηστών βάσει της προτίμησης χεριού τους, βάσει της ηλικιακής τους ομάδας, βάσει του μορφωτικού τους επιπέδου και βάσει της ημερήσιας χρήσης υπολογιστή.Τα αποτελέσματα δείχνουν πως η κατηγοριοποίηση χρηστών δια μέσω της δυναμικής της πληκτρολόγησης, είναι εφικτή. Τα ποσοστά ορθής πρόβλεψης κρίνονται ικανοποιητικά και εξάγονται χρήσιμα συμπεράσματα για τη συνέχιση της έρευνας προς αυτή την κατεύθυνση.


Sign in / Sign up

Export Citation Format

Share Document