Gibbs entropy simulated annealing based Edman firefly optimization for big data protein sequencing

Author(s):  
B. Kalaiselvi ◽  
M. Thangamani
2021 ◽  
Vol 2021 ◽  
pp. 1-9
Author(s):  
Lei Zhang ◽  
Qixiang Zhong ◽  
Zhenglun Yu

With the development of medical informatization, the data related to medical field are growing at an amazing speed, and medical big data appears. The mining and analysis of these data plays an important role in the prediction, monitoring, diagnosis, and treatment of tumor diseases. Therefore, this paper proposes a clustering algorithm of the high-order simulated annealing neural network algorithm and uses this algorithm to extract tumor disease-related big data, constructs training set according to the relevant information mined, designs a kind of dimension reduction model, aiming at the problem of excessive and wrong diagnosis and treatment in the diagnosis and treatment module of tumor disease monitoring mode, and establishes the corresponding control mechanism, so as to optimize the tumor disease monitoring mode. The results show that the clustering accuracy of the high-order simulated annealing neural network algorithm on different data sets (iris, wine, and Pima India diabetes) is 97.33%, 82.11%, and 70.56% and the execution time is 0.75 s, 0.562 s, and 1.092 s, which are better than those of the fast k-medoids algorithm and improved k-medoids clustering algorithm. To sum up, the high-order simulated annealing neural network algorithm can achieve good clustering effect in medical big data mining. The establishment of model M1 can reduce the probability of excessive and wrong medical treatment and improve the effectiveness of diagnosis and treatment module monitoring in tumor disease monitoring mode.


2017 ◽  
Author(s):  
Ευαγγελία Χονδροδήμα

Η υπολογιστική νοημοσύνη (computational intelligence, CI) αποτελεί έναν κλάδο της τεχνητής νοημοσύνης που βασίζεται στη μίμηση στοιχείων ευφυΐας που παρατηρούνται στα έμβια όντα και προσφέρει τεχνικές ικανές να επιλύουν πολύπλοκα προβλήματα που δεν θα μπορούσαν να επιλυθούν με συμβατικές μεθοδολογίες. Το αντικείμενο της παρούσας διδακτορικής διατριβής είναι η ανάπτυξη νέων αλγορίθμων που εντάσσονται στο πεδίο της υπολογιστικής νοημοσύνης, και παρουσιάζουν τη δυνατότητα χειρισμού αριθμητικών, κατηγορικών και μικτών μεταβλητών, παρέχοντας βελτιωμένες ικανότητες πρόβλεψης σε σχέση με συμβατικές μεθοδολογίες. Οι τεχνικές που ανήκουν στον κλάδο της υπολογιστικής νοημοσύνης και αποτελούν βασικά εργαλεία της παρούσας διατριβής είναι τα νευρωνικά δίκτυα ακτινικής συνάρτησης βάσης (radial basis function, RBF), η τεχνική εξελικτικής προσομοιωμένης ανόπτησης (evolutionary simulated annealing, ESA) και ο αλγόριθμος βελτιστοποίησης σμήνους σωματιδίων (particle swarm optimization, PSO). Σε ότι αφορά στον χειρισμό αριθμητικών εισόδων, στα πλαίσια της παρούσας διατριβής αναπτύχθηκαν 3 νέοι αλγόριθμοι εκπαίδευσης νευρωνικών δικτύων RBF, οι οποίοι επιτυγχάνουν την πλήρη βελτιστοποίηση των τελευταίων, με ταυτόχρονο προσδιορισμό όλων των παραμέτρων τους. Ο πρώτος αλγόριθμος που αναπτύχθηκε, ονομάστηκε PSO-NSFM και βασίζεται στον μη συμμετρικό αλγόριθμο των ασαφών μέσων (non symmetric fuzzy means, NSFM), ο οποίος ενισχύεται με έναν μηχανισμό βελτιστοποίησης PSO, προκειμένου να βελτιστοποιηθεί η ασαφής διαμέριση του χώρου εισόδου. Ο αλγόριθμος PSO-NSFM παράγει μοντέλα RBF που παρουσιάζουν απλούστερες δομές και ταυτόχρονα μεγαλύτερη ακρίβεια πρόβλεψης σε μικρότερους υπολογιστικούς χρόνους, έναντι καθιερωμένων τεχνικών μηχανικής μάθησης. Ο δεύτερος αλγόριθμος που αναπτύχθηκε για χειρισμό αριθμητικών εισόδων ονομάστηκε COOP-VW και βελτιστοποιεί την κατασκευή δικτύων RBF που εκπαιδεύονται με τον αλγόριθμο NSFM, με βάση ένα συνεργατικό πλαίσιο PSO (cooperative PSO, CPSO). Ο αλγόριθμος COOP-VW επιτρέπει τη χρήση συναρτήσεων βάσης μεταβλητού εύρους, που αυξάνουν την ευελιξία των παραγόμενων μοντέλων, με αποτέλεσμα την περαιτέρω αύξηση της ακρίβειας πρόβλεψης, αλλά με σχετικά μικρή αύξηση του υπολογιστικού κόστους σε σχέση με την τεχνική PSO-NSFM. Ο τρίτος αλγόριθμος που αναπτύχθηκε ονομάστηκε ESA-NSFM και προσαρμόζει την τεχνική ESA με στόχο τη βελτιστοποίηση των μοντέλων RBF που παράγονται από τον αλγόριθμο NSFM. O αλγόριθμος ESA-NSFM παράγει μοντέλα δικτύων RBF, τα οποία παρουσιάζουν αυξημένη ακρίβεια πρόβλεψης σε σχέση με τις καθιερωμένες τεχνικές μηχανικής μάθησης, και ταυτόχρονα εύκολη επιλογή λειτουργικών παραμέτρων. Χρησιμοποιώντας αλγόριθμους όπως αυτοί που αναφέρθηκαν προηγουμένως, η βασική δομή των δικτύων RBF είναι σε θέση να χειριστεί με μεγάλη επιτυχία αριθμητικά δεδομένα εισόδου, ωστόσο εμφανίζει προβλήματα στον χειρισμό κατηγορικών ή μικτών δεδομένων. Προκειμένου να επιλυθεί αυτό το πρόβλημα, στα πλαίσια αυτής της διδακτορικής διατριβής αναπτύχθηκαν δύο νέες αρχιτεκτονικές νευρωνικών δικτύων. Η πρώτη από αυτές, ονομάστηκε CRBF και αποτελεί επέκταση των δικτυών RBF, δίνοντας στα τελευταία τη δυνατότητα χειρισμού κατηγορικών δεδομένων. Αυτό επιτυγχάνεται χρησιμοποιώντας κατηγορικές πλειάδες ως κέντρα RBF, ενώ παράλληλα προτείνεται και ο αλγόριθμος categorical center selection (CCS) για την εκπαίδευση αυτών των δικτύων. Ο αλγόριθμος αυτός είναι ιδιαίτερα απλός και παρουσιάζει μεγάλη ταχύτητα εκτέλεσης, καθώς χρησιμοποιεί μόνο ένα πέρασμα των δεδομένων. Η δεύτερη αρχιτεκτονική νευρωνικών δικτύων που αναπτύχθηκε ονομάστηκε MRBF και έχει την ικανότητα να χειρίζεται μικτά δεδομένα. Τα δίκτυα MRBF ουσιαστικά αποτελούν συνδυασμό των δικτύων RBF και CRBF, και εκπαιδεύονται με μία νέα μεθοδολογία η οποία βασίζεται στον αλγόριθμο των ασαφών μέσων και στην τεχνική CCS. Τα δίκτυα MRBF, λόγω της ικανότητας τους να λαμβάνουν υπόψη ξεχωριστά τη φύση των αριθμητικών και των κατηγορικών δεδομένων, μπορούν να δώσουν λύσεις με αυξημένη ακρίβεια πρόβλεψης σε σχέση με μεθοδολογίες που είναι εγγενώς φτιαγμένες για έναν μόνο τύπο δεδομένων, ενώ, λόγω του απλού και γρήγορου αλγορίθμου εκπαίδευσης που χρησιμοποιούν, ενδείκνυνται για εφαρμογή σε σύνολα δεδομένων μεγάλου όγκου (big data). Όλες οι μέθοδοι που προαναφέρθηκαν, αξιολογήθηκαν σε ένα μεγάλο πλήθος συνόλων δεδομένων τύπου benchmark, που προέρχονται από ποικίλα επιστημονικά πεδία, και περιλαμβάνουν προβλήματα προσέγγισης συνάρτησης και ταξινόμησης. Τα αποτελέσματα και οι συγκρίσεις με ένα ευρύ φάσμα μεθόδων μηχανικής μάθησης, που περιλαμβάνουν διαφορετικές μεθόδους νευρωνικών δικτύων, μηχανές διανυσμάτων υποστήριξης (support vector machines, SVMs), ταξινομητές Bayes, δέντρα αποφάσεων, ταξινομητές τυχαίων δασών (random forest trees), κ.α., καταδεικνύουν την αποτελεσματικότητα των προτεινόμενων αλγορίθμων. Επιπλέον, σε ότι αφορά στο επίπεδο της εφαρμογής, στα πλαίσια της παρούσας διατριβής, αναπτύχθηκε ένα νέο ευφυές σύστημα με την ικανότητα αυτόματης ταξινόμησης ιστοσελίδων με βάση το περιεχόμενό τους, το οποίο αποτελεί ένα εργαλείο γενικής χρήσης για την ταξινόμηση ιστοσελίδων με ικανοποιητική ακρίβεια και μπορεί για παράδειγμα να ταξινομήσει μία ιστοσελίδα ανάλογα με τη λειτουργία της, το είδος της, τη θεματική περιοχή της, κ.α. Το σύστημα αυτό ονομάστηκε MRBF-WPC και υιοθετεί τα νευρωνικά δίκτυα MRBF και στοιχεία από τον κλάδο της εξόρυξης γνώσης στον ιστό. Η εφαρμογή του συστήματος σε ένα ευρέως χρησιμοποιούμενο σύνολο ιστοσελίδων και η σύγκριση με άλλες μεθόδους, έδειξε ότι το σύστημα παρέχει αυξημένη ακρίβεια πρόβλεψης ως προς την ταξινόμηση των ιστοσελίδων. Έτσι, το σύστημα MRBF-WPC είναι ένα ολοκληρωμένο εργαλείο που μπορεί να χρησιμοποιηθεί ως βάση για τον εμπλουτισμό του περιεχομένου του ιστού με μεταδεδομένα, και άρα για την εξέλιξη του παγκόσμιου ιστού σε σημασιολογικό ιστό.


ASHA Leader ◽  
2013 ◽  
Vol 18 (2) ◽  
pp. 59-59
Keyword(s):  

Find Out About 'Big Data' to Track Outcomes


Sign in / Sign up

Export Citation Format

Share Document