scholarly journals Εφαρμογές πολυπαραμετρικών στατιστικών τεχνικών στη χημική ανάλυση

2012 ◽  
Author(s):  
Ελένη Φαρμάκη

Σε αυτή τη διατριβή μελετήθηκε η εφαρμογή πολυπαραμετρικών τεχνικών σε μεγάλες βάσεις δεδομένων ταξινόμησης, με σκοπό τη θεωρητική τους παρουσίαση, τη σύγκριση αυτών και την εξαγωγή συμπερασμάτων, σχετικά με το πεδίο εφαρμογής τους και το χειρισμό τους, τις δυνατότητες και τους περιορισμούς τους. Χρησιμοποιήθηκαν μη επιβλεπόμενες τεχνικές όπως Principal Components Analysis/Factor Analysis (PCA/FA) και Cluster Analysis (CA) αλλά και επιβλεπόμενες όπως Discriminant Analysis (DA), Classification Trees (CT) και Artificial Neural Networks (ANN). Ιδιαίτερη έμφαση δόθηκε στις τεχνικές CT και ANN (μελετήθηκαν τρεις μέθοδοι και αρχιτεκτονικές αντίστοιχα για καθεμιά από αυτές). Ερευνήθηκαν τα πλεονεκτήματα, μειονεκτήματα και ιδιαιτερότητες τους και βελτιστοποιήθηκαν τα μοντέλα ταξινόμησης των τεχνικών. Όλες οι τεχνικές συγκρίθηκαν μεταξύ τους, με κριτήριο τα αποτελέσματα τους (της ορθής ταξινόμησης των δειγμάτων) σε τρεις βάσεις δεδομένων οι οποίες αφορούσαν τους προσδιορισμούς α) μετάλλων-μεταλλοειδών στους τρεις ταμιευτήρες που χρησιμοποιούνται για την ύδρευση της πρωτεύουσας (Υλίκη, Μόρνο και Μαραθώνα), β) μετάλλων-μεταλλοειδών και ανόργανων στοιχείων σε θαλάσσια δείγματα ιζημάτων από μεγάλες ιχθυοκαλλιέργειες της χώρας, γ) σπανίων γαιών σε δείγματα ελαιολάδων από διάφορες περιοχές. Η DA αν και είναι παραμετρική τεχνική με πολλούς περιορισμούς στην εφαρμογή της, ανταποκρίθηκε στις ανάγκες των προβλημάτων και παρείχε πάντα μια πρώτη άποψη για το πρόβλημα (δυνατότητα ή όχι γραμμικού διαχωρισμού των ομάδων με βάση το Canonical plot της ανάλυσης και αρχική αξιολόγηση των μεταβλητών). Τα ποσοστά ορθής ταξινόμησης που παρείχε ήταν αρκετές φορές συγκρίσιμα με των πιο προηγμένων τεχνικών. Τα CT με 3 διαφορετικές μεθόδους και αρκετή ευελιξία (παρείχαν πολλές παραμέτρους προς δοκιμή και βελτιστοποίηση), επέτυχαν υψηλά ποσοστά ταξινόμησης με λίγες ή πολλές μεταβλητές (περισσότερες συνήθως των ANN), κατασκευάζοντας επαναλήψιμα μοντέλα με δυνατότητες γενίκευσης. Τα ANN αποδείχθηκαν ιδιαίτερα ευέλικτη τεχνική, με δυνατότητες αποτελεσματικής αξιολόγησης των μεταβλητών και εφαρμογής τους σε απλές αλλά και πολυπλοκότερες βάσεις προσεγγίζοντας γραμμικές και μη γραμμικές συναρτήσεις. Κατασκευάστηκαν ανθεκτικά και ευέλικτα μοντέλα. Μειονέκτημά τους αποτέλεσαν ωστόσο, τα φαινόμενα υπερπροσαρμογής που παρουσιάζουν και χρειάστηκαν προσεκτικοί χειρισμοί για την αποφυγή τους. Έτσι, τα διαθέσιμα δείγματα διαχωρίστηκαν σε τρεις ομάδες: χρησιμοποιήθηκαν εκτός της συνήθους ομάδας εκπαίδευσης, επιπλέον ομάδες επικύρωσης και ελέγχου. Με τον τρόπο αυτό, έγινε άμεση ταυτοποίηση των φαινομένων υπερπροσαρμογής (ώστε να διακόπτεται αυτόματα η εκπαίδευση του μοντέλου), αλλά και δοκιμή των μοντέλων σε νέα, “’άγνωστα” δείγματα, ώστε να ελέγχεται η δυνατότητα γενίκευσης αυτών. Ο διαχωρισμός σε ομάδες έγινε είτε τυχαία (όπως επιτάσσει η σύγχρονη βιβλιογραφία), είτε με βάση της προκατεργασίας με DA (μέθοδος που δεν έχει χρησιμοποιηθεί ποτέ στο παρελθόν). Επιπλέον, έγινε προσπάθεια εφαρμογής όσο το δυνατόν απλούστερων δομών με λίγες παραμέτρους (μεταβλητές, βάρη) αλλά και λειτουργικές μονάδες επεξεργασίας (νευρώνες).

2019 ◽  
Author(s):  
Αικατερίνη Χατζησολωμού

Η υδατική μόλυνση είναι ένα από τα μεγαλύτερα περιβαλλοντικά προβλήματα που έχει να αντιμετωπίσει η ανθρωπότητα ειδικά τις τελευταίες δεκαετίες. Συνεπώς τα λιμναία περιβάλλοντα υφίστανται και αυτά τεράστιες περιβαλλοντικές επιπτώσεις. Δεδομένου ότι οι λίμνες καλύπτουν περίπου το 90% του επιφανειακού υγρού γλυκού νερού της Γης, η ορθή διαχείριση τους είναι πλέον επιτακτική ανάγκη έτσι ώστε να υπάρχει καλή ποιότητα των υδάτων. Ο ευτροφισμός είναι ένα από τα κυριότερα προβλήματα που παρατηρούνται στα λιμναία περιβάλλοντα. Τα ευτροφικά νερά είναι άμεσα συνδεδεμένα με πληθώρα περιβαλλοντικών προβλημάτων όπως η ανοξία, η συγκέντρωση επικίνδυνων κυανοτοξινών κλπ. Οπότε η παρούσα μελέτη επικεντρώνεται στην εξέταση την περιβαλλοντικών παραμέτρων και την επίδραση/συσχέτιση τους με το φαινόμενο του ευτροφισμού. Τα μαθηματικά μοντέλα (πρότυπα) δύνανται να συνεισφέρουν στην προσπάθεια για αποκατάσταση της καλής ποιότητας του νερού σε ένα λιμναίο περιβάλλον. Τα μαθηματικά μοντέλα διαδραματίζουν το ρόλο ενός διάμεσου για την περιγραφή διάφορων περιβαλλοντικών διεργασιών μέσω μαθηματικών σχέσεων. Διάφοροι τύποι μαθηματικών μοντέλων έχουν εφαρμοστεί στις περιβαλλοντικές επιστήμες, ανάμεσα τους και τα τεχνητά νευρωνικά δίκτυα. Τις τελευταίες δεκαετίες έχει γίνει εφαρμογή των τεχνητών νευρωνικών δικτύων με ιδιαίτερη επιτυχία στην λιμνολογία. Τα τεχνητά νευρωνικά δίκτυα έχει παρατηρηθεί ότι υπερτερούν έναντι πολλών άλλων κατηγοριών μαθηματικών προτύπων (π.χ. μοντέλο γραμμικής παλινδρόμησης). Αυτό έγκειται στο γεγονός ότι μπορούν να προσομοιώσουν με καλή ακρίβεια τις πολύπλοκες μη γραμμικές σχέσεις που συνήθως περιγράφουν τις περιβαλλοντικές διαδικασίες. Οπότε διάφορες κατηγορίες τεχνητών νευρωνικών δικτύων εφαρμόζονται στην παρούσα μελέτη. Τα τεχνητά νευρωνικά δίκτυα μπορούν να χωριστούν σε δύο κύριες κατηγορίες, αυτά με επιβλεπόμενη μάθηση και αυτά με μη επιβλεπόμενη μάθηση. Στις Εφαρμογές 1 και Εφαρμογή 2 υλοποιούνται τεχνητά νευρωνικά δίκτυα με επιβλεπόμενη μάθηση, με στόχο να προβλέψουν την παράμετρο της χλωροφύλλη. Ενώ μετέπειτα διάφοροι αλγόριθμοι ανάλυσης ευαισθησίας (one way-sensitivity analysis) εφαρμόζονται στο τεχνητό νευρωνικό δίκτυο, έτσι ώστε να εντοπιστούν οι περιβαλλοντικές παράμετροι με την πιο μεγάλη επίδραση στο μοντέλο, το οποίο προσομοιώνει επιτυχώς (μικρό σφάλμα) την παραγωγή χλωροφύλλης. Η συνεργιστική δράση (two-way sensitivity analysis) των συζευγμένων περιβαλλοντικών παραμέτρων υπολογίζεται με την χρήση του “PaD2” αλγορίθμου.Στην Εφαρμογή 3 υλοποιείται ένα τεχνητό νευρωνικό δίκτυο με μη επιβλεπόμενη μάθηση του τύπου των αυτό-οργανωτικών χαρτών (self-organizing map (SOM)), βάση του οποίου μπορεί να γίνει διαχωρισμός σε κλάσεις των λιμνολογικών δεδομένων, ενώ ταυτόχρονα γίνεται μελέτη της αλληλοεπίδρασης μεταξύ των περιβαλλοντικών παραμέτρων. Παράλληλα οι στατιστικές μέθοδοι της Ανάλυσης Κυρίων Συνιστωσών (Principal Components Analysis) και της Ανάλυσης Συστάδων (Cluster Analysis) εφαρμόζονται και τα αποτελέσματα τους συγκρίνονται με αυτά του αυτό-οργανωτικού χάρτη. Τα αποτελέσματα της ανάλυσης κύριων συνιστωσών και της ανάλυσης κατά συστάδες βρίσκονται να είναι σε συμφωνία με τα αποτελέσματα του αυτό-οργανωτικού χάρτη, αν και ο αυτό-οργανωτικός χάρτης βρέθηκε να είναι πιο αποτελεσματική μέθοδος χάρη στις προηγμένες απεικονιστικές ικανότητες που έχει για να συσχετίζει παραμέτρους.


Animals ◽  
2021 ◽  
Vol 11 (3) ◽  
pp. 721
Author(s):  
Krzysztof Adamczyk ◽  
Wilhelm Grzesiak ◽  
Daniel Zaborski

The aim of the present study was to verify whether artificial neural networks (ANN) may be an effective tool for predicting the culling reasons in cows based on routinely collected first-lactation records. Data on Holstein-Friesian cows culled in Poland between 2017 and 2018 were used in the present study. A general discriminant analysis (GDA) was applied as a reference method for ANN. Considering all predictive performance measures, ANN were the most effective in predicting the culling of cows due to old age (99.76–99.88% of correctly classified cases). In addition, a very high correct classification rate (99.24–99.98%) was obtained for culling the animals due to reproductive problems. It is significant because infertility is one of the conditions that are the most difficult to eliminate in dairy herds. The correct classification rate for individual culling reasons obtained with GDA (0.00–97.63%) was, in general, lower than that for multilayer perceptrons (MLP). The obtained results indicated that, in order to effectively predict the previously mentioned culling reasons, the following first-lactation parameters should be used: calving age, calving difficulty, and the characteristics of the lactation curve based on Wood’s model parameters.


Sign in / Sign up

Export Citation Format

Share Document