scholarly journals Determination of minced meat quality using machine learning

2017 ◽  
Author(s):  
Αθηνά Ροπόδη

Τη σημερινή εποχή, οι καταναλωτές απαιτούν συνεχή επιβεβαίωση της προέλευσης, της ποιότητας και της συμμόρφωσης με την ετικέτα των τροφίμων που αγοράζουν. Για το λόγο αυτό, οι βιομηχανίες τροφίμων, οι έμποροι και οι αρχές είναι αναγκαίο να αναπτύξουν προηγμένες, αποτελεσματικές και χαμηλού κόστους λύσεις για τη διασφάλιση της ποιότητας και τον εντοπισμό δόλιων πρακτικών. Σε αυτό το πλαίσιο, η μελέτη αυτή εστιάζει (α) στην πολυφασματική απεικόνιση (Multispectral Imaging-MSI), (β) την φασματοσκοπία υπέρυθρου με μετασχηματισμό Fourier (Fourier Transform Infrared -FTIR spectrometry) και (γ) την εφαρμογή προηγμένων μεθόδων ανάλυσης δεδομένων και μηχανικής μάθησης. Όσον αφορά την ποιότητα, εξετάστηκε η αποτελεσματικότητα των προαναφερόμενων μεθόδων σε σχέση με (α) τον εντοπισμό της μη-συμμόρφωσης με την ετικέτα ή/και δόλιων πρακτικών και (β) τη μικροβιολογική αλλοίωση. Οι ακόλουθες αναλύσεις, έλαβαν χώρα:Στην 1η περίπτωση, εξετάστηκε η νοθεία του μοσχαρίσιου κιμά με χοιρινό. Χρησιμοποιήθηκαν 220 πολυφασματικές εικόνες δειγμάτων από 4 ανεξάρτητες πειραματικές διαδικασίες (κομμάτια κρέατος διαφορετικής προέλευσης). Η νοθεία έγινε με βήμα 10% w/w, δημιουργώντας 11 κατηγορίες (συμπεριλαμβανομένων των ανόθευτων χοιρινών και μοσχαρίσιων δειγμάτων). Μετά από ένα στάδιο προεπεξεργασίας της εικόνας, εφαρμόστηκαν η Ιεραρχική Ανάλυση Συστάδων (Hierarchical Cluster Analysis - HCA) και Ανάλυση Κυρίων Συνιστωσών (Principal Component Analysis - PCA). Παρατηρήθηκαν δε σημαντικές διαφορές μεταξύ των διαφορετικών κομματιών κρέατος και των διαφορετικών κλάσεων όταν και τα τρία πρώτα ζευγάρια κομματιών κρέατος συμπεριλήφθηκαν στην ανάλυση. Μετά την κατάτμηση των δεδομένων σε σετ εκπαίδευσης και επικύρωσης, τα δεδομένα του τέταρτου ζεύγους χρησιμοποιήθηκαν για ανεξάρτητη επικύρωση και εφαρμόστηκαν οι μέθοδοι Γραμμικής Διακριτικής Ανάλυσης και Μερικών Ελαχίστων Τετραγώνων Linear Discriminant Analysis - LDA, Partial least-squares discriminant analysis – PLSDA) για 11 και για 3 (ανόθευτα χοιρινά, μοσχαρίσια και νοθευμένα) κλάσεις. Στην περίπτωση των 11 κλάσεων, 98.48% και 96.97% των δειγμάτων κατηγοριοποιήθηκαν εντός μιας ±10% κατηγορίας για LDA και PLSDA αντίστοιχα, ενώ στην περίπτωση των τριών επιτεύχθηκε σωστή κατηγοριοποίηση 98.48%. Τα αποτελέσματα της ανεξάρτητης επικύρωσης ήταν λιγότερο ακριβή για την LDA, αλλά με την PLSDA όλα τα δείγματα κατηγοριοποιήθηκαν σωστά, αποδεικνύοντας ότι το ποσοστό 10% είναι εντός των ορίων ανίχνευσης.Στην δεύτερη περίπτωση, 110 δείγματα κιμά τριών διαφορετικών κομματιών κρέατος από μοσχάρι και άλογο και επιπλέον εικόνες που ελήφθησαν μετά από 6, 24 και 48 ώρες χρησιμοποιήθηκαν για την ανίχνευση νοθείας. Η PCA χρησιμοποιήθηκε για οπτικοποίηση των δεδομένων, ενώ οι μέθοδοι PLSDA και Random Forest (RF) για κατηγοριοποίηση μεταξύ διαφορετικών ποσοστών νοθείας (4 κλάσεις), ανόθευτων μοσχαρίσιων, ανόθευτων αλογίσιων και νοθευμένων, ανόθευτων και νοθευμένων, και τέλος μεταξύ φρέσκων και συντηρημένων δειγμάτων. Τα μοντέλα κατά την ανεξάρτητη επικύρωση δεν είχαν υψηλή ακρίβεια. Στο τέλος, προτιμήθηκε η χρήση μηχανών διανυσμάτων υποστήριξης (Support Vector Machines – SVMs) σε δύο στάδια προκειμένου να διαχωριστούν τα φρέσκα από τα συντηρημένα δείγματα και μετά τα νοθευμένα από τα ανόθευτα. Έτσι, επιτεύχθηκε ποσοστό σωστής κατηγοριοποίησης 95.31% στο ανεξάρτητο σετ επικύρωσης.Στην τρίτη περίπτωση, ελήφθησαν πολυφασματικές εικόνες και φάσματα FTIR από κιμά επτά διαφορετικών κομματιών και από αντίστοιχα αποψυγμένα δείγματα που είχαν καταψυχθεί στους -20°C για 7 και 32 μέρες (συνολικά 105 εικόνες και φάσματα). Η PCA χρησιμοποιήθηκε για τη διερεύνηση των δεδομένων, ενώ PLSDA και SVM πέτυχαν 100% σωστή κατηγοριοποίηση μεταξύ φρέσκων και αποψυγμένων κατά την επικύρωση και την ανεξάρτητη επικύρωση με χρήση πολυφασματικών εικόνων. Η FTIR ήταν λιγότερο ακριβής με 93.3 και 96.7% αντίστοιχα.Στην 4η και 5η περίπτωση, διερευνήθηκε η αλλοίωση του βοδινού κιμά. Στην 4η περίπτωση, χρησιμοποιώντας τη διαδικτυακή εφαρμογή “MeatReg”, χρησιμοποιήθηκαν επτά διαφορετικές μέθοδοι για την εκτίμηση του μικροβιακού πληθυσμού. Τα δεδομένα αποτελούνταν από 105 δείγματα συντηρημένα σε δυο διαφορετικές συσκευασίες -αέρας και modified air packaging (MAP - 20% CO2/ 80% O2)- και δύο θερμοκρασίες (4 και 10°C), μικροβιολογικές αναλύσεις (Pseudomonads, Lactobacilli, B. thermosphacta and Enterobacteriaceae, Ολική Μεσόφιλη Χλωρίδα - ΟΜΧ). Τα δεδομένα πολυφασματικής απεικόνισης και FTIR συγκρίθηκαν με αυτά από ηλεκτρονική μύτη, υγρή χρωματογραφία υψηλής απόδοσης (HPLC) και αέρια χρωματογραφία/ φασματοσκοπία μάζας (GC-MS). Τα αποτελέσματα διαφοροποιήθηκαν αρκετά ανάλογα το είδος του οργάνου και της ομάδας μικροοργανισμών. Παρόλα αυτά υπήρξε καλή ακρίβεια, με την μέθοδο RF να δίνει τα καλύτερα αποτελέσματα.Ομοίως στην 5η περίπτωση, 168 δείγματα βοδινού κιμά αναλύθηκαν ως προς την ΟΜΧ, ενώ παράλληλα έγιναν μετρήσεις FTIR. Τα δείγματα είχαν συντηρηθεί σε αέρα και MAP στους 4 και 10°C. Χρησιμοποιήθηκε μία προσέγγιση βασισμένη στην μεθοδολογία των ensemble μοντέλων, όπου η εκτίμηση της αλλοίωσης έγινε βάσει μίας μίξης αποτελεσμάτων επιμέρους νευρωνικών δικτύων (artificial neural networks). Το μέσο τετραγωνικό σφάλμα της πρόβλεψης ήταν 0.16 (log CFU/g)^2.

Sensors ◽  
2019 ◽  
Vol 19 (20) ◽  
pp. 4523 ◽  
Author(s):  
Carlos Cabo ◽  
Celestino Ordóñez ◽  
Fernando Sáchez-Lasheras ◽  
Javier Roca-Pardiñas ◽  
and Javier de Cos-Juez

We analyze the utility of multiscale supervised classification algorithms for object detection and extraction from laser scanning or photogrammetric point clouds. Only the geometric information (the point coordinates) was considered, thus making the method independent of the systems used to collect the data. A maximum of five features (input variables) was used, four of them related to the eigenvalues obtained from a principal component analysis (PCA). PCA was carried out at six scales, defined by the diameter of a sphere around each observation. Four multiclass supervised classification models were tested (linear discriminant analysis, logistic regression, support vector machines, and random forest) in two different scenarios, urban and forest, formed by artificial and natural objects, respectively. The results obtained were accurate (overall accuracy over 80% for the urban dataset, and over 93% for the forest dataset), in the range of the best results found in the literature, regardless of the classification method. For both datasets, the random forest algorithm provided the best solution/results when discrimination capacity, computing time, and the ability to estimate the relative importance of each variable are considered together.


Sensors ◽  
2018 ◽  
Vol 18 (12) ◽  
pp. 4479 ◽  
Author(s):  
Xavier Cetó ◽  
Núria Serrano ◽  
Miriam Aragó ◽  
Alejandro Gámez ◽  
Miquel Esteban ◽  
...  

The development of a simple HPLC-UV method towards the evaluation of Spanish paprika’s phenolic profile and their discrimination based on the former is reported herein. The approach is based on C18 reversed-phase chromatography to generate characteristic fingerprints, in combination with linear discriminant analysis (LDA) to achieve their classification. To this aim, chromatographic conditions were optimized so as to achieve the separation of major phenolic compounds already identified in paprika. Paprika samples were subjected to a sample extraction stage by sonication and centrifugation; extracting procedure and conditions were optimized to maximize the generation of enough discriminant fingerprints. Finally, chromatograms were baseline corrected, compressed employing fast Fourier transform (FFT), and then analyzed by means of principal component analysis (PCA) and LDA to carry out the classification of paprika samples. Under the developed procedure, a total of 96 paprika samples were analyzed, achieving a classification rate of 100% for the test subset (n = 25).


Sensors ◽  
2020 ◽  
Vol 20 (22) ◽  
pp. 6575
Author(s):  
Lingjie Yang ◽  
Zuxin Zhang ◽  
Xiaowen Hu

Rapid and accurate discrimination of alfalfa cultivars is crucial for producers, consumers, and market regulators. However, the conventional routine of alfalfa cultivars discrimination is time-consuming and labor-intensive. In this study, the potential of a new method was evaluated that used multispectral imaging combined with object-wise multivariate image analysis to distinguish alfalfa cultivars with a single seed. Three multivariate analysis methods including principal component analysis (PCA), linear discrimination analysis (LDA), and support vector machines (SVM) were applied to distinguish seeds of 12 alfalfa cultivars based on their morphological and spectral traits. The results showed that the combination of morphological features and spectral data could provide an exceedingly concise process to classify alfalfa seeds of different cultivars with multivariate analysis, while it failed to make the classification with only seed morphological features. Seed classification accuracy of the testing sets was 91.53% for LDA, and 93.47% for SVM. Thus, multispectral imaging combined with multivariate analysis could provide a simple, robust and nondestructive method to distinguish alfalfa seed cultivars.


2012 ◽  
Vol 8 (S295) ◽  
pp. 180-180
Author(s):  
He Ma ◽  
Yanxia Zhang ◽  
Yongheng Zhao ◽  
Bo Zhang

AbstractIn this work, two different algorithms: Linear Discriminant Analysis (LDA) and Support Vector Machines (SVMs) are combined for the classification of unresolved sources from SDSS DR8 and UKIDSS DR8. The experimental result shows that this joint approach is effective for our case.


1997 ◽  
Vol 45 (1) ◽  
pp. 1 ◽  
Author(s):  
Peter J. Dunlop ◽  
Caroline M. Bignell ◽  
D. Brynn Hibbert

Using morphological observations, botanists have classified Eucalyptus species into characteristic series. A new vacuum distillation technique has been employed to obtain the characteristic leaf oils, which are very close to their in vivo compositions, from 35 species belonging to series Tetrapterae, series Torquatae and series Rufispermae. Accurate gas chromatograms have been obtained for each species and three analytical techniques (principal component analysis (PCA), hierarchical cluster analysis (CA) and linear discriminant analysis (LDA)) have been used to process these chromatograms to see if agreement with these classifications could be achieved without using any auxiliary morphometric data. For the species chosen for the present study, linear discriminant analysis was the most successful in assigning species to their present botanic classifications. These analytical methods were also used with some success in searching for groupings within a series and within a species.


Biometric technology has been commonly used for authentication. Fingerprint or iris become one of the biometrics that is widely applied. However, this type of biometrics tends to be easily falsified and damaged. So it is misused for manipulating actions and even crime. Therefore a new biometric method is needed to overcome this problem. One potential modality is biometrics based on an electrocardiogram (ECG) signal. This research simulates a one-lead ECG waveform for person authentication. ECG waves were taken from eleven healthy adult volunteers with a length of 60 seconds. ECG waves from each person are segmented into 10 sections so that a total of 110 ECG waves are used for person authentication simulations. All noise of the ECG waves was removed using a bandpass filter to reduce artifacts and high-frequency noise. Wavelet packet decomposition (3 Level) was applied to decompose the signal in several intrinsic parts so that typical wave information can be retrieved. Entropy-based feature extraction applied to all decomposed signals. A total of 14 entropy features have been calculated and used as predictors in the classification process. Validation and performance tests are carried out by cross-validation combined with linear discriminant analysis and support vector machines with five scenarios. The proposed method provides the highest accuracy of 71.8% using discriminant analysis and cubic support vector machine. The best accuracy value was achieved if all entropy features from all wavelet decomposition levels are used as predictors in the classification process. This research is expected to be a reference that ECG has the potential to become a future biometric modality


2021 ◽  
Vol 2021 ◽  
pp. 1-11
Author(s):  
Heping Li ◽  
Yu Ren ◽  
Fan Yu ◽  
Dongliang Song ◽  
Lizhe Zhu ◽  
...  

To facilitate the enhanced reliability of Raman-based tumor detection and analytical methodologies, an ex vivo Raman spectral investigation was conducted to identify distinct compositional information of healthy (H), ductal carcinoma in situ (DCIS), and invasive ductal carcinoma (IDC). Then, principal component analysis-linear discriminant analysis (PCA-LDA) and principal component analysis-support vector machine (PCA-SVM) models were constructed for distinguishing spectral features among different tissue groups. Spectral analysis highlighted differences in levels of unsaturated and saturated lipids, carotenoids, protein, and nucleic acid between healthy and cancerous tissue and variations in the levels of nucleic acid, protein, and phenylalanine between DCIS and IDC. Both classification models were principal component analysis-linear discriminant analysis to be extremely efficient on discriminating tissue pathological types with 99% accuracy for PCA-LDA and 100%, 100%, and 96.7% for PCA-SVM analysis based on linear kernel, polynomial kernel, and radial basis function (RBF), respectively, while PCA-SVM algorithm greatly simplified the complexity of calculation without sacrificing performance. The present study demonstrates that Raman spectroscopy combined with multivariate analysis technology has considerable potential for improving the efficiency and performance of breast cancer diagnosis.


Sign in / Sign up

Export Citation Format

Share Document