scholarly journals Deep Learning for Person Reidentification Using Support Vector Machines

2017 ◽  
Vol 2017 ◽  
pp. 1-12 ◽  
Author(s):  
Mengyu Xu ◽  
Zhenmin Tang ◽  
Yazhou Yao ◽  
Lingxiang Yao ◽  
Huafeng Liu ◽  
...  

Due to the variations of viewpoint, pose, and illumination, a given individual may appear considerably different across different camera views. Tracking individuals across camera networks with no overlapping fields is still a challenging problem. Previous works mainly focus on feature representation and metric learning individually which tend to have a suboptimal solution. To address this issue, in this work, we propose a novel framework to do the feature representation learning and metric learning jointly. Different from previous works, we represent the pairs of pedestrian images as new resized input and use linear Support Vector Machine to replace softmax activation function for similarity learning. Particularly, dropout and data augmentation techniques are also employed in this model to prevent the network from overfitting. Extensive experiments on two publically available datasets VIPeR and CUHK01 demonstrate the effectiveness of our proposed approach.

2020 ◽  
Vol 6 (12) ◽  
pp. 142
Author(s):  
Vicent Ortiz Ortiz Castelló ◽  
Ismael Salvador Salvador Igual ◽  
Omar del Tejo Catalá ◽  
Juan-Carlos Perez-Cortes

Vulnerable Road User (VRU) detection is a major application of object detection with the aim of helping reduce accidents in advanced driver-assistance systems and enabling the development of autonomous vehicles. Due to intrinsic complexity present in computer vision and to limitations in processing capacity and bandwidth, this task has not been completely solved nowadays. For these reasons, the well established YOLOv3 net and the new YOLOv4 one are assessed by training them on a huge, recent on-road image dataset (BDD100K), both for VRU and full on-road classes, with a great improvement in terms of detection quality when compared to their MS-COCO-trained generic correspondent models from the authors but with negligible costs in forward pass time. Additionally, some models were retrained when replacing the original Leaky ReLU convolutional activation functions from original YOLO implementation with two cutting-edge activation functions: the self-regularized non-monotonic function (MISH) and its self-gated counterpart (SWISH), with significant improvements with respect to the original activation function detection performance. Additionally, some trials were carried out including recent data augmentation techniques (mosaic and cutmix) and some grid size configurations, with cumulative improvements over the previous results, comprising different performance-throughput trade-offs.


2021 ◽  
Author(s):  
noureddine kermiche

Using data augmentation techniques, unsupervised representation learning methods extract features from data by training artificial neural networks to recognize that different views of an object are just different instances of the same object. We extend current unsupervised representation learning methods to networks that can self-organize data representations into two-dimensional (2D) maps. The proposed method combines ideas from Kohonen’s original self-organizing maps (SOM) and recent development in unsupervised representation learning. A ResNet backbone with an added 2D <i>Softmax</i> output layer is used to organize the data representations. A new loss function with linear complexity is proposed to enforce SOM requirements of winner-take-all (WTA) and competition between neurons while explicitly avoiding collapse into trivial solutions. We show that enforcing SOM topological neighborhood requirement can be achieved by a fixed radial convolution at the 2D output layer without having to resort to actual radial activation functions which prevented the original SOM algorithm from being extended to nowadays neural network architectures. We demonstrate that when combined with data augmentation techniques, self-organization is a simple emergent property of the 2D output layer because of neighborhood recruitment combined with WTA competition between neurons. The proposed methodology is demonstrated on SVHN and CIFAR10 data sets. The proposed algorithm is the first end-to-end unsupervised learning method that combines data self-organization and visualization as integral parts of unsupervised representation learning.


2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Rida Assaf ◽  
Fangfang Xia ◽  
Rick Stevens

AbstractContiguous genes in prokaryotes are often arranged into operons. Detecting operons plays a critical role in inferring gene functionality and regulatory networks. Human experts annotate operons by visually inspecting gene neighborhoods across pileups of related genomes. These visual representations capture the inter-genic distance, strand direction, gene size, functional relatedness, and gene neighborhood conservation, which are the most prominent operon features mentioned in the literature. By studying these features, an expert can then decide whether a genomic region is part of an operon. We propose a deep learning based method named Operon Hunter that uses visual representations of genomic fragments to make operon predictions. Using transfer learning and data augmentation techniques facilitates leveraging the powerful neural networks trained on image datasets by re-training them on a more limited dataset of extensively validated operons. Our method outperforms the previously reported state-of-the-art tools, especially when it comes to predicting full operons and their boundaries accurately. Furthermore, our approach makes it possible to visually identify the features influencing the network’s decisions to be subsequently cross-checked by human experts.


Author(s):  
Nayak K., Venkataravana ◽  
J. S. Arunalatha ◽  
K. R. Venugopal

Image representation is a widespread strategy of image retrieval based on appearance, shape information. The traditional feature representation methods ignore hidden information that exists in the dataset samples; it reduces the discriminative performance of the classifier and excludes various geometric and photometric variations consideration in obtaining the features; these degrade retrieval performance. Hence, proposed multiple features fusion and Support Vector Machines Ensemble (IR-MF-SVMe); an Image Retrieval framework to enhance the performance of the retrieval process. The Color Histogram (CH), Color Auto-Correlogram (CAC), Color Moments (CM), Gabor Wavelet (GW), and Wavelet Moments (WM) descriptors are used to extract multiple features that separate the element vectors of images in representation. The multi-class classifier is constructed with the aggregation of binary Support Vector Machines, which decrease the count of false positives within the interrelated semantic classes. The proposed framework is validated on the WANG dataset and results in the accuracy of 84% for the individual features and 86% for the fused features related to the state-of-the-arts.


2021 ◽  
Author(s):  
Κωνσταντίνος Γεωργιάδης

Οι Διεπαφές Εγκεφάλου Υπολογιστή (ΔΕΥ) προσφέρουν εναλλακτικά «κανάλια» επικοινωνίας μεταξύ του ανθρώπινου εγκεφάλου και μίας ηλεκτρονικής συσκευής. Η αποκωδικοποίηση της εγκεφαλικής δραστηριότητας και η μετατροπή της σε εντολές μηχανής ολοκληρώνει ένα κλειστό σύστημα, το οποίο μπορεί να λειτουργήσει χωρίς φυσική αλληλεπίδραση. Ο Berger ήταν ο πρώτος που διατύπωσε τη θεωρία της «ανάγνωσης του μυαλού», αλλά η υλοποίηση ενός ολοκληρωμένου συστήματος ΔΕΥ κατέστη δυνατή μόνο τα τελευταία χρόνια. Λόγω του σχεδιασμού τους, οι ΔΕΥ θεωρούνται ιδανικά συστήματα υποστήριξης ατόμων που πάσχουν από κινητική αναπηρία και ως εκ τούτου λαμβάνουν συνεχώς αυξανόμενη προσοχή. Η υλοποίηση μίας ΔΕΥ μπορεί να γίνει μέσω διαφορετικών προσεγγίσεων, ωστόσο το Ηλεκτροεγκεφαλογράφημα (ΗΕΓ) θεωρείται η πιο δημοφιλής επιλογή. Αυτό συμβαίνει κυρίως λόγω του μη επεμβατικού χαρακτήρα του ΗΕΓ ενώ συνεπικουρικά στοιχεία είναι το χαμηλό κόστος, η εύκολη προσάρτηση και η εύκολη ενσωμάτωσή του στην καθημερινότητα των χρηστών. Στα πλαίσια αυτής της διδακτορικής διατριβής μελετήθηκαν δύο διαφορετικού τύπου ΔΕΥ τα οποία βασίζονται σε μετρήσεις ΗΕΓ και πιο συγκεκριμένα στην κατηγορία διεπαφών μέσω Προκλητών Δυναμικών Σταθερής Κατάστασης (Steady State Visual Evoked Potentials; SSVEP) και σε αυτή που σχετίζεται με τη Νοερή Κίνηση (Motor Imagery; MI) των άκρων. Στόχος αυτής της διδακτορικής διατριβής είναι ο σχεδιασμός και η υλοποίηση πρωτοκόλλων ανάλυσης σημάτων ΗΕΓ μέσω των οποίων θα γίνεται η αποκωδικοποίηση των προθέσεων/επιλογών των χρηστών. Οι υλοποιήσεις θα πρέπει να χαρακτηρίζονται από γρήγορες και εύρωστες αποκρίσεις, χαρακτηριστικά τα οποία κρίνονται ζωτικής σημασίας για οποιαδήποτε υλοποίηση ΔΕΥ. Υπό αυτό το πρίσμα η πρώτη κατηγορία που εξετάσθηκε ήταν αυτή των Προκλητών Δυναμικών Σταθερής Κατάστασης, με στόχο τη δημιουργία ενός καινοφανούς συστήματος αποκρυπτογράφησης. Το συγκεκριμένο σύστημα βασίστηκε στις έννοιες του διακριτού κβαντισμού διανυσμάτων αλλά και της κατηγοριοποίησης μέσω του κανόνα πλησιέστερου προτύπου. Το παραπάνω σύστημα σχεδιάστηκε με στόχο την αποφυγή ψευδώς θετικών αποκρίσεων καθώς κάθε πρόβλεψη συνοδευόταν από ένα σκορ εμπιστοσύνης το οποίο υποδείκνυε την ενεργοποίηση ή μη της απόφασης. Στη συνέχεια, ασχοληθήκαμε με την κατηγορία των ΔΕΥ που σχετίζεται με τη Νοερή Κίνηση των άκρων. Η μετάβαση αυτή, προκρίθηκε κυρίως λόγω της αδυναμίας των συστημάτων Προκλητών Δυναμικών Σταθερής Κατάστασης να χρησιμοποιούνται από τους χρήστες αυτόνομα και κατόπιν δικής τους πρόθεσης. Αρχικά, εστιάσαμε στα δεδομένα τα οποία συλλέξαμε από άτομα με Νευρομυϊκές παθήσεις και από αντίστοιχου μεγέθους δείγματος ελέγχου. Η ανάλυση βασίστηκε σε έννοιες αυτό-οργάνωσης πολύπλοκων δικτύων με στόχο την αναγνώριση διαφορών μεταξύ των πληθυσμών. Οι σημαντικές διαφορές που παρατηρήθηκαν στο συγχρονισμό φάσης (PLV) αλλά και στις ιδιότητες του εγκεφαλικού δικτύου (π.χ. Global/Local Efficiency), μπορούν να αποδοθούν στην πάθηση και στον τρόπο με τον οποίο αναδιοργανώνεται ο εγκέφαλος όσο αυτή εξελίσσεται. Σε δεύτερη φάση, έχοντας διαπιστώσει την καταλληλότητα της χρήσης του συγχρονισμού φάσης για την αναγνώριση της νοερής κίνησης σχεδιάσαμε ένα αλγοριθμικό πλαίσιο αποτελούμενο από μια αλληλουχία ταξινομητών το οποίο μπορεί να εντοπίζει την έναρξη της δραστηριότητας που σχετίζεται με την εκτελούμενη νοερή κίνηση. Έπειτα, εξετάσαμε την επεξεργασία σήματος σε επίπεδο γράφων, και πιο συγκεκριμένα το μετασχηματισμό Fourier σε επίπεδο γράφων, με σκοπό την αξιοποίησή του στην ανάλυση ΗΕΓ σήματος κατά την πραγματοποίηση διεργασιών Νοερής Κίνησης. Η πρώτη προσέγγιση αφορούσε τη χρήση της λειτουργικής συνδεσιμότητας στο σχεδιασμό του γράφου. Η δεύτερη προσέγγιση αφορούσε το σχεδιασμό ενός πολύ-επίπεδου γράφου, όπου κάθε επίπεδο αντιστοιχούσε σε δραστηριότητα από διαφορετικό εγκεφαλικό ρυθμό (δηλ. συχνοτικό περιεχόμενο), ενώ η συνδεσιμότητα των κόμβων αντιπροσώπευε τις αλληλεπιδράσεις μεταξύ των διαφορετικών ρυθμών. Η τρίτη προσέγγιση βασιζόταν στην τεχνική των Graph Slepian συναρτήσεων, οι οποίες υλοποιούν περιορισμούς τόσο σε επίπεδο γράφου όσο και σε επίπεδο φάσματος του γράφου. Τέλος, χρησιμοποιήσαμε έναν αλγόριθμο κατηγοριοποίησης ο οποίος δρα σε πίνακες συνδιακύμανσης και μπορεί να εντοπίσει τους αισθητήρες εκείνους οι οποίοι παρουσιάζουν τη μέγιστη διακριτική ικανότητα, ορίζοντας κατά αυτόν τον τρόπο το πιο συνεκτικό υπο-δίκτυο. Έχοντας εντοπίσει το συγκεκριμένο υπο-δίκτυο, οι αναπαραστάσεις των (περιορισμένων) πινάκων συνδιακύμανσης των MI δεδομένων γίνονται σε Ριμάνεια επιφάνεια, ενώ η κατηγοριοποίηση τους γίνεται με τη χρήση Μηχανών Διανυσμάτων Υποστήριξης (Support Vector Machines; SVMs).


2011 ◽  
Vol 6 (1) ◽  
pp. 43-47 ◽  
Author(s):  
Nicholas G. Polson ◽  
Steven L. Scott

Sign in / Sign up

Export Citation Format

Share Document