A SIFT-Like Feature Detector and Descriptor for Multibeam Sonar Imaging

Multibeam imaging sonar has become an increasingly important tool in the field of underwater object detection and description. In recent years, the scale-invariant feature transform (SIFT) algorithm has been widely adopted to obtain stable features of objects in sonar images but does not perform well on multibeam sonar images due to its sensitivity to speckle noise. In this paper, we introduce MBS-SIFT, a SIFT-like feature detector and descriptor for multibeam sonar images. This algorithm contains a feature detector followed by a local feature descriptor. A new gradient definition robust to speckle noise is presented to detect extrema in scale space, and then, interest points are filtered and located. It is also used to assign orientation and generate descriptors of interest points. Simulations and experiments demonstrate that the proposed method can capture features of underwater objects more accurately than existing approaches.

Download Full-text

Optimization of a Scale-Invariant Feature detector using scale-space scans

2013 IEEE 7th International Conference on Intelligent Data Acquisition and Advanced Computing Systems (IDAACS) ◽

10.1109/idaacs.2013.6662713 ◽

2013 ◽

Cited By ~ 1

Author(s):

John A. Kalomiros

Keyword(s):

Scale Space ◽

Feature Detector ◽

Scale Invariant ◽

Invariant Feature ◽

Scale Invariant Feature

Download Full-text

A Harris-Like Scale Invariant Feature Detector

Computer Vision – ACCV 2009 - Lecture Notes in Computer Science ◽

10.1007/978-3-642-12304-7_55 ◽

2010 ◽

pp. 586-595 ◽

Cited By ~ 4

Author(s):

Yinan Yu ◽

Kaiqi Huang ◽

Tieniu Tan

Keyword(s):

Feature Detector ◽

Scale Invariant ◽

Invariant Feature ◽

Scale Invariant Feature

Download Full-text

A hardware accelerated Scale Invariant Feature detector for real-time visual localization and mapping

2016 Fourth International Conference on Ubiquitous Positioning, Indoor Navigation and Location Based Services (UPINLBS) ◽

10.1109/upinlbs.2016.7809965 ◽

2016 ◽

Author(s):

Zunquan Zhou ◽

Rendong Ying ◽

Rongdi Sun ◽

Zhenqi Wei ◽

Ke Jin ◽

...

Keyword(s):

Real Time ◽

Visual Localization ◽

Feature Detector ◽

Scale Invariant ◽

Invariant Feature ◽

Localization And Mapping ◽

Scale Invariant Feature

Download Full-text

Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT

JATISI (Jurnal Teknik Informatika dan Sistem Informasi) ◽

10.35957/jatisi.v7i2.289 ◽

2020 ◽

Vol 7 (2) ◽

pp. 310-320

Author(s):

Siska Devella ◽

Yohannes Yohannes ◽

Firda Novia Rahmawati

Keyword(s):

Random Forest ◽

Scale Space ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Invariant Feature ◽

Feature Transform ◽

Scale Invariant Feature

Indonesia memiliki berbagai warisan budaya tak benda salah satunya adalah kain songket. Kain songket memiliki banyak ragam sesuai ciri khas dari setiap daerah, khususnya songket Palembang. Kain songket Palembang memiliki keistimewaan dibandingkan songket dari daerah lain. Selain memiliki nilai sejarah, kain songket Palembang memiliki motif, mutu dan tingkat kerumitan yang tinggi dalam proses pembuatannya. Pada penelitian ini digunakan metode Random Forest untuk klasifikasi citra motif kain songket Palembang dengan mengunakan ekstraksi fitur Scale-Invariant Feature Transform (SIFT). Proses pembentukan fitur dengan metode SIFT melalui tahap scale space extrema detection, keypoint localization, orientation assignment, dan keypoint descriptor. Fitur yang dihasilkan digunakan untuk klasifikasi Random Forest. Citra motif songket yang digunakan pada penelitian ini sebanyak 115 citra dari setiap jenis motif, yaitu Bunga cina, Cantik Manis, dan Pulir. Pemilihan citra diambil dari 5 warna setiap motif songket Palembang. Data latih dan data uji yang digunakan masing-masing sebanyak 100 dan 15 untuk setiap motif Songket Palembang. Hasil pengujian menunjukkan bahwa metode SIFT dan Random Forest untuk klasifikasi citra motif kain Songket Palembang dapat memberikan akurasi yang cukup baik, dimana metode SIFT dan Random Forest mampu menghasilkan rata-rata overall accuracy 92,98%, per class accuracy 94,07%, presision 92,98%, dan recall 89,74%.

Download Full-text

An Improved SIFT Matching Algorithm

Applied Mechanics and Materials ◽

10.4028/www.scientific.net/amm.239-240.1232 ◽

2012 ◽

Vol 239-240 ◽

pp. 1232-1237 ◽

Cited By ~ 1

Author(s):

Can Ding ◽

Chang Wen Qu ◽

Feng Su

Keyword(s):

High Dimension ◽

Gradient Method ◽

Feature Matching ◽

Feature Descriptor ◽

Scale Invariant ◽

Matching Algorithm ◽

Invariant Feature ◽

Feature Transform ◽

New Feature ◽

Scale Invariant Feature

The high dimension and complexity of feature descriptor of Scale Invariant Feature Transform (SIFT), not only occupy the memory spaces, but also influence the speed of feature matching. We adopt the statistic feature point’s neighbor gradient method, the local statistic area is constructed by 8 concentric square ring feature of points-centered, compute gradient of these pixels, and statistic gradient accumulated value of 8 directions, and then descending sort them, at last normalize them. The new feature descriptor descend dimension of feature from 128 to 64, the proposed method can improve matching speed and keep matching precision at the same time.

Download Full-text

Robust Wide Baseline Feature Point Matching Based on Scale Invariant Feature Descriptor

Lecture Notes in Computer Science - Advanced Intelligent Computing Theories and Applications. With Aspects of Theoretical and Methodological Issues ◽

10.1007/978-3-540-87442-3_42 ◽

2008 ◽

pp. 329-336 ◽

Cited By ~ 2

Author(s):

Sicong Yue ◽

Qing Wang ◽

Rongchun Zhao

Keyword(s):

Feature Point ◽

Feature Descriptor ◽

Scale Invariant ◽

Point Matching ◽

Invariant Feature ◽

Feature Point Matching ◽

Scale Invariant Feature

Download Full-text

SIFER: Scale-Invariant Feature Detector with Error Resilience

International Journal of Computer Vision ◽

10.1007/s11263-013-0622-3 ◽

2013 ◽

Vol 104 (2) ◽

pp. 172-197 ◽

Cited By ~ 40

Author(s):

Pradip Mainali ◽

Gauthier Lafruit ◽

Qiong Yang ◽

Bert Geelen ◽

Luc Van Gool ◽

...

Keyword(s):

Error Resilience ◽

Feature Detector ◽

Scale Invariant ◽

Invariant Feature ◽

Scale Invariant Feature

Download Full-text

PERSPECTIVE-INVARIANT IMAGE MATCHING FRAMEWORK WITH BINARY FEATURE DESCRIPTOR AND APSO

International Journal of Pattern Recognition and Artificial Intelligence ◽

10.1142/s0218001414550118 ◽

2014 ◽

Vol 28 (08) ◽

pp. 1455011

Author(s):

LICHUAN GENG ◽

SONGZHI SU ◽

DONGLIN CAO ◽

SHAOZI LI

Keyword(s):

Image Matching ◽

Feature Descriptor ◽

Feature Points ◽

Feature Location ◽

Scale Invariant ◽

Binary Descriptors ◽

Binary Feature ◽

Image Patches ◽

Sample Points ◽

Scale Invariant Feature

A novel perspective invariant image matching framework is proposed in this paper, noted as Perspective-Invariant Binary Robust Independent Elementary Features (PBRIEF). First, we use the homographic transformation to simulate the distortion between two corresponding patches around the feature points. Then, binary descriptors are constructed by comparing the intensity of sample points surrounding the feature location. We transform the location of the sample points with simulated homographic matrices. This operation is to ensure that the intensities which we compared are the realistic corresponding pixels between two image patches. Since the exact perspective transform matrix is unknown, an Adaptive Particle Swarm Optimization (APSO) algorithm-based iterative procedure is proposed to estimate the real transformation angles. Experimental results obtained on five different datasets show that PBRIEF outperforms significantly the existing methods on images with large viewpoint difference. Moreover, the efficiency of our framework is also improved comparing with Affine-Scale Invariant Feature Transform (ASIFT).

Download Full-text

FD-TR: feature detector based on scale invariant feature transform and bidirectional feature regionalization for digital image watermarking

Multimedia Tools and Applications ◽

10.1007/s11042-021-11134-1 ◽

2021 ◽

Author(s):

Mianjie Li ◽

Xiaochen Yuan

Keyword(s):

Digital Image ◽

Image Watermarking ◽

Scale Invariant Feature Transform ◽

Digital Image Watermarking ◽

Feature Detector ◽

Scale Invariant ◽

Invariant Feature ◽

Feature Transform ◽

Scale Invariant Feature

Download Full-text

Επιτάχυνση εκτέλεσης προηγμένων αλγορίθμων επεξεργασίας εικόνας και βίντεο σε επαναδιαμορφούμενο υλικό (FPGA), για εφαρμογές ρομποτικής όρασης

10.12681/eadd/40918 ◽

2017 ◽

Author(s):

Ιωάννης Βουρβουλάκης

Keyword(s):

Random Sample ◽

Scale Space ◽

Scale Invariant Feature Transform ◽

State Machines ◽

Scale Invariant ◽

Invariant Feature ◽

Random Sample Consensus ◽

Feature Transform ◽

Scale Invariant Feature ◽

Frame Grabber

Το πρόβλημα της εύρεσης αντιστοιχιών ανάμεσα σε παρόμοιες εικόνες αποτελεί ένα από τα πιο πολυσύνθετα και δύσκολα προβλήματα στην επεξεργασία εικόνας. Η εξαγωγή χαρακτηριστικών σημείων εικόνων και η χρήση τους για την εύρεση των αντιστοιχιών αποτελεί μία μεθοδολογία που βελτιώνει την αξιοπιστία της διαδικασίας αντιστοίχησης. Στη βιβλιογραφία μπορούν να εντοπιστούν αρκετοί αλγόριθμοι για την εξαγωγή χαρακτηριστικών σημείων. Ένας από τους πιο αξιόπιστους και ακριβείς αλγορίθμους είναι ο αλγόριθμος SIFT (Scale Invariant Feature Transform). Ωστόσο, η εκτέλεσή του προϋποθέτει ιδιαίτερα απαιτητικούς υπολογισμούς και η χρήση του σε εφαρμογές πραγματικού χρόνου θα μπορούσε να χαρακτηριστεί ως αναποτελεσματική. Στα πλαίσια της παρούσας διδακτορικής διατριβής περιγράφεται η υλοποίηση σε FPGA ενός επιταχυντή για την εύρεση αντιστοιχιών ανάμεσα σε διαδοχικά πλαίσια βίντεο, χρησιμοποιώντας τα χαρακτηριστικά σημεία SIFT. Ο προτεινόμενος επιταχυντής σε FPGA πραγματοποιεί ανίχνευση και εξαγωγή των χαρακτηριστικών SIFT μέσα από μια πλήρως παραλληλισμένη (pipelined) αρχιτεκτονική. Επίσης, περιλαμβάνει τη διαδικασία αντιστοίχησης (matching) των χαρακτηριστικών σημείων ανάμεσα σε δύο πλαίσια βίντεο, η οποία σχεδιάστηκε με την αρχή να ακολουθεί την παραλληλισμένη αρχιτεκτονική των προηγούμενων βαθμίδων. Στην τελευταία βαθμίδα του επιταχυντή, εφαρμόζεται ο αλγόριθμος RANSAC (random sample consensus) για την απομάκρυνση των εσφαλμένων αντιστοιχιών. Ο RANSAC, αν και αποτελεί έναν επαναληπτικό αλγόριθμο ιδιαίτερα απαιτητικό, είναι επίσης παραλληλισμένος σε μεγάλο βαθμό και η ολοκλήρωση της εκτέλεσής του απαιτεί μερικούς κύκλους ρολογιού. Συνοψίζοντας, η αρχιτεκτονική του επιταχυντή περιλαμβάνει όλα τα στάδια που απαιτούνται από τη σύλληψη της εικόνας μέχρι και την εξαγωγή των σωστών αντιστοιχιών. Ο επιταχυντής περιλαμβάνει μία σειρά από ελεγκτές που αναπτύχθηκαν με στόχο την ελαχιστοποίηση των πόρων που απαιτούνται στο FPGA. Ο κυριότερος ελεγκτής είναι ο ελεγκτής σύλληψης των εισερχόμενων πλαισίων βίντεο (frame grabber) από την κάμερα (CMOS αισθητήρας εικόνας). Περιλαμβάνει τον ελεγκτή (I2C controller) για τη ρύθμιση της κάμερας, τον ελεγκτή για την εξαγωγή της φωτεινότητας των εικονοστοιχείων από την κωδικοποίηση Bayer, καθώς επίσης και έναν ελεγκτή VGA για οπτική επαλήθευση. Επιπλέον, για χρήση σε διάφορες λειτουργίες του επιταχυντή υλοποιήθηκαν οι ελεγκτές SPI master, ελεγκτής επικοινωνίας με συσκευή USB και ο ελεγκτής μνήμης SDR SDRAM. Στην παρούσα διατριβή προτείνονται δύο βασικές πρωτοτυπίες ως προς τον τρόπο που υλοποιείται ο ανιχνευτής SIFT (SIFT detector). Αρχικά προτείνεται μια διαφορετική τεχνική για τη δημιουργία του χώρου κλιμάκωσης (scale space). Στη βιβλιογραφία, συνήθως, συναντάται το σχήμα καταρράκτη (cascade scheme) όπου κάθε επόμενη γκαουσιανή προκύπτει από την γκαουσιανή της προηγούμενης κλίμακας. Ο προτεινόμενος επιταχυντής χρησιμοποιεί μια μέθοδο εφαρμόζοντας γκαουσιανά φίλτρα στην ίδια αρχική εικόνα με προσεκτικά επιλεγμένη την τυπική απόκλιση. Με τον τρόπο αυτό επιτυγχάνεται μείωση της απαιτούμενης μνήμης στο FPGA. Επιπλέον, με το σχήμα αυτό είναι δυνατή η επαναχρησιμοποίηση των γκαουσιανών όταν ζητούνται περισσότερες κλίμακες. Η δεύτερη πρωτοτυπία βασίζεται στον τρόπο που υλοποιείται η συνέλιξη. Συνήθως στη βιβλιογραφία συναντάται το σχήμα της διαχωρίσιμης συνέλιξης. Με το σχήμα που υλοποιείται στον επιταχυντή γίνεται εξοικονόμηση πολλαπλασιαστών, χωρίς απώλεια της ακρίβειας στον αλγόριθμο SIFT. Μια σημαντική συνεισφορά της διατριβής αποτελεί ο πλήρης παραλληλισμός του αλγορίθμου εξαγωγής χαρακτηριστικών σημείων SIFT. Η προτεινόμενη αρχιτεκτονική έχει τη δυνατότητα να εξάγει έναν περιγραφέα ανά παλμό ρολογιού. Καθώς διαβάζονται τα εικονοστοιχεία από την κάμερα με τη μορφή streaming, με τον ίδιο ρυθμό γίνεται και η εξαγωγή χαρακτηριστικών σημείων (SIFT detector/descriptor), αναφερόμενοι σε άλλα εικονοστοιχεία που διαβάστηκαν σε προηγούμενο χρόνο. Με την ίδια αρχή είναι σχεδιασμένο στον επιταχυντή και τo κύκλωμα εύρεσης αντιστοιχιών. Κάθε νέο χαρακτηριστικό, που λαμβάνεται από το τρέχον πλαίσιο βίντεο, συγκρίνεται με αποθηκευμένα χαρακτηριστικά του προηγούμενου πλαισίου και η αντιστοίχηση, αν υπάρχει, εξάγεται σε 1 παλμό ρολογιού. Θα πρέπει να αναφερθεί ότι πολύ σημαντικός είναι και ο βαθμός στον οποίο έχει παραλληλιστεί ο RANSAC. Ο RANSAC συνήθως εκτελείται επαναληπτικά και απαιτείται υπολογίσιμος χρόνος για την ολοκλήρωσή του. Για την ελάττωση του χρόνου εκτέλεσης του RANSAC, πολλές φορές χρησιμοποιούνται λιγότερα τυχαία δείγματα για τον υπολογισμό του πίνακα μετασχηματισμού. Αυτό όμως μπορεί να οδηγήσει σε μείωση της ακρίβειας στην απομάκρυνση των εσφαλμένων αντιστοιχιών, καθώς μπορεί να απορριφθούν και πραγματικές αντιστοιχήσεις. Με την προτεινόμενη υλοποίηση του RANSAC είναι δυνατή η εκτέλεση του αλγορίθμου χρησιμοποιώντας όλους τους δυνατούς συνδυασμούς των αντιστοιχιών ως τυχαία δείγματα, κάτι που προσδίδει τη μέγιστη δυνατή ακρίβεια στον πίνακα μετασχηματισμού. Η επιτάχυνση που επιτυγχάνεται στην εκτέλεση του αλγορίθμου SIFT είναι ιδιαίτερα σημαντική. Να σημειωθεί ότι ο χρόνος εξαγωγής ενός περιγραφέα SIFT υπολογίστηκε στα 40ns, περίπου 50 φορές μικρότερος σε σύγκριση με εργασίες οι οποίες υλοποιούν τον αλγόριθμο χρησιμοποιώντας μηχανές καταστάσεων (state machines). Επιπλέον, παρουσιάζεται για πρώτη φορά στη βιβλιογραφία κύκλωμα εύρεσης αντιστοιχιών, το οποίο έχει τη δυνατότητα να υπολογίζει μια αντιστοιχία σε χρόνο 80ns. Η συνολική αρχιτεκτονική ανιχνευτή/περιγραφέα/κυκλώματος εύρεσης αντιστοιχιών μπορεί να φιλοξενηθεί σε FPGA μεσαίας κλίμακας, όπως της οικογένειας Cyclone IV της Altera. Περισσότερα για την υλοποίηση των παραπάνω δίνονται στα κεφάλαια που ακολουθούν. Στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στους αλγορίθμους εξαγωγής χαρακτηριστικών σημείων σε εικόνες. Στο δεύτερο κεφάλαιο παρουσιάζεται η δομή του επιταχυντή και οι ελεγκτές που υλοποιούν τις βασικές λειτουργίες. Στο τρίτο κεφάλαιο αναλύεται ο ανιχνευτής και ο περιγραφέας των χαρακτηριστικών σημείων SIFT. Στο τέταρτο κεφάλαιο παρουσιάζεται το κύκλωμα εύρεσης αντιστοιχιών των χαρακτηριστικών σημείων (SIFT matcher). Στο πέμπτο κεφάλαιο δίνονται οι λεπτομέρειες υλοποίησης για τις αρχιτεκτονικές του RANSAC. Στο έκτο κεφάλαιο παρουσιάζονται τα συμπεράσματα και αναλύονται προοπτικές μελλοντικής έρευνας.

Download Full-text