Analysis of image stitching error based on scale invariant feature transform and random sample consensus

Το πρόβλημα της εύρεσης αντιστοιχιών ανάμεσα σε παρόμοιες εικόνες αποτελεί ένα από τα πιο πολυσύνθετα και δύσκολα προβλήματα στην επεξεργασία εικόνας. Η εξαγωγή χαρακτηριστικών σημείων εικόνων και η χρήση τους για την εύρεση των αντιστοιχιών αποτελεί μία μεθοδολογία που βελτιώνει την αξιοπιστία της διαδικασίας αντιστοίχησης. Στη βιβλιογραφία μπορούν να εντοπιστούν αρκετοί αλγόριθμοι για την εξαγωγή χαρακτηριστικών σημείων. Ένας από τους πιο αξιόπιστους και ακριβείς αλγορίθμους είναι ο αλγόριθμος SIFT (Scale Invariant Feature Transform). Ωστόσο, η εκτέλεσή του προϋποθέτει ιδιαίτερα απαιτητικούς υπολογισμούς και η χρήση του σε εφαρμογές πραγματικού χρόνου θα μπορούσε να χαρακτηριστεί ως αναποτελεσματική. Στα πλαίσια της παρούσας διδακτορικής διατριβής περιγράφεται η υλοποίηση σε FPGA ενός επιταχυντή για την εύρεση αντιστοιχιών ανάμεσα σε διαδοχικά πλαίσια βίντεο, χρησιμοποιώντας τα χαρακτηριστικά σημεία SIFT. Ο προτεινόμενος επιταχυντής σε FPGA πραγματοποιεί ανίχνευση και εξαγωγή των χαρακτηριστικών SIFT μέσα από μια πλήρως παραλληλισμένη (pipelined) αρχιτεκτονική. Επίσης, περιλαμβάνει τη διαδικασία αντιστοίχησης (matching) των χαρακτηριστικών σημείων ανάμεσα σε δύο πλαίσια βίντεο, η οποία σχεδιάστηκε με την αρχή να ακολουθεί την παραλληλισμένη αρχιτεκτονική των προηγούμενων βαθμίδων. Στην τελευταία βαθμίδα του επιταχυντή, εφαρμόζεται ο αλγόριθμος RANSAC (random sample consensus) για την απομάκρυνση των εσφαλμένων αντιστοιχιών. Ο RANSAC, αν και αποτελεί έναν επαναληπτικό αλγόριθμο ιδιαίτερα απαιτητικό, είναι επίσης παραλληλισμένος σε μεγάλο βαθμό και η ολοκλήρωση της εκτέλεσής του απαιτεί μερικούς κύκλους ρολογιού. Συνοψίζοντας, η αρχιτεκτονική του επιταχυντή περιλαμβάνει όλα τα στάδια που απαιτούνται από τη σύλληψη της εικόνας μέχρι και την εξαγωγή των σωστών αντιστοιχιών. Ο επιταχυντής περιλαμβάνει μία σειρά από ελεγκτές που αναπτύχθηκαν με στόχο την ελαχιστοποίηση των πόρων που απαιτούνται στο FPGA. Ο κυριότερος ελεγκτής είναι ο ελεγκτής σύλληψης των εισερχόμενων πλαισίων βίντεο (frame grabber) από την κάμερα (CMOS αισθητήρας εικόνας). Περιλαμβάνει τον ελεγκτή (I2C controller) για τη ρύθμιση της κάμερας, τον ελεγκτή για την εξαγωγή της φωτεινότητας των εικονοστοιχείων από την κωδικοποίηση Bayer, καθώς επίσης και έναν ελεγκτή VGA για οπτική επαλήθευση. Επιπλέον, για χρήση σε διάφορες λειτουργίες του επιταχυντή υλοποιήθηκαν οι ελεγκτές SPI master, ελεγκτής επικοινωνίας με συσκευή USB και ο ελεγκτής μνήμης SDR SDRAM. Στην παρούσα διατριβή προτείνονται δύο βασικές πρωτοτυπίες ως προς τον τρόπο που υλοποιείται ο ανιχνευτής SIFT (SIFT detector). Αρχικά προτείνεται μια διαφορετική τεχνική για τη δημιουργία του χώρου κλιμάκωσης (scale space). Στη βιβλιογραφία, συνήθως, συναντάται το σχήμα καταρράκτη (cascade scheme) όπου κάθε επόμενη γκαουσιανή προκύπτει από την γκαουσιανή της προηγούμενης κλίμακας. Ο προτεινόμενος επιταχυντής χρησιμοποιεί μια μέθοδο εφαρμόζοντας γκαουσιανά φίλτρα στην ίδια αρχική εικόνα με προσεκτικά επιλεγμένη την τυπική απόκλιση. Με τον τρόπο αυτό επιτυγχάνεται μείωση της απαιτούμενης μνήμης στο FPGA. Επιπλέον, με το σχήμα αυτό είναι δυνατή η επαναχρησιμοποίηση των γκαουσιανών όταν ζητούνται περισσότερες κλίμακες. Η δεύτερη πρωτοτυπία βασίζεται στον τρόπο που υλοποιείται η συνέλιξη. Συνήθως στη βιβλιογραφία συναντάται το σχήμα της διαχωρίσιμης συνέλιξης. Με το σχήμα που υλοποιείται στον επιταχυντή γίνεται εξοικονόμηση πολλαπλασιαστών, χωρίς απώλεια της ακρίβειας στον αλγόριθμο SIFT. Μια σημαντική συνεισφορά της διατριβής αποτελεί ο πλήρης παραλληλισμός του αλγορίθμου εξαγωγής χαρακτηριστικών σημείων SIFT. Η προτεινόμενη αρχιτεκτονική έχει τη δυνατότητα να εξάγει έναν περιγραφέα ανά παλμό ρολογιού. Καθώς διαβάζονται τα εικονοστοιχεία από την κάμερα με τη μορφή streaming, με τον ίδιο ρυθμό γίνεται και η εξαγωγή χαρακτηριστικών σημείων (SIFT detector/descriptor), αναφερόμενοι σε άλλα εικονοστοιχεία που διαβάστηκαν σε προηγούμενο χρόνο. Με την ίδια αρχή είναι σχεδιασμένο στον επιταχυντή και τo κύκλωμα εύρεσης αντιστοιχιών. Κάθε νέο χαρακτηριστικό, που λαμβάνεται από το τρέχον πλαίσιο βίντεο, συγκρίνεται με αποθηκευμένα χαρακτηριστικά του προηγούμενου πλαισίου και η αντιστοίχηση, αν υπάρχει, εξάγεται σε 1 παλμό ρολογιού. Θα πρέπει να αναφερθεί ότι πολύ σημαντικός είναι και ο βαθμός στον οποίο έχει παραλληλιστεί ο RANSAC. Ο RANSAC συνήθως εκτελείται επαναληπτικά και απαιτείται υπολογίσιμος χρόνος για την ολοκλήρωσή του. Για την ελάττωση του χρόνου εκτέλεσης του RANSAC, πολλές φορές χρησιμοποιούνται λιγότερα τυχαία δείγματα για τον υπολογισμό του πίνακα μετασχηματισμού. Αυτό όμως μπορεί να οδηγήσει σε μείωση της ακρίβειας στην απομάκρυνση των εσφαλμένων αντιστοιχιών, καθώς μπορεί να απορριφθούν και πραγματικές αντιστοιχήσεις. Με την προτεινόμενη υλοποίηση του RANSAC είναι δυνατή η εκτέλεση του αλγορίθμου χρησιμοποιώντας όλους τους δυνατούς συνδυασμούς των αντιστοιχιών ως τυχαία δείγματα, κάτι που προσδίδει τη μέγιστη δυνατή ακρίβεια στον πίνακα μετασχηματισμού. Η επιτάχυνση που επιτυγχάνεται στην εκτέλεση του αλγορίθμου SIFT είναι ιδιαίτερα σημαντική. Να σημειωθεί ότι ο χρόνος εξαγωγής ενός περιγραφέα SIFT υπολογίστηκε στα 40ns, περίπου 50 φορές μικρότερος σε σύγκριση με εργασίες οι οποίες υλοποιούν τον αλγόριθμο χρησιμοποιώντας μηχανές καταστάσεων (state machines). Επιπλέον, παρουσιάζεται για πρώτη φορά στη βιβλιογραφία κύκλωμα εύρεσης αντιστοιχιών, το οποίο έχει τη δυνατότητα να υπολογίζει μια αντιστοιχία σε χρόνο 80ns. Η συνολική αρχιτεκτονική ανιχνευτή/περιγραφέα/κυκλώματος εύρεσης αντιστοιχιών μπορεί να φιλοξενηθεί σε FPGA μεσαίας κλίμακας, όπως της οικογένειας Cyclone IV της Altera. Περισσότερα για την υλοποίηση των παραπάνω δίνονται στα κεφάλαια που ακολουθούν. Στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στους αλγορίθμους εξαγωγής χαρακτηριστικών σημείων σε εικόνες. Στο δεύτερο κεφάλαιο παρουσιάζεται η δομή του επιταχυντή και οι ελεγκτές που υλοποιούν τις βασικές λειτουργίες. Στο τρίτο κεφάλαιο αναλύεται ο ανιχνευτής και ο περιγραφέας των χαρακτηριστικών σημείων SIFT. Στο τέταρτο κεφάλαιο παρουσιάζεται το κύκλωμα εύρεσης αντιστοιχιών των χαρακτηριστικών σημείων (SIFT matcher). Στο πέμπτο κεφάλαιο δίνονται οι λεπτομέρειες υλοποίησης για τις αρχιτεκτονικές του RANSAC. Στο έκτο κεφάλαιο παρουσιάζονται τα συμπεράσματα και αναλύονται προοπτικές μελλοντικής έρευνας.

Download Full-text

Mean Shift tracking for video moving objects in combination with scale invariant feature transform and Kalman filter

Journal of Computer Applications ◽

10.3724/sp.j.1087.2013.03179 ◽

2013 ◽

Vol 33 (11) ◽

pp. 3179-3182 ◽

Cited By ~ 1

Author(s):

Zhiling ZHU ◽

Qiuqi RUAN

Keyword(s):

Kalman Filter ◽

Moving Objects ◽

Mean Shift ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Invariant Feature ◽

Feature Transform ◽

Scale Invariant Feature

Download Full-text

Electronic image stabilization algorithm using improved scale invariant feature transform

Journal of Computer Applications ◽

10.3724/sp.j.1087.2012.02817 ◽

2013 ◽

Vol 32 (10) ◽

pp. 2817-2820

Author(s):

Bo MENG ◽

Guang-liang HAN

Keyword(s):

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Image Stabilization ◽

Invariant Feature ◽

Feature Transform ◽

Scale Invariant Feature

Download Full-text

Non-rigid Medical Image Registration Based on Improved Optical Flow Method and Scale-invariant Feature Transform

JOURNAL OF ELECTRONICS INFORMATION TECHNOLOGY ◽

10.3724/sp.j.1146.2012.01142 ◽

2014 ◽

Vol 35 (5) ◽

pp. 1222-1228 ◽

Cited By ~ 1

Author(s):

Jie-yu Wang ◽

Jia-jun Wang ◽

Jing-ya Zhang

Keyword(s):

Image Registration ◽

Optical Flow ◽

Medical Image ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Flow Method ◽

Optical Flow Method ◽

Invariant Feature ◽

Feature Transform ◽

Scale Invariant Feature

Download Full-text

The object recognition based on Scale-Invariant feature transform and hybrid segmentation

2012 ELEKTRO ◽

10.1109/elektro.2012.6225582 ◽

2012 ◽

Author(s):

Martina Zachariasova ◽

Robert Hudec ◽

Miroslav Benco ◽

Patrik Kamencay

Keyword(s):

Object Recognition ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Invariant Feature ◽

Feature Transform ◽

Hybrid Segmentation ◽

Scale Invariant Feature

Download Full-text

Implementation of SIFT for detection of electronic waste

International Journal of Engineering & Technology ◽

10.14419/ijet.v7i2.8.10461 ◽

2018 ◽

Vol 7 (2.8) ◽

pp. 353

Author(s):

A Roshna Meeran ◽

V Nithya

Keyword(s):

Image Processing ◽

Electronic Waste ◽

Scale Invariant Feature Transform ◽

Recycling Process ◽

Scale Invariant ◽

Object Matching ◽

Invariant Feature ◽

Detection And Identification ◽

Feature Transform ◽

Scale Invariant Feature

The paper focuses on the investigation of image processing of Electronic waste detection and identification in recycling process of all Electronic items. Some of actually collected images of E-wastes would be combined with other wastes. For object matching with scale in-variance the SIFT (Scale -Invariant- Feature Transform) is applied. This method detects the electronic waste found among other wastes and also estimates the amount of electronic waste detected the give set of wastes. The detection of electronics waste by this method is most efficient ways to detect automatically without any manual means.

Download Full-text

Object Recognition by Modified Scale Invariant Feature Transform

2008 Third International Workshop on Semantic Media Adaptation and Personalization ◽

10.1109/smap.2008.12 ◽

2008 ◽

Cited By ~ 1

Author(s):

Gul-e-Saman ◽

S. Asif M. Gilani

Keyword(s):

Object Recognition ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Invariant Feature ◽

Feature Transform ◽

Scale Invariant Feature

Download Full-text

Face Recognition System Using a Hybrid Scale Invariant Feature Transform Based on Local Binary Pattern

Advances in Intelligent Systems and Computing - Image Processing and Capsule Networks ◽

10.1007/978-3-030-51859-2_72 ◽

2020 ◽

pp. 794-804

Author(s):

M. Koteswara Rao ◽

K. Veera Swamy ◽

K. Anitha Sheela

Keyword(s):

Face Recognition ◽

Local Binary Pattern ◽

Recognition System ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Invariant Feature ◽

Face Recognition System ◽

Feature Transform ◽

Scale Invariant Feature

Download Full-text

Scale-Invariant Feature Transform Algorithm with Fast Approximate Nearest Neighbor

Baghdad Science Journal ◽

10.21123/bsj.14.3.651-661 ◽

2017 ◽

Vol 14 (3) ◽

pp. 651-661 ◽

Cited By ~ 1

Author(s):

Baghdad Science Journal

Keyword(s):

Nearest Neighbor ◽

Daily Basis ◽

Scale Invariant Feature Transform ◽

Scale Invariant ◽

Suggested Approach ◽

Approximate Nearest Neighbor ◽

Invariant Feature ◽

Key Points ◽

Feature Transform ◽

Scale Invariant Feature

There is a great deal of systems dealing with image processing that are being used and developed on a daily basis. Those systems need the deployment of some basic operations such as detecting the Regions of Interest and matching those regions, in addition to the description of their properties. Those operations play a significant role in decision making which is necessary for the next operations depending on the assigned task. In order to accomplish those tasks, various algorithms have been introduced throughout years. One of the most popular algorithms is the Scale Invariant Feature Transform (SIFT). The efficiency of this algorithm is its performance in the process of detection and property description, and that is due to the fact that it operates on a big number of key-points, the only drawback it has is that it is rather time consuming. In the suggested approach, the system deploys SIFT to perform its basic tasks of matching and description is focused on minimizing the number of key-points which is performed via applying Fast Approximate Nearest Neighbor algorithm, which will reduce the redundancy of matching leading to speeding up the process. The proposed application has been evaluated in terms of two criteria which are time and accuracy, and has accomplished a percentage of accuracy of up to 100%, in addition to speeding up the processes of matching and description.

Download Full-text