Merging grid maps of different resolutions by scaling registration

Robotica ◽  
2015 ◽  
Vol 34 (11) ◽  
pp. 2516-2531 ◽  
Author(s):  
Liang Ma ◽  
Jihua Zhu ◽  
Li Zhu ◽  
Shaoyi Du ◽  
Jingru Cui

SUMMARYThis paper considers the problem of merging grid maps that have different resolutions. Because the goal of map merging is to find the optimal transformation between two partially overlapping grid maps, it can be viewed as a special image registration issue. To address this special issue, the solution considers the non-common areas and designs an objective function based on the trimmed mean-square error (MSE). The trimmed and scaling iterative closest point (TsICP) algorithm is then proposed to solve this well-designed objective function. As the TsICP algorithm can be proven to be locally convergent in theory, a good initial transformation should be provided. Accordingly, scale-invariant feature transform (SIFT) features are extracted for the maps to be potentially merged, and the random sample consensus (RANSAC) algorithm is employed to find the geometrically consistent feature matches that are used to estimate the initial transformation for the TsICP algorithm. In addition, this paper presents the rules for the fusion of the grid maps based on the estimated transformation. Experimental results carried out with publicly available datasets illustrate the superior performance of this approach at merging grid maps with respect to robustness and accuracy.

Author(s):  
X. G. Li ◽  
C. Ren ◽  
T. X. Zhang ◽  
Z. L. Zhu ◽  
Z. G. Zhang

Abstract. A UAV image matching method based on RANSAC (Random Sample Consensus) algorithm and SURF (speeded up robust features) algorithm is proposed. The SURF algorithm is integrated with fast operation and good rotation invariance, scale invariance and illumination. The brightness is invariant and the robustness is good. The RANSAC algorithm can effectively eliminate the characteristics of mismatched point pairs. The pre-verification experiment and basic verification experiment are added to the RANSAC algorithm, which improves the rejection and running speed of the algorithm. The experimental results show that compared with the SURF algorithm, SIFT (Scale Invariant Feature Transform) algorithm and ORB (Oriented FAST and Rotated BRIEF) algorithm, the proposed algorithm is superior to other algorithms in terms of matching accuracy and matching speed, and the robustness is higher.


2019 ◽  
Vol 52 (7-8) ◽  
pp. 855-868 ◽  
Author(s):  
Guo-Qin Gao ◽  
Qian Zhang ◽  
Shu Zhang

For the factors of complex image background, unobvious end-effector characteristics and uneven illumination in the pose detection of parallel robot based on binocular vision, the detection speed, and accuracy cannot meet the requirement of the closed-loop control. So a pose detection method based on improved RANSAC algorithm is presented. First, considering that the image of parallel robot is rigid and has multiple corner points, the Harris–Scale Invariant Feature Transform algorithm is adopted to realize image prematching. The feature points are extracted by Harris and matched by Scale Invariant Feature Transform to realize good accuracy and real-time performance. Second, for the mismatching from prematching, an improved RANSAC algorithm is proposed to refine the prematching results. This improved algorithm can overcome the disadvantages of mismatching and time-consuming of the conventional RANSAC algorithm by selecting feature points in separated grids of the images and predetecting to validate provisional model. The improved RANSAC algorithm was applied to a self-developed novel 3-degrees of freedom parallel robot to verify the validity. The experiment results show that, compared with the conventional algorithm, the average matching time decreases by 63.45%, the average matching accuracy increases by 15.66%, the average deviations of pose detection in Y direction, Z direction, and roll angle [Formula: see text] decrease by 0.871 mm, 0.82 mm, and 0.704°, respectively, using improved algorithm to refine the prematching results. The real-time performance and accuracy of pose detection of parallel robot can be improved.


2014 ◽  
Vol 23 (08) ◽  
pp. 1450118 ◽  
Author(s):  
ALEJANDRO HIDALGO-PANIAGUA ◽  
MIGUEL A. VEGA-RODRÍGUEZ ◽  
NIEVES PAVÓN ◽  
JOAQUÍN FERRUZ

In the field of robotics, one of the essential tasks for a robot to accomplish its goals is to know its own location. The localization problem is a complex task and, usually, different systems, methods and sensors are needed to achieve it. One of these methods is the iterative closest points (ICP) algorithm. The main problem that ICP presents is its high computational time. Due to this, it is common to filter its input data before calculating the final transformation. In this paper, a comparative study in terms of precision and execution time among the most popular filters used in combination with the ICP is presented. The study indicates that the scale-invariant feature transform (SIFT) is the filter that better improves the execution time, while its combination with the RANdom SAmple Consensus (RANSAC) obtains better precision results.


2017 ◽  
Author(s):  
Ιωάννης Βουρβουλάκης

Το πρόβλημα της εύρεσης αντιστοιχιών ανάμεσα σε παρόμοιες εικόνες αποτελεί ένα από τα πιο πολυσύνθετα και δύσκολα προβλήματα στην επεξεργασία εικόνας. Η εξαγωγή χαρακτηριστικών σημείων εικόνων και η χρήση τους για την εύρεση των αντιστοιχιών αποτελεί μία μεθοδολογία που βελτιώνει την αξιοπιστία της διαδικασίας αντιστοίχησης. Στη βιβλιογραφία μπορούν να εντοπιστούν αρκετοί αλγόριθμοι για την εξαγωγή χαρακτηριστικών σημείων. Ένας από τους πιο αξιόπιστους και ακριβείς αλγορίθμους είναι ο αλγόριθμος SIFT (Scale Invariant Feature Transform). Ωστόσο, η εκτέλεσή του προϋποθέτει ιδιαίτερα απαιτητικούς υπολογισμούς και η χρήση του σε εφαρμογές πραγματικού χρόνου θα μπορούσε να χαρακτηριστεί ως αναποτελεσματική. Στα πλαίσια της παρούσας διδακτορικής διατριβής περιγράφεται η υλοποίηση σε FPGA ενός επιταχυντή για την εύρεση αντιστοιχιών ανάμεσα σε διαδοχικά πλαίσια βίντεο, χρησιμοποιώντας τα χαρακτηριστικά σημεία SIFT. Ο προτεινόμενος επιταχυντής σε FPGA πραγματοποιεί ανίχνευση και εξαγωγή των χαρακτηριστικών SIFT μέσα από μια πλήρως παραλληλισμένη (pipelined) αρχιτεκτονική. Επίσης, περιλαμβάνει τη διαδικασία αντιστοίχησης (matching) των χαρακτηριστικών σημείων ανάμεσα σε δύο πλαίσια βίντεο, η οποία σχεδιάστηκε με την αρχή να ακολουθεί την παραλληλισμένη αρχιτεκτονική των προηγούμενων βαθμίδων. Στην τελευταία βαθμίδα του επιταχυντή, εφαρμόζεται ο αλγόριθμος RANSAC (random sample consensus) για την απομάκρυνση των εσφαλμένων αντιστοιχιών. Ο RANSAC, αν και αποτελεί έναν επαναληπτικό αλγόριθμο ιδιαίτερα απαιτητικό, είναι επίσης παραλληλισμένος σε μεγάλο βαθμό και η ολοκλήρωση της εκτέλεσής του απαιτεί μερικούς κύκλους ρολογιού. Συνοψίζοντας, η αρχιτεκτονική του επιταχυντή περιλαμβάνει όλα τα στάδια που απαιτούνται από τη σύλληψη της εικόνας μέχρι και την εξαγωγή των σωστών αντιστοιχιών. Ο επιταχυντής περιλαμβάνει μία σειρά από ελεγκτές που αναπτύχθηκαν με στόχο την ελαχιστοποίηση των πόρων που απαιτούνται στο FPGA. Ο κυριότερος ελεγκτής είναι ο ελεγκτής σύλληψης των εισερχόμενων πλαισίων βίντεο (frame grabber) από την κάμερα (CMOS αισθητήρας εικόνας). Περιλαμβάνει τον ελεγκτή (I2C controller) για τη ρύθμιση της κάμερας, τον ελεγκτή για την εξαγωγή της φωτεινότητας των εικονοστοιχείων από την κωδικοποίηση Bayer, καθώς επίσης και έναν ελεγκτή VGA για οπτική επαλήθευση. Επιπλέον, για χρήση σε διάφορες λειτουργίες του επιταχυντή υλοποιήθηκαν οι ελεγκτές SPI master, ελεγκτής επικοινωνίας με συσκευή USB και ο ελεγκτής μνήμης SDR SDRAM. Στην παρούσα διατριβή προτείνονται δύο βασικές πρωτοτυπίες ως προς τον τρόπο που υλοποιείται ο ανιχνευτής SIFT (SIFT detector). Αρχικά προτείνεται μια διαφορετική τεχνική για τη δημιουργία του χώρου κλιμάκωσης (scale space). Στη βιβλιογραφία, συνήθως, συναντάται το σχήμα καταρράκτη (cascade scheme) όπου κάθε επόμενη γκαουσιανή προκύπτει από την γκαουσιανή της προηγούμενης κλίμακας. Ο προτεινόμενος επιταχυντής χρησιμοποιεί μια μέθοδο εφαρμόζοντας γκαουσιανά φίλτρα στην ίδια αρχική εικόνα με προσεκτικά επιλεγμένη την τυπική απόκλιση. Με τον τρόπο αυτό επιτυγχάνεται μείωση της απαιτούμενης μνήμης στο FPGA. Επιπλέον, με το σχήμα αυτό είναι δυνατή η επαναχρησιμοποίηση των γκαουσιανών όταν ζητούνται περισσότερες κλίμακες. Η δεύτερη πρωτοτυπία βασίζεται στον τρόπο που υλοποιείται η συνέλιξη. Συνήθως στη βιβλιογραφία συναντάται το σχήμα της διαχωρίσιμης συνέλιξης. Με το σχήμα που υλοποιείται στον επιταχυντή γίνεται εξοικονόμηση πολλαπλασιαστών, χωρίς απώλεια της ακρίβειας στον αλγόριθμο SIFT. Μια σημαντική συνεισφορά της διατριβής αποτελεί ο πλήρης παραλληλισμός του αλγορίθμου εξαγωγής χαρακτηριστικών σημείων SIFT. Η προτεινόμενη αρχιτεκτονική έχει τη δυνατότητα να εξάγει έναν περιγραφέα ανά παλμό ρολογιού. Καθώς διαβάζονται τα εικονοστοιχεία από την κάμερα με τη μορφή streaming, με τον ίδιο ρυθμό γίνεται και η εξαγωγή χαρακτηριστικών σημείων (SIFT detector/descriptor), αναφερόμενοι σε άλλα εικονοστοιχεία που διαβάστηκαν σε προηγούμενο χρόνο. Με την ίδια αρχή είναι σχεδιασμένο στον επιταχυντή και τo κύκλωμα εύρεσης αντιστοιχιών. Κάθε νέο χαρακτηριστικό, που λαμβάνεται από το τρέχον πλαίσιο βίντεο, συγκρίνεται με αποθηκευμένα χαρακτηριστικά του προηγούμενου πλαισίου και η αντιστοίχηση, αν υπάρχει, εξάγεται σε 1 παλμό ρολογιού. Θα πρέπει να αναφερθεί ότι πολύ σημαντικός είναι και ο βαθμός στον οποίο έχει παραλληλιστεί ο RANSAC. Ο RANSAC συνήθως εκτελείται επαναληπτικά και απαιτείται υπολογίσιμος χρόνος για την ολοκλήρωσή του. Για την ελάττωση του χρόνου εκτέλεσης του RANSAC, πολλές φορές χρησιμοποιούνται λιγότερα τυχαία δείγματα για τον υπολογισμό του πίνακα μετασχηματισμού. Αυτό όμως μπορεί να οδηγήσει σε μείωση της ακρίβειας στην απομάκρυνση των εσφαλμένων αντιστοιχιών, καθώς μπορεί να απορριφθούν και πραγματικές αντιστοιχήσεις. Με την προτεινόμενη υλοποίηση του RANSAC είναι δυνατή η εκτέλεση του αλγορίθμου χρησιμοποιώντας όλους τους δυνατούς συνδυασμούς των αντιστοιχιών ως τυχαία δείγματα, κάτι που προσδίδει τη μέγιστη δυνατή ακρίβεια στον πίνακα μετασχηματισμού. Η επιτάχυνση που επιτυγχάνεται στην εκτέλεση του αλγορίθμου SIFT είναι ιδιαίτερα σημαντική. Να σημειωθεί ότι ο χρόνος εξαγωγής ενός περιγραφέα SIFT υπολογίστηκε στα 40ns, περίπου 50 φορές μικρότερος σε σύγκριση με εργασίες οι οποίες υλοποιούν τον αλγόριθμο χρησιμοποιώντας μηχανές καταστάσεων (state machines). Επιπλέον, παρουσιάζεται για πρώτη φορά στη βιβλιογραφία κύκλωμα εύρεσης αντιστοιχιών, το οποίο έχει τη δυνατότητα να υπολογίζει μια αντιστοιχία σε χρόνο 80ns. Η συνολική αρχιτεκτονική ανιχνευτή/περιγραφέα/κυκλώματος εύρεσης αντιστοιχιών μπορεί να φιλοξενηθεί σε FPGA μεσαίας κλίμακας, όπως της οικογένειας Cyclone IV της Altera. Περισσότερα για την υλοποίηση των παραπάνω δίνονται στα κεφάλαια που ακολουθούν. Στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στους αλγορίθμους εξαγωγής χαρακτηριστικών σημείων σε εικόνες. Στο δεύτερο κεφάλαιο παρουσιάζεται η δομή του επιταχυντή και οι ελεγκτές που υλοποιούν τις βασικές λειτουργίες. Στο τρίτο κεφάλαιο αναλύεται ο ανιχνευτής και ο περιγραφέας των χαρακτηριστικών σημείων SIFT. Στο τέταρτο κεφάλαιο παρουσιάζεται το κύκλωμα εύρεσης αντιστοιχιών των χαρακτηριστικών σημείων (SIFT matcher). Στο πέμπτο κεφάλαιο δίνονται οι λεπτομέρειες υλοποίησης για τις αρχιτεκτονικές του RANSAC. Στο έκτο κεφάλαιο παρουσιάζονται τα συμπεράσματα και αναλύονται προοπτικές μελλοντικής έρευνας.


Nowadays new and creative methods of forging images are developed with the invention of sophisticated softwares like Adobe photoshop. Tools available in such softwares will make the forged image look real which cannot be even identified by a naked eye. In this paper, key point based approach of taking out features using Scale Invariant Feature Transform (SIFT) is used. The feature points thus extracted are then modeled to get a set of triangles using Delaunay Triangulation method. These triangles are matched using mean vertex descriptor and the removal of false positives is done using the method of Random Sample Consensus (RANSAC). Implementation show that the proposed approach outdoes the equivalent methods


2014 ◽  
Vol 602-605 ◽  
pp. 3181-3184 ◽  
Author(s):  
Mu Yi Yin ◽  
Fei Guan ◽  
Peng Ding ◽  
Zhong Feng Liu

With the aim to solve the implement problem in scale invariant feature transform (SIFT) algorithm, the theory and the implementation process was analyzed in detail. The characteristics of the SIFT method were analyzed by theory, combined with the explanation of the Rob Hess SIFT source codes. The effect of the SIFT method was validated by matching two different real images. The matching result shows that the features extracted by SIFT method have excellent adaptive and accurate characteristics to image scale, viewpoint change, which are useful for the fields of image recognition, image reconstruction, etc.


2012 ◽  
Vol 151 ◽  
pp. 458-462
Author(s):  
Ming Xin ◽  
Sheng Wei Li ◽  
Miao Hui Zhang

Few literatures employ SIFT (scale-invariant feature transform) for tracking because it is time-consuming. However, we found that SIFT can be adapted to real-time tracking by employing it on a subarea of the whole image. In this paper the particle filter based method exploits SIFT features to handle challenging scenarios such as partial occlusions, scale variations and moderate deformations. As proposed in our method, not a brute-force feature extraction in the whole image, we firstly extract SIFT keypoints in the object search region only for once, through matching SIFT features between object search region and object template, the number of matched keypoints is obtained, which is utilized to compute the particle weights. Finally, we can obtain an optimal estimate to object location by the particle filter framework. Comparative experiments with quantitative evaluations are provided, which indicate that the proposed method is both robust and faster.


2012 ◽  
Vol 424-425 ◽  
pp. 784-788
Author(s):  
Yang Yu ◽  
Min Zhang ◽  
Guo Hua Zhang ◽  
Jie Niu

Based on the algorithm of Scale invariant feature transform SIFT, informed a method to detection the airport runway foreign objects based on the algorithm of improved SIFT, first roughly extracts object through the image segmentation algorithm, then match the object on it’s SIFT features, ensure it’s features stability, enhance the matching accuracy. Experimental results show that this method can not only handle the problems of tar-get losing evidently, which are induced by objects rotation and translation, but also has nice robustness to the conjunction of multi-targets in the process of object tracking


Sign in / Sign up

Export Citation Format

Share Document