scholarly journals GeoLOD: A Spatial Linked Data Catalog and Recommender

2021 ◽  
Vol 5 (2) ◽  
pp. 17
Author(s):  
Vasilis Kopsachilis ◽  
Michail Vaitis

The increasing availability of linked data poses new challenges for the identification and retrieval of the most appropriate data sources that meet user needs. Recent dataset catalogs and recommenders provide advanced methods that facilitate linked data search, but none exploits the spatial characteristics of datasets. In this paper, we present GeoLOD, a web catalog of spatial datasets and classes and a recommender for spatial datasets and classes possibly relevant for link discovery processes. GeoLOD Catalog parses, maintains and generates metadata about datasets and classes provided by SPARQL endpoints that contain georeferenced point instances. It offers text and map-based search functionality and dataset descriptions in GeoVoID, a spatial dataset metadata template that extends VoID. GeoLOD Recommender pre-computes and maintains, for all identified spatial classes in the Web of Data (WoD), ranked lists of classes relevant for link discovery. In addition, the on-the-fly Recommender allows users to define an uncatalogued SPARQL endpoint, a GeoJSON or a Shapefile and get class recommendations in real time. Furthermore, generated recommendations can be automatically exported in SILK and LIMES configuration files in order to be used for a link discovery task. In the results, we provide statistics about the status and potential connectivity of spatial datasets in the WoD, we assess the applicability of the recommender, and we present the outcome of a system usability study. GeoLOD is the first catalog that targets both linked data experts and geographic information systems professionals, exploits geographical characteristics of datasets and provides an exhaustive list of WoD spatial datasets and classes along with class recommendations for link discovery.

2021 ◽  
Author(s):  
Βασίλειος Κοψαχείλης

Η διάθεση των κατάλληλων εργαλείων σε επαγγελματίες, επιστήμονες και άλλους γιατην υποστήριξη της αναζήτησης γεωγραφικών δεδομένων στον ιστό και την εφαρμογήπρακτικών ενσωμάτωσής τους είναι βασική προϋπόθεση για την ολοκλήρωση πολλών εργασιών, όπως η δημιουργία χαρτών και η χωρική ανάλυση. Νέοι τρόποι δημοσίευσηςσημασιολογικά εμπλουτισμένων δεδομένων στον ιστό, σύμφωνα με τις αρχές των συνδεδεμένων δεδομένων (Linked Data), έχουν οδηγήσει στη δημιουργία ενός μοναδικού,παγκόσμιου και διασυνδεδεμένου ιστού δεδομένων (Web of Data), ο οποίος διευκολύνειτην πρόσβαση, επεξεργασία και ενσωμάτωση μεγάλων ποσοτήτων δεδομένων από διαφορετικές πηγές και παρέχει προηγμένες δυνατότητες αναζήτησης και επερωτήσεων. Σε αυτήν την έρευνα, διερευνούμε το πρόβλημα της εύρεσης σχετιζόμενων γεωγραφικών δεδομένων στον ιστό δεδομένων. Συγκεκριμένα, προτείνουμε μία μεθοδολογία αναζήτησηςσυνόλων δεδομένων για την ανακάλυψη συνδέσμων (dataset recommendation for linkdiscovery), η οποία προτείνει, σε ένα δοσμένο σύνολο δεδομένων, άλλα σύνολα δεδομένων του ιστού δεδομένων που ενδέχεται να περιέχουν σχετικές οντότητες, δηλαδήοντότητες που περιγράφουν σημασιολογικά κοντινά ή ίδια γεωγραφικά αντικείμενα τουπραγματικού κόσμου. Τα προτεινόμενα σύνολα δεδομένων μπορούν εκ των υστέρωννα χρησιμοποιηθούν ως είσοδος σε μία διαδικασία ανακάλυψης συνδέσμων (link discovery) για τη δημιουργία των συνδέσμων (π.χ. sameAs) μεταξύ των σχετικών οντοτήτων.Σε αντίθεση με τις υφιστάμενες μεθοδολογίες, οι οποίες προτείνουν σχετικά σύνολαδεδομένων με βάση την ομοιότητα των αλφαριθμητικών και της δομής τους ή την αξιοποίηση υφιστάμενων συνδέσμων μεταξύ τους, προσεγγίζουμε το πρόβλημα από μίαγεωγραφική οπτική, θεμελιώνοντας την υπόθεση ότι ‘σύνολα δεδομένων των οποίων οιοντότητες παρουσιάζουν παρόμοια χωρική κατανομή είναι πιθανό να περιέχουν σημασιολογικά σχετιζόμενες οντότητες’. Για να υποστηρίξουμε την υπόθεσή μας, υλοποιήσαμεμία πρακτική λύση, η οποία έχει εφαρμογή σε κλίμακα διαδικτύου και αρχικά δημιουργείσυνόψεις σε γεωγραφικά χαρακτηριστικά (σημειακές οντότητες) των χωρικών συνόλωνδεδομένων που παρέχονται μέσω SPARQL endpoints και στη συνέχεια εφαρμόζει μετρικέςγια τον υπολογισμό της ομοιότητάς τους. Οι συνόψεις αποτυπώνουν γεωγραφικά χαρακτηριστικά των συνόλων δεδομένων, όπως η χωρική τους έκταση και η χωρική κατανομήτων οντοτήτων τους. Διάφορες μετρικές που βασίζονται στην ομοιότητα συνόλων, στηστατιστική και στη θεωρία πληροφορίας, εφαρμόζονται στις συνόψεις των συνόλων δεδομένων για τον υπολογισμό ενός βαθμού γεωγραφικής ομοιότητας συνόλων δεδομένων.΄Ενας αλγόριθμος αναζήτησης ταξινομεί τα προτεινόμενα σύνολα δεδομένων σύμφωνα μετη γεωγραφική τους ομοιότητα, έτσι ώστε στην κορυφή της ταξινομημένης λίστας ναβρίσκονται τα σύνολα δεδομένων που είναι πιο πιθανό να περιέχουν σχετικές οντότητες με το επερωτώμενο αρχικό σύνολο δεδομένων. Διεξαγάγαμε πειράματα για την αξιολόγηση της αποτελεσματικότητας και αποδοτικότητας της μεθοδολογίας αναζήτησηςσυνόλων δεδομένων για την ανακάλυψη συνδέσμων. Σύμφωνα με τα αποτελέσματατων πειραμάτων, ο προτεινόμενος αλγόριθμος αναζήτησης παράγει ταξινομημένες λίστεςσυνόλων δεδομένων με 62% μέση ακρίβεια (Mean Average Precision), περίπου 35% υψηλότερης σε σύγκριση με απλούς εναλλακτικούς αλγόριθμους. Επίσης, μειώνει περίπουκατά 99% τον χώρο αναζήτησης για σχετικά σύνολα δεδομένων στον ιστό δεδομένων μετη χρήση αποδοτικών τεχνικών. Μία πρόσθετη συνεισφορά της εργασίας μας αφορά τηνανάπτυξη μεθόδων που παρέχουν ενιαία πρόσβαση στο σύνολο του ιστού δεδομένων καιτην παραγωγή αναφορών σχετικά με το μέγεθος και την κατάσταση του γεωγραφικούσημασιολογικού ιστού (Semantic Web) που δείχνουν ότι περίπου το 39% των συνόλωνδεδομένων του σημασιολογικού ιστού περιέχουν γεωαναφερμένη πληροφορία. Επιπλέον,προτείνουμε το GeoVoID, ένα πρότυπο μεταδεδομένων για την περιγραφή γεωγραφικώνχαρακτηριστικών των συνόλων δεδομένων όπως η χωρική τους έκταση, οι χωρικές οντολογίες που χρησιμοποιούνται και ο αριθμός των γεωγραφικών τους οντοτήτων. Το αποτέλεσμα της έρευνάς μας πραγματώνεται σε μία διαδικτυακή εφαρμογή που ονομάζεται GeoLOD και αποτελεί έναν ενδελεχή κατάλογο χωρικών συνόλων δεδομένων στον σημασιολογικό ιστό και μία online μηχανή αναζήτησης συνόλων δεδομένων για την ανακάλυψησυνδέσμων. Η GeoLOD επιτρέπει την αναζήτηση συνόλων δεδομένων μέσω χάρτη καιπαρέχει καινοτόμες λειτουργίες όπως η ζωντανή προεπισκόπηση των περιεχομένων τωνσυνόλων δεδομένων σε διαδραστικό χάρτη, η εξαγωγή αρχείων ρυθμίσεων για άμεσηχρήση από τα λογισμικά ανακάλυψης συνδέσμων Silk και LIMES και η on-the-fly πρόταση συνόλων δεδομένων για την ανακάλυψη συνδέσμων για σύνολα δεδομένων πουπαρέχονται από άγνωστα SPARQL endpoints και σε συμβατή με τα Γεωγραφικά Πληροφοριακά Συστήματα (ΓΠΣ) μορφή (π.χ. Shapefile). Η χρησιμότητα της GeoLOD για τουςεπαγγελματίες ΓΠΣ και τους ειδικούς σε θέματα συνδεδεμένων δεδομένων επιβεβαιώνεται από τα αποτελέσματα μίας διεξαχθείσας μελέτης χρηστών.


2021 ◽  
Vol 2 ◽  
pp. 1-5
Author(s):  
Mehdi Zrhal ◽  
Bénédicte Bucher ◽  
Marie-Dominique Van Damme ◽  
Fayçal Hamdi

Abstract. A growing number of spatial datasets are published every year. These can usually be found in dedicated web portals with different structures and specificities. However, finding the dataset that fits user needs is a real challenge as prior knowledge of these portals is needed to retrieve it efficiently. In this article, we present the problem of spatial dataset search and how the use of a geographic Knowledge Graph could improve it. A proposed direction for future work, extending these contributions, is then presented.


Author(s):  
Georg Neubauer

The main subject of the work is the visualization of typed links in Linked Data. The academic subjects relevant to the paper in general are the Semantic Web, the Web of Data and information visualization. The Semantic Web, invented by Tim Berners-Lee in 2001, was announced as an extension to the World Wide Web (Web 2.0). The actual area of investigation concerns the connectivity of information on the World Wide Web. To be able to explore such interconnections, visualizations are critical requirements as well as a major part of processing data in themselves. In the context of the Semantic Web, representation of information interrelations can be achieved using graphs. The aim of the article is to primarily describe the arrangement of Linked Data visualization concepts by establishing their principles in a theoretical approach. Putting design restrictions into context leads to practical guidelines. By describing the creation of two alternative visualizations of a commonly used web application representing Linked Data as network visualization, their compatibility was tested. The application-oriented part treats the design phase, its results, and future requirements of the project that can be derived from this test.


Author(s):  
Jose María Alvarez Rodríguez ◽  
José Emilio Labra Gayo ◽  
Patricia Ordoñez de Pablos

The aim of this chapter is to present a proposal and a case study to describe the information about organizations in a standard way using the Linked Data approach. Several models and ontologies have been provided in order to formalize the data, structure and behaviour of organizations. Nevertheless, these tries have not been fully accepted due to some factors: (1) missing pieces to define the status of the organization; (2) tangled parts to specify the structure (concepts and relations) between the elements of the organization; 3) lack of text properties, and other factors. These divergences imply a set of incomplete approaches to formalize data and information about organizations. Taking into account the current trends of applying semantic web technologies and linked data to formalize, aggregate, and share domain specific information, a new model for organizations taking advantage of these initiatives is required in order to overcome existing barriers and exploit the corporate information in a standard way. This work is especially relevant in some senses to: (1) unify existing models to provide a common specification; (2) apply semantic web technologies and the Linked Data approach; (3) provide access to the information via standard protocols, and (4) offer new services that can exploit this information to trace the evolution and behaviour of the organization over time. Finally, this work is interesting to improve the clarity and transparency of some scenarios in which organizations play a key role, like e-procurement, e-health, or financial transactions.


Author(s):  
Leila Zemmouchi-Ghomari

Data play a central role in the effectiveness and efficiency of web applications, such as the Semantic Web. However, data are distributed across a very large number of online sources, due to which a significant effort is needed to integrate this data for its proper utilization. A promising solution to this issue is the linked data initiative, which is based on four principles related to publishing web data and facilitating interlinked and structured online data rather than the existing web of documents. The basic ideas, techniques, and applications of the linked data initiative are surveyed in this paper. The authors discuss some Linked Data open issues and potential tracks to address these pending questions.


Author(s):  
Amrapali Zaveri ◽  
Andrea Maurino ◽  
Laure-Berti Equille

The standardization and adoption of Semantic Web technologies has resulted in an unprecedented volume of data being published as Linked Data (LD). However, the “publish first, refine later” philosophy leads to various quality problems arising in the underlying data such as incompleteness, inconsistency and semantic ambiguities. In this article, we describe the current state of Data Quality in the Web of Data along with details of the three papers accepted for the International Journal on Semantic Web and Information Systems' (IJSWIS) Special Issue on Web Data Quality. Additionally, we identify new challenges that are specific to the Web of Data and provide insights into the current progress and future directions for each of those challenges.


Author(s):  
Khayra Bencherif ◽  
Mimoun Malki ◽  
Djamel Amar Bensaber

This article describes how the Linked Open Data Cloud project allows data providers to publish structured data on the web according to the Linked Data principles. In this context, several link discovery frameworks have been developed for connecting entities contained in knowledge bases. In order to achieve a high effectiveness for the link discovery task, a suitable link configuration is required to specify the similarity conditions. Unfortunately, such configurations are specified manually; which makes the link discovery task tedious and more difficult for the users. In this article, the authors address this drawback by proposing a novel approach for the automatic determination of link specifications. The proposed approach is based on a neural network model to combine a set of existing metrics into a compound one. The authors evaluate the effectiveness of the proposed approach in three experiments using real data sets from the LOD Cloud. In addition, the proposed approach is compared against link specifications approaches to show that it outperforms them in most experiments.


Author(s):  
Christian Bizer ◽  
Tom Heath ◽  
Tim Berners-Lee

The term “Linked Data” refers to a set of best practices for publishing and connecting structured data on the Web. These best practices have been adopted by an increasing number of data providers over the last three years, leading to the creation of a global data space containing billions of assertions— the Web of Data. In this article, the authors present the concept and technical principles of Linked Data, and situate these within the broader context of related technological developments. They describe progress to date in publishing Linked Data on the Web, review applications that have been developed to exploit the Web of Data, and map out a research agenda for the Linked Data community as it moves forward.


Author(s):  
JOSEP MARIA BRUNETTI ◽  
ROSA GIL ◽  
JUAN MANUEL GIMENO ◽  
ROBERTO GARCIA

Thanks to Open Data initiatives the amount of data available on the Web is rapidly increasing. Unfortunately, most of these initiatives only publish raw tabular data, which makes its analysis and reuse very difficult. Linked Data principles allow for a more sophisticated approach by making explicit both the structure and semantics of the data. However, from the user experience viewpoint, published datasets continue to be monolithic files which are completely opaque or difficult to explore by making complex semantic queries. Our objective is to facilitate the user to grasp what kind of entities are in the dataset, how they are interrelated, which are their main properties and values, etc. Rhizomer is a data publishing tool whose interface provides a set of components borrowed from Information Architecture (IA) that facilitate getting an insight of the dataset at hand. Rhizomer automatically generates navigation menus and facets based on the kinds of things in the dataset and how they are described through metadata properties and values. This tool is currently being evaluated with end users that discover a whole new perspective of the Web of Data.


Sign in / Sign up

Export Citation Format

Share Document