Protein ontology on the semantic web for knowledge discovery

Abstract The Protein Ontology (PRO) provides an ontological representation of protein-related entities, ranging from protein families to proteoforms to complexes. Protein Ontology Linked Open Data (LOD) exposes, shares, and connects knowledge about protein-related entities on the Semantic Web using Resource Description Framework (RDF), thus enabling integration with other Linked Open Data for biological knowledge discovery. For example, proteins (or variants thereof) can be retrieved on the basis of specific disease associations. As a community resource, we strive to follow the Findability, Accessibility, Interoperability, and Reusability (FAIR) principles, disseminate regular updates of our data, support multiple methods for accessing, querying and downloading data in various formats, and provide documentation both for scientists and programmers. PRO Linked Open Data can be browsed via faceted browser interface and queried using SPARQL via YASGUI. RDF data dumps are also available for download. Additionally, we developed RESTful APIs to support programmatic data access. We also provide W3C HCLS specification compliant metadata description for our data. The PRO Linked Open Data is available at https://lod.proconsortium.org/.

Download Full-text

Linked Open Statistical Metadata

Data Visualization and Statistical Literacy for Open and Big Data - Advances in Data Mining and Database Management ◽

10.4018/978-1-5225-2512-7.ch012 ◽

2017 ◽

pp. 297-320

Author(s):

Franck Cotton ◽

Daniel Gillman

Keyword(s):

Semantic Web ◽

Resource Description Framework ◽

Statistical Data ◽

Open Data ◽

Statistical Analyses ◽

Statistical Literacy ◽

Statistical Process ◽

Description Framework ◽

Resource Description ◽

The Web

Linked Open Statistical Metadata (LOSM) is Linked Open Data (LOD) applied to statistical metadata. LOD is a model for identifying, structuring, interlinking, and querying data published directly on the web. It builds on the standards of the semantic web defined by the W3C. LOD uses the Resource Description Framework (RDF), a simple data model expressing content as predicates linking resources between them or with literal properties. The simplicity of the model makes it able to represent any data, including metadata. We define statistical data as data produced through some statistical process or intended for statistical analyses, and statistical metadata as metadata describing statistical data. LOSM promotes discovery and the meaning and structure of statistical data in an automated way. Consequently, it helps with understanding and interpreting data and preventing inadequate or flawed visualizations for statistical data. This enhances statistical literacy and efforts at visualizing statistics.

Download Full-text

Evaluating the quality of linked open data in digital libraries

Journal of Information Science ◽

10.1177/0165551520930951 ◽

2020 ◽

pp. 016555152093095

Author(s):

Gustavo Candela ◽

Pilar Escobar ◽

Rafael C Carrasco ◽

Manuel Marco-Such

Keyword(s):

Digital Libraries ◽

Open Data ◽

Quality Measures ◽

Linked Open Data ◽

Data Sets ◽

Design And Implementation ◽

Bibliographic Data ◽

Description Framework ◽

Resource Description

Cultural heritage institutions have recently started to share their metadata as Linked Open Data (LOD) in order to disseminate and enrich them. The publication of large bibliographic data sets as LOD is a challenge that requires the design and implementation of custom methods for the transformation, management, querying and enrichment of the data. In this report, the methodology defined by previous research for the evaluation of the quality of LOD is analysed and adapted to the specific case of Resource Description Framework (RDF) triples containing standard bibliographic information. The specified quality measures are reported in the case of four highly relevant libraries.

Download Full-text

Modelo de dados abertos conectados para informação legislativa

Informação & Sociedade: Estudos ◽

10.22478/ufpb.1809-4783.2018v28n2.37979 ◽

2018 ◽

Vol 28 (2) ◽

Author(s):

Mariana Baptista Brandt ◽

Silvana Aparecida Borsetti Gregorio Vidotti ◽

José Eduardo Santarem Segundo

Keyword(s):

Resource Description Framework ◽

Linked Data ◽

World Wide ◽

Open Data ◽

Linked Open Data ◽

Dublin Core ◽

Description Framework ◽

E Mail ◽

Resource Description ◽

Rdf Schema

A presente pesquisa objetiva propor um modelo de dados abertos conectados (linked open data - LOD), para um conjunto de dados abertos legislativos da Câmara dos Deputados. Para tanto, procede-se à revisão de literatura sobre os conceitos de dados abertos, dados abertos governamentais, dados conectados (linked data), e dados abertos conectados (linked open data), seguido de pesquisa aplicada, com a modelagem de dados legislativos no modelo LOD. Para esta pesquisa foi selecionado o conjunto de dados "Deputados", que contém informações como partido político, unidade federativa, e-mail, legislatura, entre outras, sobre os parlamentares. Desse modo, observa-se que a estruturação do conjunto de dados em RDF (Resource Description Framework) é possível com reuso de vocabulários e padrões já estabelecidos na Web Semântica como Dublin Core, Friend of a Friend (FOAF), RDF e RDF Schema, além de vocabulários de áreas correlatas, como a Ontologia da Câmara dos Deputados italiana e a da Assembleia Nacional Francesa. Conforme recomendação do padrão Linked Data, os recursos foram relacionados também a outros conjuntos de LOD para enriquecimento semântico, como as bases Geonames e DBpedia. O estudo que permite concluir que a disponibilização dos dados governamentais, em especial, dados legislativos, pode ser feita seguindo as recomendações da W3C (World Wide Web Consortium) e, assim, integrar os dados legislativos à Web de Dados e ampliar as possibilidades de reuso e aplicações dos dados em ações de transparência e fiscalização, aproximando os cidadãos do Congresso e de seus representantes.

Download Full-text

Extraction Patterns to Derive Social Networks from Linked Open Data Using SPARQL

Information ◽

10.3390/info11070361 ◽

2020 ◽

Vol 11 (7) ◽

pp. 361 ◽

Cited By ~ 1

Author(s):

Raji Ghawi ◽

Jürgen Pfeffer

Keyword(s):

Social Networks ◽

Social Network ◽

Network Analysis ◽

Social Relations ◽

World Wide ◽

Open Data ◽

Linked Open Data ◽

The World ◽

Description Framework ◽

Resource Description

Linked Open Data (LOD) refers to freely available data on the World Wide Web that are typically represented using the Resource Description Framework (RDF) and standards built on it. LOD is an invaluable resource of information due to its richness and openness, which create new opportunities for many areas of application. In this paper, we address the exploitation of LOD by utilizing SPARQL queries in order to extract social networks among entities. This enables the application of de-facto techniques from Social Network Analysis (SNA) to study social relations and interactions among entities, providing deep insights into their latent social structure.

Download Full-text

DisGeNET-RDF: harnessing the innovative power of the Semantic Web to explore the genetic basis of diseases

10.1101/032961 ◽

2015 ◽

Author(s):

Nuria Queralt Rosinach ◽

Janet Pinero ◽

Alex Bravo Serrano ◽

Ferran Sanz ◽

Laura I Furlong

Keyword(s):

Semantic Web ◽

Translational Research ◽

Genetic Basis ◽

Open Data ◽

Linked Open Data ◽

Human Diseases ◽

Evidence Based ◽

Web Resources ◽

Disease Associations ◽

Biomedical Databases

Motivation: DisGeNET-RDF makes available knowledge on the genetic basis of human diseases in the Semantic Web (SW). Gene-disease associations (GDAs) and their provenance metadata are published as human-readable and machine-processable web resources. The information on GDAs included in DisGeNET-RDF is interlinked to other biomedical databases to support the development of bioinformatics approaches for translational research through evidence-based exploitation of a rich and fully interconnected Linked Open Data (LOD).

Download Full-text

Ein Metadatenmodell für gemischte Sammlungen

Bibliotheksdienst ◽

10.1515/bd-2018-0066 ◽

2018 ◽

Vol 52 (7) ◽

pp. 548-564

Author(s):

Susanne Al-Eryani ◽

Gudrun Bucher ◽

Stefanie Rühle

Keyword(s):

Semantic Web ◽

Open Data ◽

Linked Open Data

Zusammenfassung Im Rahmen des DFG-geförderten Projekts „Entwicklung von interoperablen Standards für die Kontextualisierung heterogener Objekte am Beispiel der Provenienz Asch“ wurde ein Semantic Web und Linked Open Data fähiges Metadatenmodell entwickelt, das es ermöglicht, institutionsübergreifend Kulturerbe und dessen Provenienz zu kontextualisieren.

Download Full-text

Petri nets on the semantic web guidelines and infrastructure

Computer Science and Information Systems ◽

10.2298/csis0402127g ◽

2004 ◽

Vol 1 (2) ◽

pp. 127-151 ◽

Cited By ~ 5

Author(s):

Dragan Gasevic

Keyword(s):

Semantic Web ◽

Petri Net ◽

Ontology Language ◽

Uml Profiles ◽

Community Effort ◽

Model Sharing ◽

Petri Net Markup Language ◽

Description Framework ◽

Definition Of ◽

Resource Description

This paper gives the Petri net ontology as the most important element in providing Petri net support for the Semantic Web. Available Petri net formal descriptions are: metamodels, UML profiles, ontologies and syntax. Metamodels are useful, but their main purpose is for Petri net tools. Although the current Petri-net community effort Petri Net Markup Language (PNML) is XML-based, it lacks a precise definition of semantics. Existing Petri net ontologies are partial solutions specialized for a specific problem. In order to show current Petri net model sharing features we use P3 tool that uses PNML/XSLT-based approach for model sharing. This paper suggests developing the Petri net ontology to represent semantics appropriately. This Petri net ontology is described using UML, Resource Description Framework (Schema) RDF(S) and the Web Ontology Language-OWL.

Download Full-text

SKAITMENINĖS HUMANITARIKOS IŠPLĖTIMO SEMANTINIAME ŽINIATINKLYJE GALIMYBĖS: KROATIJOS VIDURAMŽIŲ RANKRAŠČIŲ, INKUNABULŲ IR JŲ FRAGMENTŲ ATVEJO ANALIZĖ

Knygotyra ◽

10.15388/kn.v61i0.1954 ◽

2013 ◽

Vol 61 ◽

pp. 254-277

Author(s):

MARIJANA TOMIĆ ◽

MIRNA WILLER

Keyword(s):

Semantic Web ◽

Open Data ◽

Linked Open Data

Rankraščių rinkiniai – tai labai įvairaus pobūdžio rankraščiai, paprastai apibrėžiami kaip „ranka ant popieriaus arba pergamento užrašytas tekstas arba dokumentas“ (Peter Beal). Tai gali būti šeimos ar asmeniniai dokumentai, dienoraščiai, laiškai, archyvų rinkiniai ir kt. Viduramžių rankraščiai – kodeksai, žemėlapiai, muzikos kūriniai arba jų fragmentai – sudaro specialią rankraščių rūšį. Kaip ir inkunabulai, rankraščių rinkiniai yra vertingiausia bibliotekų paveldo dalis, dėl jų mus pasiekia itin daug informacijos apie viduramžių istoriją, kultūrą, literatūrą, socialinę istoriją, gyvenimo tendencijas. Be šių šaltinių informacija būtų dingusi. Senų ir retų rankraščių tyrimai svarbūs tiek šalies, tiek visos Europos kultūros ir socialinei istorijai. Žvelgiant iš humanitarinių mokslų perspektyvos, būtina išskirti keletą veiksnių, kurie lėmė reikšmingus pokyčius tyrinėjant rankraščius ir pirmąsias spausdintines knygas. Pačiu svarbiausiu laikomas informacinių technologijų poveikis beveik visoms tyrimo sritims. Šie pokyčiai lėmė ir naujos disciplinos – skaitmeninių humanitarinių mokslų atsiradimą. Pasak Toby’o Burrowso, viduramžių tyrinėtojai yra „pažangiausi skaitmeninių technologijų taikymo humanitarinių mokslų tyrimuose atstovai“. Vis dėlto T. Burrowsas išskiria ir keletą keblumų, susijusių su interneto ir skaitmeninės bibliotekos paslaugomis. Jis nurodo „integracijos ir sąveikos tarp daugybės skirtingų interneto svetainių stygių“ bei terminologijos nenuoseklumą taikant aprašomuosius standartus. Savo ruožtu tai sukelia probleminę situaciją, nes „tyrinėtojams visame pasaulyje kyla daug sunkumų rasti, naudotis ir dalytis žiniomis apie viduramžių rankraščių kolekcijas“. Visiškai pritariame T. Burrowso minčiai, kad šią problemą galima išspręsti sukuriant tarptautinę bendradarbiavimo infrastruktūrą, kuri leistų tvarkyti turinį ir tarpusavyje susijusias žinias. Mūsų nuomone, ši infrastuktūra gali būti įgyvendinta technologinėje semantinio žiniatinklio ir sujungtų atvirų duomenų (angl. Semantic Web and Linked Open Data) terpėje. Straipsnyje aptariami viduramžių rankraščių ir inkunabulų bei jų fragmentų tyrimai ir šių šaltinių aprašymas kaip skaitmeninių humanitarinių mokslų projekto dalis, taikant šią naują technologiją. Nagrinėjamas šios srities Kroatijos Zadaro universiteto Informacijos mokslų fakulteto vykdomas mokslinių tyrimų projektas. Projekto tikslas – atrinkti duomenų elementus, reikalingus tiksliam minėtų šaltinių aprašymui ir jų standartizavimui, naudojant senų ir retų knygų tyrinėtojų parengtas bibliografijos, kodikologijos, paleografijos bei tipografijos ontologijas.Straipsnyje pateikiamas ir trumpas technologinės semantinio tinklo infrastruktūros bei jo standartų įvadas. Detaliai aprašoma metodika, padedanti paskelbti pasirinktą žodyną kaip vieną iš metaduomenų registro paslaugų. Pateikiamas sujungtų atvirų duomenų paskelbimo pavyzdys – pristatatomas grafikas, vaizduojantis iš dalies rekonstruoto rankraščio fragmento aprašymą. Kadangi visos minėtos disciplinos naudoja savo žodynus ir ontologijas, straipsnio autorės siūlo orientuotis ne į vieno bendro žodyno naudojimą, o į atitinkamų terminų sąsajų projektavimą vadovaujantis SKOS taisyklėmis. Taip būtų kuriami būsimos tarptautinės bendradarbiavimo struktūros pagrindai.

Download Full-text

Characterising RDF data sets

Journal of Information Science ◽

10.1177/0165551516677945 ◽

2017 ◽

Vol 44 (2) ◽

pp. 203-229 ◽

Cited By ~ 6

Author(s):

Javier D Fernández ◽

Miguel A Martínez-Prieto ◽

Pablo de la Fuente Redondo ◽

Claudio Gutiérrez

Keyword(s):

Data Structures ◽

Large Scale ◽

Open Data ◽

Structural Features ◽

Data Sets ◽

Data Set ◽

Wide Range ◽

Rdf Data ◽

Description Framework ◽

Resource Description

The publication of semantic web data, commonly represented in Resource Description Framework (RDF), has experienced outstanding growth over the last few years. Data from all fields of knowledge are shared publicly and interconnected in active initiatives such as Linked Open Data. However, despite the increasing availability of applications managing large-scale RDF information such as RDF stores and reasoning tools, little attention has been given to the structural features emerging in real-world RDF data. Our work addresses this issue by proposing specific metrics to characterise RDF data. We specifically focus on revealing the redundancy of each data set, as well as common structural patterns. We evaluate the proposed metrics on several data sets, which cover a wide range of designs and models. Our findings provide a basis for more efficient RDF data structures, indexes and compressors.

Download Full-text

Technique for Transformation of Data From RDB to XML Then to RDF

Web Semantics for Textual and Visual Information Retrieval - Advances in Data Mining and Database Management ◽

10.4018/978-1-5225-2483-0.ch004 ◽

2017 ◽

pp. 70-91 ◽

Cited By ~ 1

Author(s):

Kaleem Razzaq Malik ◽

Tauqir Ahmad

Keyword(s):

Semantic Web ◽

Relational Database ◽

Resource Description Framework ◽

Data Science ◽

True Nature ◽

Extensible Markup ◽

Description Framework ◽

Mapping Techniques ◽

Resource Description ◽

The Web

This chapter will clearly show the need for better mapping techniques for Relational Database (RDB) all the way to Resource Description Framework (RDF). This includes coverage of each data model limitations and benefits for getting better results. Here, each form of data being transform has its own importance in the field of data science. As RDB is well known back end storage for information used to many kinds of applications; especially the web, desktop, remote, embedded, and network-based applications. Whereas, EXtensible Markup Language (XML) in the well-known standard for data for transferring among all computer related resources regardless of their type, shape, place, capability and capacity due to its form is in application understandable form. Finally, semantically enriched and simple of available in Semantic Web is RDF. This comes handy when with the use of linked data to get intelligent inference better and efficient. Multiple Algorithms are built to support this system experiments and proving its true nature of the study.

Download Full-text