scholarly journals Protein ontology on the semantic web for knowledge discovery

2020 ◽  
Vol 7 (1) ◽  
Author(s):  
Chuming Chen ◽  
Hongzhan Huang ◽  
Karen E. Ross ◽  
Julie E. Cowart ◽  
Cecilia N. Arighi ◽  
...  

Abstract The Protein Ontology (PRO) provides an ontological representation of protein-related entities, ranging from protein families to proteoforms to complexes. Protein Ontology Linked Open Data (LOD) exposes, shares, and connects knowledge about protein-related entities on the Semantic Web using Resource Description Framework (RDF), thus enabling integration with other Linked Open Data for biological knowledge discovery. For example, proteins (or variants thereof) can be retrieved on the basis of specific disease associations. As a community resource, we strive to follow the Findability, Accessibility, Interoperability, and Reusability (FAIR) principles, disseminate regular updates of our data, support multiple methods for accessing, querying and downloading data in various formats, and provide documentation both for scientists and programmers. PRO Linked Open Data can be browsed via faceted browser interface and queried using SPARQL via YASGUI. RDF data dumps are also available for download. Additionally, we developed RESTful APIs to support programmatic data access. We also provide W3C HCLS specification compliant metadata description for our data. The PRO Linked Open Data is available at https://lod.proconsortium.org/.

Author(s):  
Franck Cotton ◽  
Daniel Gillman

Linked Open Statistical Metadata (LOSM) is Linked Open Data (LOD) applied to statistical metadata. LOD is a model for identifying, structuring, interlinking, and querying data published directly on the web. It builds on the standards of the semantic web defined by the W3C. LOD uses the Resource Description Framework (RDF), a simple data model expressing content as predicates linking resources between them or with literal properties. The simplicity of the model makes it able to represent any data, including metadata. We define statistical data as data produced through some statistical process or intended for statistical analyses, and statistical metadata as metadata describing statistical data. LOSM promotes discovery and the meaning and structure of statistical data in an automated way. Consequently, it helps with understanding and interpreting data and preventing inadequate or flawed visualizations for statistical data. This enhances statistical literacy and efforts at visualizing statistics.


2020 ◽  
pp. 016555152093095
Author(s):  
Gustavo Candela ◽  
Pilar Escobar ◽  
Rafael C Carrasco ◽  
Manuel Marco-Such

Cultural heritage institutions have recently started to share their metadata as Linked Open Data (LOD) in order to disseminate and enrich them. The publication of large bibliographic data sets as LOD is a challenge that requires the design and implementation of custom methods for the transformation, management, querying and enrichment of the data. In this report, the methodology defined by previous research for the evaluation of the quality of LOD is analysed and adapted to the specific case of Resource Description Framework (RDF) triples containing standard bibliographic information. The specified quality measures are reported in the case of four highly relevant libraries.


Author(s):  
Mariana Baptista Brandt ◽  
Silvana Aparecida Borsetti Gregorio Vidotti ◽  
José Eduardo Santarem Segundo

A presente pesquisa objetiva propor um modelo de dados abertos conectados (linked open data - LOD), para um conjunto de dados abertos legislativos da Câmara dos Deputados. Para tanto, procede-se à revisão de literatura sobre os conceitos de dados abertos, dados abertos governamentais, dados conectados (linked data), e dados abertos conectados (linked open data), seguido de pesquisa aplicada, com a modelagem de dados legislativos no modelo LOD. Para esta pesquisa foi selecionado o conjunto de dados "Deputados", que contém informações como partido político, unidade federativa, e-mail, legislatura, entre outras, sobre os parlamentares. Desse modo, observa-se que a estruturação do conjunto de dados em RDF (Resource Description Framework) é possível com reuso de vocabulários e padrões já estabelecidos na Web Semântica como Dublin Core, Friend of a Friend (FOAF), RDF e RDF Schema, além de vocabulários de áreas correlatas, como a Ontologia da Câmara dos Deputados italiana e a da Assembleia Nacional Francesa. Conforme recomendação do padrão Linked Data, os recursos foram relacionados também a outros conjuntos de LOD para enriquecimento semântico, como as bases Geonames e DBpedia. O estudo que permite concluir que a disponibilização dos dados governamentais, em especial, dados legislativos, pode ser feita seguindo as recomendações da W3C (World Wide Web Consortium) e, assim, integrar os dados legislativos à Web de Dados e ampliar as possibilidades de reuso e aplicações dos dados em ações de transparência e fiscalização, aproximando os cidadãos do Congresso e de seus representantes.


Information ◽  
2020 ◽  
Vol 11 (7) ◽  
pp. 361 ◽  
Author(s):  
Raji Ghawi ◽  
Jürgen Pfeffer

Linked Open Data (LOD) refers to freely available data on the World Wide Web that are typically represented using the Resource Description Framework (RDF) and standards built on it. LOD is an invaluable resource of information due to its richness and openness, which create new opportunities for many areas of application. In this paper, we address the exploitation of LOD by utilizing SPARQL queries in order to extract social networks among entities. This enables the application of de-facto techniques from Social Network Analysis (SNA) to study social relations and interactions among entities, providing deep insights into their latent social structure.


2015 ◽  
Author(s):  
Nuria Queralt Rosinach ◽  
Janet Pinero ◽  
Alex Bravo Serrano ◽  
Ferran Sanz ◽  
Laura I Furlong

Motivation: DisGeNET-RDF makes available knowledge on the genetic basis of human diseases in the Semantic Web (SW). Gene-disease associations (GDAs) and their provenance metadata are published as human-readable and machine-processable web resources. The information on GDAs included in DisGeNET-RDF is interlinked to other biomedical databases to support the development of bioinformatics approaches for translational research through evidence-based exploitation of a rich and fully interconnected Linked Open Data (LOD).


2018 ◽  
Vol 52 (7) ◽  
pp. 548-564
Author(s):  
Susanne Al-Eryani ◽  
Gudrun Bucher ◽  
Stefanie Rühle

Zusammenfassung Im Rahmen des DFG-geförderten Projekts „Entwicklung von interoperablen Standards für die Kontextualisierung heterogener Objekte am Beispiel der Provenienz Asch“ wurde ein Semantic Web und Linked Open Data fähiges Metadatenmodell entwickelt, das es ermöglicht, institutionsübergreifend Kulturerbe und dessen Provenienz zu kontextualisieren.


2004 ◽  
Vol 1 (2) ◽  
pp. 127-151 ◽  
Author(s):  
Dragan Gasevic

This paper gives the Petri net ontology as the most important element in providing Petri net support for the Semantic Web. Available Petri net formal descriptions are: metamodels, UML profiles, ontologies and syntax. Metamodels are useful, but their main purpose is for Petri net tools. Although the current Petri-net community effort Petri Net Markup Language (PNML) is XML-based, it lacks a precise definition of semantics. Existing Petri net ontologies are partial solutions specialized for a specific problem. In order to show current Petri net model sharing features we use P3 tool that uses PNML/XSLT-based approach for model sharing. This paper suggests developing the Petri net ontology to represent semantics appropriately. This Petri net ontology is described using UML, Resource Description Framework (Schema) RDF(S) and the Web Ontology Language-OWL.


Knygotyra ◽  
2013 ◽  
Vol 61 ◽  
pp. 254-277
Author(s):  
MARIJANA TOMIĆ ◽  
MIRNA WILLER

Rankraščių rinkiniai – tai labai įvairaus pobūdžio rankraščiai, paprastai apibrėžiami kaip „ranka ant popieriaus arba pergamento užrašytas tekstas arba dokumentas“ (Peter Beal). Tai gali būti šeimos ar asmeniniai dokumentai, dienoraščiai, laiškai, archyvų rinkiniai ir kt. Viduramžių rankraščiai – kodeksai, žemėlapiai, muzikos kūriniai arba jų fragmentai – sudaro specialią rankraš­čių rūšį. Kaip ir inkunabulai, rankraščių rinkiniai yra vertingiausia bibliotekų paveldo dalis, dėl jų mus pasiekia itin daug informacijos apie viduramžių istoriją, kultūrą, literatūrą, socialinę istoriją, gyvenimo tendencijas. Be šių šaltinių informacija būtų dingusi. Senų ir retų rankraščių tyri­mai svarbūs tiek šalies, tiek visos Europos kultūros ir socialinei istorijai. Žvelgiant iš humanitarinių mokslų perspektyvos, būtina išskirti keletą veiksnių, kurie lėmė reikšmingus pokyčius tyrinėjant rankraščius ir pirmąsias spausdintines knygas. Pa­čiu svarbiausiu laikomas informacinių technologijų poveikis beveik visoms tyrimo sritims. Šie pokyčiai lėmė ir naujos disciplinos – skaitmeninių humanitarinių mokslų atsiradimą. Pasak Toby’o Burrowso, viduramžių tyrinėtojai yra „pažangiausi skaitmeninių technologi­jų taikymo humanitarinių mokslų tyrimuose atstovai“. Vis dėlto T. Burrowsas išskiria ir keletą keblumų, susijusių su interneto ir skaitmeninės bibliotekos paslaugomis. Jis nurodo „integracijos ir sąveikos tarp daugybės skirtingų interneto svetainių stygių“ bei terminolo­gijos nenuoseklumą taikant aprašomuosius standartus. Savo ruožtu tai sukelia probleminę situaciją, nes „tyrinėtojams visame pasaulyje kyla daug sunkumų rasti, naudotis ir dalytis žiniomis apie viduramžių rankraščių kolekcijas“. Visiškai pritariame T. Burrowso minčiai, kad šią problemą galima išspręsti sukuriant tarptautinę bendradarbiavimo infrastruktūrą, kuri leistų tvarkyti turinį ir tarpusavyje susijusias žinias. Mūsų nuomone, ši infrastuktūra gali būti įgyvendinta technologinėje semantinio žiniatinklio ir sujungtų atvirų duomenų (angl. Semantic Web and Linked Open Data) terpėje. Straipsnyje aptariami viduramžių rankraščių ir inkunabulų bei jų fragmentų tyrimai ir šių šal­tinių aprašymas kaip skaitmeninių humanitarinių mokslų projekto dalis, taikant šią naują tech­nologiją. Nagrinėjamas šios srities Kroatijos Zadaro universiteto Informacijos mokslų fakulteto vykdomas mokslinių tyrimų projektas. Projekto tikslas – atrinkti duomenų elementus, reikalingus tiksliam minėtų šaltinių aprašymui ir jų standartizavimui, naudojant senų ir retų knygų tyrinėtojų parengtas bibliografijos, kodikologijos, paleografijos bei tipografijos ontologijas.Straipsnyje pateikiamas ir trumpas technologinės semantinio tinklo infrastruktūros bei jo standartų įvadas. Detaliai aprašoma metodika, padedanti paskelbti pasirinktą žodyną kaip vieną iš metaduomenų registro paslaugų. Pateikiamas sujungtų atvirų duomenų paskelbimo pavyzdys – pri­statatomas grafikas, vaizduojantis iš dalies rekonstruoto rankraščio fragmento aprašymą. Kadangi visos minėtos disciplinos naudoja savo žodynus ir ontologijas, straipsnio autorės siūlo orientuotis ne į vieno bendro žodyno naudojimą, o į atitinkamų terminų sąsajų projektavimą vadovaujantis SKOS taisyklėmis. Taip būtų kuriami būsimos tarptautinės bendradarbiavimo struktūros pagrindai.


2017 ◽  
Vol 44 (2) ◽  
pp. 203-229 ◽  
Author(s):  
Javier D Fernández ◽  
Miguel A Martínez-Prieto ◽  
Pablo de la Fuente Redondo ◽  
Claudio Gutiérrez

The publication of semantic web data, commonly represented in Resource Description Framework (RDF), has experienced outstanding growth over the last few years. Data from all fields of knowledge are shared publicly and interconnected in active initiatives such as Linked Open Data. However, despite the increasing availability of applications managing large-scale RDF information such as RDF stores and reasoning tools, little attention has been given to the structural features emerging in real-world RDF data. Our work addresses this issue by proposing specific metrics to characterise RDF data. We specifically focus on revealing the redundancy of each data set, as well as common structural patterns. We evaluate the proposed metrics on several data sets, which cover a wide range of designs and models. Our findings provide a basis for more efficient RDF data structures, indexes and compressors.


Author(s):  
Kaleem Razzaq Malik ◽  
Tauqir Ahmad

This chapter will clearly show the need for better mapping techniques for Relational Database (RDB) all the way to Resource Description Framework (RDF). This includes coverage of each data model limitations and benefits for getting better results. Here, each form of data being transform has its own importance in the field of data science. As RDB is well known back end storage for information used to many kinds of applications; especially the web, desktop, remote, embedded, and network-based applications. Whereas, EXtensible Markup Language (XML) in the well-known standard for data for transferring among all computer related resources regardless of their type, shape, place, capability and capacity due to its form is in application understandable form. Finally, semantically enriched and simple of available in Semantic Web is RDF. This comes handy when with the use of linked data to get intelligent inference better and efficient. Multiple Algorithms are built to support this system experiments and proving its true nature of the study.


Sign in / Sign up

Export Citation Format

Share Document