Digital Studies/Le champ numérique
Latest Publications


TOTAL DOCUMENTS

282
(FIVE YEARS 50)

H-INDEX

3
(FIVE YEARS 2)

Published By Open Library Of Humanities

1918-3666

2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Pascal Belouin ◽  
Shih-Pei Chen ◽  
Sean Wang

Designing a protocol for the interoperability of digital textual resources—or, more simply, a “IIIF for texts”—remains a challenge, as such a protocol must cater to their vastly heterogenous formats, structures, languages, text encodings and metadata. There have been many attempts to propose a standard for textual resource interoperability, from the ubiquitous Text Encoding Initiative (TEI) format to more recent proposals like the Distributed Text Services (DTS) protocol. In this paper, we introduce our proposal called SHINE, which prioritizes instead the ease for software developers to represent and exchange textual resources and their associated metadata. We do so by combining a hierarchical model of textual structure with a flexible metadata scheme in SHINE, and we continue to define and develop it based on user-centered and iterative design principles. Therefore, we argue that SHINE is a protocol for textual interoperability that successfully balances flexibility of resource representation, consistency across resource representation, and overall simplicity of implementation.RésuméConcevoir un protocole pour l’interopérabilité des ressources textuelles numériques – c’est-à-dire, un IIIF pour des textes – demeure un défi, puisqu’un tel protocole doit correspondre à leurs formats considérablement hétérogènes, ainsi qu’à leurs structures, langues, encodages textuels et métadonnées. Il existe déjà plusieurs tentatives de proposer des standards pour l’interopérabilité des ressources textuelles, tel que l’ubiquiste Text Encoding Initiative (TEI – Initiative d’encodage textuel) ou des propositions plus récentes comme le protocole de Distributed Text Services (DTS – Services de texte distribuées). Dans cet article, nous présenterons une proposition que nous appelons SHINE, qui priorise la facilité de la représentation et de l’échange des ressources textuelles et des métadonnées associées pour les développeurs de logiciel. Nous le ferons en combinant un modèle de structure textuelle hiérarchique avec un schéma de métadonnées flexible dans SHINE et nous le définirons et le développerons selon des principes axés sur l’utilisateur et selon des principes de conceptions itératifs. Par conséquent, nous avançons que SHINE est un protocole pour l’interopérabilité textuelle qui équilibre systématiquement la flexibilité de la représentation de ressources, ainsi que la simplicité globale de l’implémentation, pour toute représentation de ressources.Mots-clés: format d’échange; modélisation de documents; métadonnées; infrastructure numériques; interopérabilité


2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Paul Joseph Spence ◽  
Renata Brandao

English Recent years have seen a growing focus on diversity in the digital humanities, and yet there has been rather less work on geolinguistic diversity, and the research which has been carried out often focuses on the structures of geographic representation in the field or has viewed ‘language’ as a technical or linguistic problem to solve. This article takes a different view, namely that we need to consider this diversity through multiple ‘frames’ of digitally-mediated language and culture, and that this is not just a question of epistemic justice or community manners, but that the digital humanities also need to address more actively challenges around global dynamics of digital multilingualism, transcultural exchange and geodiversity in its research agenda. This paper explores these questions through the prism of ‘language indifference’ in digital studies and, responding to Galina’s call for better data on the state of geolinguistic diversity in DH (2014), it articulates possible frameworks for addressing this diversity in a strategic, programmatic and research-led manner. We conclude by exploring the role of a greater multilingual focus in what Liu calls ‘the techne of diversity’ in digital humanities (2020), and contend that the digital humanities has much to gain, and much to offer, in engaging more fully with the languages-related cultural challenges of our era. RésuméCes dernières années l’accent a été mis de plus en plus sur la diversité dans les sciences humaines numériques, et pourtant il y a plutôt eu moins de travaux sur la diversité geo linguistique, et les recherches qui ont été menées portent souvent sur les structures de la représentation géographique sur le terrain, ou estiment le ‘langage’ comme un problème technique ou linguistique à résoudre. Cet article adopte un point différent, à savoir que nous devons considérer cette diversité à travers plusieurs ‘cadres’ de culture et de language à médiation numérique, cela n’étant pas uniquement une question de justice ou de savoir-faire communautaire, mais que, dans son programme de recherches, les sciences humaines numériques doivent également relever plus activement les défis à la dynamique mondiale du multilinguisme numérique, aux échanges transculturels et à la geo diversité. Ce document explore ces questions à travers le prisme de ‘l’indifférence linguistique’ dans les études numériques et, en réponse à l’appel de Galina pour de meilleures données sur l’état de la diversité geo linguistique dans DH (2014), il définit des systèmes possibles pour faire face à cette diversité de manière stratégique, programmatique et axée sur la recherche. Nous en concluons qu’en explorant le rôle d’une meilleure focalisation sur le multilinguisme dans les humanités numériques de ce que Liu appelle ‘la tech de la diversité’ (2020) et nous soutenons que les sciences humaines numériques ont beaucoup à gagner en s’engageant pleinement dans les défis culturels liés aux langues de notre époque.Mots-clés: Humanités numériques multilingues, Diversité linguistique et culturelle, Langues modernes numériques, Indifférence linguistique, Perturber le monolinguisme numérique


2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Benjamin Kiessling ◽  
Gennady Kurin ◽  
Matthew Thomas Miller ◽  
Kader Smail

This work presents an accuracy study of the open source OCR engine, Kraken, on the leading Arabic scholarly journal, al-Abhath. In contrast with other commercially available OCR engines, Kraken is shown to be capable of producing highly accurate Arabic-script OCR. The study also assesses the relative accuracy of typeface-specific and generalized models on the al-Abhath data and provides a microanalysis of the “error instances” and the contextual features that may have contributed to OCR misrecognition. Building on this analysis, the paper argues that Arabic-script OCR can be significantly improved through (1) a more systematic approach to training data production, and (2) the development of key technological components, especially multi-language models and improved line segmentation and layout analysis./Cet article présente une étude d’exactitude du moteur ROC open source, Krakan, sur la revue académique arabe de premier rang, al-Abhath. Contrairement à d’autres moteurs ROC disponibles sur le marché, Kraken se révèle être capable de produire de la ROC extrêmement exacte de l’écriture arabe. L’étude évalue aussi l’exactitude relative des modèles spécifiquement configurés à des polices et celle des modèles généralisés sur les données d’al-Abhath et fournit une microanalyse des « occurrences d’erreurs », ainsi qu’une microanalyse des éléments contextuels qui pourraient avoir contribué à la méreconnaissance ROC. S’appuyant sur cette analyse, cet article fait valoir que la ROC de l’écriture arabe peut être considérablement améliorée grâce à (1) une approche plus systématique d’entraînement de la production de données et (2) grâce au développement de composants technologiques fondamentaux, notammentl’amélioration des modèles multilingues, de la segmentation de ligne et de l’analyse de la mise en page.


2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Anna Mukamal ◽  
Kate Moffatt ◽  
Kandice Sharren ◽  
Claire Battershill

2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Randa El Khatib ◽  
Reese Alexandra Irwin ◽  
Caroline Winter ◽  
Michelle Levy

2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Nadine Boulay ◽  
Ashley Caranto Morford ◽  
Arun Jacob ◽  
Kush Patel ◽  
Kimberly O’Donnell

2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Markus Lepper ◽  
Baltasar Trancón y Widemann

2021 ◽  
Vol 11 (1) ◽  
Author(s):  
Christina Hilburger ◽  
Donna Langille ◽  
Melissa Nelson ◽  
Alessandra Bordini ◽  
Josie Ann Greenhill ◽  
...  

Sign in / Sign up

Export Citation Format

Share Document