Lexique(s) et genre(s) textuel(s) : approches sur corpus
Latest Publications


TOTAL DOCUMENTS

23
(FIVE YEARS 23)

H-INDEX

0
(FIVE YEARS 0)

Published By Editions Des Archives Contemporaines

9782813003454

Author(s):  
Évariste Ntakirutimana
Keyword(s):  

L’Afrique est indubitablement le continent qui a le plus grand nombre de francophones dans le monde. Sur les 55 pays africains, près de la moitié sont francophones. Somme toute, le français est parlé dans 27 États souverains et dans deux îles françaises d’outre-mer (Réunion et Mayotte). Tout bien considéré, le français bénéficie du statut de langue officielle unique ou co-officielle avec langues locales ou étrangères dans 23 pays. Dans cinq pays, il est largement utilisé sans statut officiel. Dans cet article, j’inventorie d’abord les pays francophones d’Afrique. J’aborde ensuite le statut du français dans ces pays avant de me focaliser sur les particularités du français africain. Toute langue de large diffusion connaît inéluctablement des particularités. Ordinairement, elles sont de deux ordres : accentuelles et lexicales. Mais il peut s’agir également de structure de phrases en raison de phénomènes linguistiques bien connus, à l’instar du transfert, de l’analogie et du calque.


Author(s):  
Margarita Rouski

L’existence d’associations lexicales redondantes plus ou moins figées caractérise les discours spécialisés et s’articule avec la théorie des genres discursifs. En nous positionnant dans la perspective de la phraséologie étendue, notre objectif est d’analyser et d’étudier les séquences préfabriquées (sur l’exemple de « à titre », « à ce titre ») dans un genre institué, celui des débats au sein du Parlement européen. Analyser ces routines paraît un défi intéressant à cause des particularités que présente ce genre discursif qui se construit au carrefour de l’oral et de l’écrit. La forte présence de l’interdiscours juridique détermine toute la fonctionnalité des débats.


Author(s):  
Gabrielle Le Tallec-Lloret

Le projet Neonaute (2017-2018), financé par la Délégation Générale à la Langue Française et aux Langues de France (Appel à projet “Langues et numérique” 2017), vise à élaborer un moteur de recherche permettant de suivre l’implantation des néologismes à partir des collections du dépôt légal du Web (BNF). Ce projet permet de réaliser des études ciblées sur la néologie générale et la terminologie, mais aussi sur la féminisation des noms de métiers, titres, grades et fonctions. Après une présentation des objectifs du projet, nous reviendrons sur les critères retenus pour élaborer une première liste masculin/féminin, puis les suivantes, réduites aux formes prioritaires. L’exploitation concrète de cette plateforme ayant rendu nécessaire l’élaboration d’une fiche terminologique par terme, on en exposera les critères de présentation (synchronie/diachronie/contextes d’emplois) et les premiers résultats tels qu’ils ont pu être envoyés à l’Académie française en septembre 2018.


Author(s):  
Aurélie Picton ◽  
Patrick Drouin ◽  
Julie Humbert-Droz
Keyword(s):  

L’analyse simultanée de plusieurs types de variation en corpus spécialisés comparables est une question encore peu traitée, malgré des besoins et des moyens méthodologiques grandissants pour les langues de spécialité. Pour discuter et alimenter la réflexion sur cette question, nous présentons deux exemples concrets de recherche : d’une part, l’étude de la déterminologisation, c’est-à-dire le passage de termes et concepts d’un domaine de spécialité vers la langue générale ; d’autre part, la création de l’Encyclopédie humanitaire dont l’un des objectifs principaux est d’analyser les différences d’usage des termes du domaine selon différentes perspectives. Sur la base d’une approche outillée en corpus, nous interrogeons différents axes et outils méthodologiques pour accompagner ce type d’analyse. Nous détaillons trois axes : le besoin de visualisation des données, de regroupement et de modélisation des phénomènes à observer, que nous illustrons sur la base d’exemples tirés de nos données.


Author(s):  
Évelyne Jacquey ◽  
Sylvain Hatier ◽  
Agnès Tutin ◽  
Laurence Kister

Dans cet article, nous présentons une expérience d’annotation manuelle en corpus d’occurrences du lexique scientifique transdisciplinaire en Sciences Humaines et Sociales (SHS). Le choix du domaine des SHS est intéressant dans la mesure où il soulève des difficultés de délimitation lexicale entre le lexique disciplinaire des disciplines des SHS dont relèvent les articles du corpus, le lexique scientifique transdisciplinaire des SHS et les lexiques de langue générale. Ces frontières floues entre les différents lexiques qui sont présents dans les articles scientifiques annotés se révèlent précisément lorsqu’on tente d’annoter et de désambiguïser les occurrences du lexique scientifique transdisciplinaire. Malgré cette difficulté, la ressource annotée pourra être particulièrement utile pour illustrer en corpus le fonctionnement du Lexique Scientifique Transdisciplinaire.


Author(s):  
Olivier Kraif
Keyword(s):  

Nous présentons dans cet article un outil dédié à la constitution de corpus parallèles alignés constitués à partir de l’aspiration de sources sur le Web. Nous montrons comment cet outil a permis de constituer un corpus aligné anglais-français pour un type de texte difficile à trouver en version bilingue, à savoir les articles scientifiques. Moyennant l’élaboration de chaînes de traitement basées sur l’écriture d’expressions régulières (dédiées à la définition des urls à aligner et à l’extraction des contenus) nous avons pu constituer, lors d’une première campagne, un corpus parallèle d’environ 4 millions de mots dans chaque langue, formaté en XML-TEI et TMX.


Author(s):  
Christophe Roche ◽  
Maria Papadopoulou

Par « définition ontologique du terme », nous entendons une définition qui repose sur une représentation explicite du concept dénoté par le terme (la norme ISO 1087-1 définit le terme comme une « désignation verbale d’un concept général dans un domaine spécifique »). Cette démarche permet non seulement de prendre en compte les dimensions linguistique et conceptuelle qui composent toute terminologie, mais aussi de concilier les définitions des termes en langue et les spécifications formelles des concepts. Le résultat est un dictionnaire terminologique structuré selon l’ontologie du domaine (au sens de l’Ingénierie des Connaissances). Une telle approche, qui a un coût non négligeable, celui de la construction de l’ontologie, se justifie lorsqu’il existe un « flou » terminologique tel qu’il nuit à la communication et au partage des connaissances dans un domaine de spécialité. C’est le cas de la terminologie des vêtements de la Grèce antique.


Author(s):  
Sami Mabrak

Le thème de l’article s’inscrit dans le deuxième axe du programme du colloque, c’est-à-dire, les approches d’extractions terminologiques et d’unités lexicales spécialisées. L’article se penchera plus spécifiquement sur les approches d’extractions d’unités lexicales dans une perspective lexicographique. Le sujet de notre article relève du domaine de la lexicographie et plus précisément de la lexicographie contemporaine. Nous abordons l’une des questions qui concerne la construction de la macrostructure d’un type particulier des dictionnaires, à savoir : le dictionnaire historique. Notre objectif est d’analyser les critères à partir desquels les entrées de ce type de dictionnaires sont constituées. Pour ce faire, nous adoptons une approche analytique et comparative. Quant au corpus de notre étude, nous l’avons constitué à partir de deux dictionnaires historiques déjà compilés et publiés, à savoir : le Dictionnaire historique de la langue française et le Dictionnaire historique de la langue anglaise. Les résultats de cette étude nous permettront de mener une réflexion sur les critères de constitution des entrées du Dictionnaire historique de la langue arabe.


Author(s):  
Isabella Carini ◽  
Adriano Ferraresi ◽  
Silvia Bernardini ◽  
François Lareau

Cette étude présente une méthodologie pour l’annotation par fonctions lexicales des sous-corpus italiens du European Parliament Translation and Interpreting Corpus (EPTIC). Nous proposons une méthode pour étiqueter certaines collocations selon les catégories sémantiques fournies par les fonctions lexicales de la Théorie Sens-Texte (TST). Le corpus ainsi annoté deviendrait alors une ressource utile pour l’apprentissage des collocations de la langue italienne, en particulier pour les traducteurs et interprètes non italophones.


Author(s):  
François Maniez
Keyword(s):  

En nous fondant sur le dépouillement d’un corpus de plus de 200 millions de mots constitué des articles d’un quotidien français (2006-2016), nous examinons l’implantation des emprunts verbaux à l’anglais. Nous étudions successivement les nominalisations utilisant le morphème –ing (coaching) et la formation de verbes par suffixation en -er (spoiler). Pour ces derniers, nous émettons l’hypothèse selon laquelle un emprunt préalable par le biais d’une forme nominale favoriserait la suffixation verbale (crash \shortrightarrow crasher), y compris dans des cas où les vocables ont des sens éloignés (match \shortrightarrow matcher).


Sign in / Sign up

Export Citation Format

Share Document