Université de Liège Réseau des Bibliothèques

BICTEL/e - ULg
Serveur institutionnel des thèses de doctorat



Nouvelles thèses
dans BICTEL/e - ULg
  • Sharma, Henu - Theoretical studies of PbTiO3 and SrTiO3 under uniaxial mechanical constraints combining first-principles calculations and phenomenological Landau theory
  • Gennotte, Vincent - Biologie de la reproduction et analyse du déterminisme et de la différenciation du sexe à des stades précoces chez le tilapia du Nil, Oreochromis niloticus/Reproductive biology and analysis of sex determinism and differentiation at early developmental stages in Nile tilapia, Oreochromis niloticus
  • André, Cédric - Audiovisual spatial congruence, and applications to 3D sound and stereoscopic video.
Présentation Recherche thèse Dépôt thèse Accès
gestionnaires
 
Page de résumé pour ULgetd-06082011-114644

Auteur : Renders, Pascale
E-mail de l'auteur : Pascale.Renders@ulg.ac.be
URN : ULgetd-06082011-114644
Langue : Français/French
Titre : Modélisation d'un discours étymologique. Prolégomènes à l'informatisation du Französisches Etymologisches Wörterbuch/Modelization of an Etymological discourse. Prolegomena to the computerization of the Französisches Etymologisches Wörterbuch
Intitulé du diplôme : Doctorat en langues et lettres
Département : Philo & Lettres - Département de langues et littératures romanes
Jury :
Nom : Titre :
de Marneffe, Pierre-Arnoul Membre du jury/Committee Member
Greub, Yann Membre du jury/Committee Member
Purnelle, Gérald Membre du jury/Committee Member
Raible, Wolfgang Membre du jury/Committee Member
Chauveau, Jean-Paul Président du jury/Committee Chair
Boutier, Marie-Guy Promoteur/Director
Buchi, Eva Promoteur/Director
Mots-clés :
  • retroconversion/rétroconversion
  • computerization/informatisation
  • FEW
  • XML
Date de soutenance : 2011-06-20
Type d'accès : Restreint/Intranet
Résumé :

The Französisches Etymologisches Wörterbuch, the reference book in French andRomance linguistics, is currently underused because its lexicographic features make it

hard to search and hard to read.

The retroconversion of the 25 printed volumes of the FEW into a computerized

dictionary, as desired by the scientific community, may address this problem. The density and the structural complexity of the dictionary may however make retroconversion appear as an unreasonable, even utopian, endeavor. Furthermore, computerization induces the risk of skewing the fewian discourse, thus opening the way to incorrect search practices.

This doctoral dissertation proposes to study the feasibility of the retroconversion of the FEW, taking into account all of the constraints on the project.

In the first part of the study, we model the fewian etymological discourse in order to

address the searchability and readability issues of the dictionary in a way that preserves its structures. This modeling, formalized in XML, takes account of two complementary dimensions of the FEW, corresponding to two visions of the dictionary: a thesaurus of lexical units on one hand, a collection of monographs on the other hand.

The second part of our study examines how to apply the model to the fewian text in an automated fashion. A retroconversion software was constructed to this end. The kernel of the software is comprised of about thirty algorithms that identify and tag, in an article of the FEW, the various relevant types of information. The application of the software to a corpus of 150 FEW articles results in a tagging that exhibits very few problematic errors.

There is still room for improving the tagging, but it already demonstrates the feasibility of a retroconversion of the FEW that, assuming the availability of appropriate exploitation tools (search engine and search interface), should address most of the expectations of the scientific community, making the dictionary more accessible without eluding the complexity and depth of the fewian discourse.

---------------------

Le Französisches Etymologisches Wörterbuch, ouvrage de référence en linguistique française et romane, est actuellement sous-exploité, en raison des difficultés de consultation que posent ses particularités lexicographiques.

La rétroconversion des 25 volumes imprimés en un dictionnaire informatisé, que la communauté scientifique appelle de ses vœux, pourrait remédier à ce problème. La

densité et la complexité structurelle de l’ouvrage font toutefois craindre que l’opération se révèle peu raisonnable, voire utopique. Par ailleurs, l’informatisation présente le risque de dénaturer le discours fewien et d’ouvrir la voie à des pratiques de consultation incorrectes.

Cette thèse se propose d’étudier la faisabilité du projet de rétroconversion du FEW, en prenant en compte toutes les contraintes qui lui sont imposées.

Dans la première partie de l’étude, nous modélisons le discours étymologique fewien de façon à résoudre les difficultés de consultation et de lecture relevées, tout en respectant les structures de l’ouvrage. Cette modélisation, formalisée en XML, rend

compte de deux dimensions complémentaires du FEW, correspondant à deux visions de l’œuvre : comme un thesaurus d’unités lexicales d’une part, comme un recueil de monographies d’autre part.

La seconde partie de notre étude examine comment appliquer le modèle au texte fewien de façon automatisée. Un logiciel de rétroconversion a été conçu dans ce but. Le noyau du logiciel est constitué d’une trentaine d’algorithmes qui identifient, dans un article du FEW, les divers types d’information pertinents et les balisent. L’application du logiciel sur un corpus de 150 articles du FEW produit des résultats de balisage comportant très peu d’erreurs problématiques.

Le résultat est encore perfectible, mais il démontre la faisabilité d’une rétroconversion du FEW qui, moyennant la création d’outils d’exploitation appropriés (moteur et interface de recherche), devrait répondre à la majorité des attentes de la communauté

scientifique, en rendant l’ouvrage plus accessible sans pour autant éluder la complexité et la profondeur de son discours.

Autre version :
Fichiers :
Nom du fichier Taille Temps de chargement évalué (HH:MI:SS)
Modem 56K ADSL
[Restreint/Intranet] ThesePascaleRenders.pdf 6.31 Mb 00:15:01 00:00:33
Fichiers accessibles par l'Internet [Public/Internet] ou que par l'Intranet [Restreint/Intranet].

Bien que le maximum ait été fait pour que les droits des ayants-droits soient respectés, si un de ceux-ci constatait qu'une oeuvre sur laquelle il a des droits a été utilisée dans BICTEL/e ULg sans son autorisation explicite, il est invité à prendre contact le plus rapidement possible avec la Direction du Réseau des Bibliothèques.


Parcourir BICTEL/e par Auteur|Département | Rechercher dans BICTEL/e


© Réseau des Bibliothèques de l'ULg, Grande traverse, 12 B37 4000 LIEGE