La réalisation matérielle du Französisches Etymologisches Wörterbuch

Sarah Kremer 2019

La réalisation matérielle du Französisches Etymologisches Wörterbuch.
Impact de la mise en forme typographique sur le développement d’un projet lexicographique

Article publié dans L’Information grammaticale n°162, juin 2019.

Le Französisches Etymologisches Wörterbuch (FEW) est une réalisation lexicographique initiée par le linguiste suisse Walther von Wartburg (1888-1971). Ses articles, qui s’étendent sur plus de 16000 pages, parcourent l’ensemble du lexique gallo-roman, de ses origines à nos jours. La publication des volumes imprimés qui s’est étalée de 1922 à 2002 connaît depuis des prolongements sous la forme de publications électroniques. Les nouveaux articles rédigés ont été diffusés directement en ligne, sous forme de fichiers PDF. La mise en ligne de l’ensemble du dictionnaire au format électronique est maintenant en cours d’élaboration: le travail de Pascale Renders (Renders, 2015) a permis d’établir un protocole de traitement automatique du contenu des articles afin de produire une version rétroconvertie, balisée et interrogeable, du dictionnaire. L’informatisation du FEW, encouragée depuis de nombreuses années par ses utilisateurs, est ainsi en passe d’être réalisée. Ce nouveau mode de diffusion devrait assurer à l’œuvre de Wartburg une diffusion et une exploitation élargies.

Parmi les données qui sont présentées dans les articles du FEW figurent des informations phonétiques. Elles concernent l’accentuation, la longueur, la nasalisation ou l’ouverture de certains sons relevés et sont transcrites à l’aide d’une série de signes diacritiques qui peuvent s’ajouter au dessus et/ou en dessous de lettres de bases. Ces combinaisons de signes, spécifiques au dictionnaire de Wartburg, s’inscrivent dans la tradition des transcriptions phonétiques employés en romanistique. Mais l’absence de polices de caractères numériques en mesure d’afficher et d’encoder correctement ces informations s’est révélée être un véritable obstacle au déroulement du processus d’infor- matisation du dictionnaire. C’est d’abord pour répondre à cette difficulté technique qu’a été initiée notre recherche doctorale. Cette thèse s’inscrit ainsi à la croisée des sciences du langages et du design, plus précisément de la métalexicographie et du design typographique. Elle s’appuie sur les compétences développées dans le cadre d’un partenariat entre le laboratoire en sciences du langage ATILF et l’Atelier national de recherche typographique (ANRT), 3e cycle de l’École nationale supérieure d’art et de design de Nancy.

Au croisement de la lexicographie et de la typographie

La première partie de notre travail situe les enjeux d’une réflexion typographique appliquée au contexte lexicographique. À l’heure de son informatisation, la question de la mise en forme typographique du FEW est en effet essentielle. Le processus de rétroconversion s’appuie sur l’examen détaillé de la composition typographique du dictionnaire. La structure de chaque article est adaptée aux spécificités de la famille de mots présentée et seule la prise en compte des principes de présentation typographique de la macrostructure et de la microstructure permettent aux algorithmes de rétroconversion d’amorcer le balisage des articles.

L’observation du contexte de production et de diffusion du dictionnaire nous a permis de mettre en évidence l’étendue des besoins du FEW informatisé. Elle concerne non seulement le développement d’une police de caractères pour l’affichage du système de transcription phonétique mais également un ensemble d’outils typographiques nécessaires à la cohérence visuelle et informatique du projet. Ces outils doivent permettre la bonne appréhension du dictionnaire par ses rédacteurs et ses utilisateurs. Ce dernier aspect est particulièrement important puisque le lectorat du FEW est amené à se diversifier à l’occasion de la mise en ligne de l’ensemble des articles.

L’espace du FEW, historiographie

La deuxième partie de notre travail est consacrée à l’étude de la fabrication du FEW et de son processus éditorial. Elle participe à l’écriture de l’histoire du FEW en abordant le dictionnaire sous l’angle de sa présentation matérielle. Pour cela, nous avons mené une étude détaillée de l’ensemble du contenu du FEW que nous avons confronté à une série de documents de travail issus des archives de Wartburg.

Si les différents fascicules qui composent le dictionnaire suivent une mise en page relativement stable tout au long de la parution des volumes imprimés, on note davantage de variations de composition à l’échelle de la lettre. Différentes familles de caractères typographiques génériques large- ment diffusées auprès des imprimeurs de l’époque sont employées pour composer les articles du FEW. Et plusieurs jeux de caractères accentués, utilisés dans le cadre des transcriptions phonétiques, ont été dessinés spécifiquement afin de répondre aux besoins des différents imprimeurs qui ont pris en charge la production des fascicules (Fig.1). Le recoupement des préfaces du FEW avec certaines lettres rédigées par Wartburg nous a permis de mettre en évidence une relation entre certaines périodes de ralentissement de la publication du dictionnaire et des difficultés rencontrées par les imprimeurs pour disposer des caractères accentués ou pour les employer. Ces difficultés liées à la composition des articles se poursuivent malgré les évolutions techniques lors de la publication numérique de nouvelles versions d’articles sous la forme de fichiers PDF. Les rédacteurs sont alors responsables de la composition des articles, et introduisent, faute d’outils adaptés, des irrégularités de composition et d’encodage. Ces erreurs de mise en forme complexifient le processus de lecture des articles mais elles rendent surtout impossible l’exploitation informatique des données saisies. Les difficultés de mise en forme du FEW, qui se posent de manière récurrente tout au long de la publication du dictionnaire, dépassent donc très largement la seule dimension esthétique.

L’organisation singulière des articles du FEW témoigne de l’influence des sources variées qui sont consultées et convoquées par les rédacteurs. Cette particularité s’incarne au sein des articles intrinsèquement variés, dont les différentes parties se rapprochent pour certaines de dictionnaires généraux et pour d’autres de monographies romanistes ou dialectales. Mais paradoxalement, à l’exception des caractères accentués des transcriptions phonétiques, les moyens typographiques qui servent à la composition du FEW sont quant à eux des outils génériques très largement répandus et leurs caractéristiques visuelles ne sont que moyennement adaptées à la composition des articles du dictionnaire.

Ces observations ont guidé notre travail de design qui propose des outils inédits pour répondre aux besoins spécifiques du FEW.

Figure 1. Variations du dessin des caractères accentués employés pour composer les fascicules imprimés du FEW.

Refonte de la réalisation matérielle du FEW au regard des enjeux de publication contemporains

La troisième partie de notre travail aborde les contributions concrètes réalisées dans le cadre de notre thèse à savoir la production d’une famille de caractères typographiques pour les usages du FEW nommée Walther ainsi que deux interfaces qui exploitent les nouvelles polices et permettent la consultation du dictionnaire et la rédaction de nouveaux articles.

En premier lieu, la famille Walther apporte des solutions en ce qui concerne l’encodage des données du dictionnaire. Elle prend en compte les dernières recommandations d’encodage préconisées par le consortium Unicode qui permettent désormais de composer l’ensemble des caractères utilisés pour les transcriptions phonétiques. Les caractères accentués y sont décrits en tant que combinaisons d’éléments de base: on additionne à une lettre de base le ou les signes diacritiques nécessaires (Fig.2). Ce système permet ainsi de couvrir l’ensemble des besoins du FEW. Ce nouveau schéma d’encodage assure l’interopérabilité et la pérennité des données saisies, ce qui représente un avantage crucial à l’heure de leur mise en réseau.

Figure 2. Scénario d’encodage pour les caract.res accentu.s.

Les caractéristiques formelles de la famille Walther apportent une réponse visuelle aux spécificités structurelles et rédactionnelles de la langue du FEW. Les quatre variantes stylistiques de la famille (romain, italique, gras avec empattements et gras sans empattement) permettent de composer l’ensemble du contenu du dictionnaire (Fig.3-4). Différentes valeurs de graisse ou de cursivité sont appliquées à chacun des styles et permettent de renforcer visuellement la structure des articles. Les variantes grasses sont employées pour mettre en évidence les éléments de structuration générale (le mot-titre et la numérotation des sous-parties qui composent l’article). Les proportions des caractères romains, employés pour composer la majorité du contenu des articles, harmonisent les rencontres entre bas-de-casses, capitales, chiffres et signes de ponctuation, rencontres fréquemment employées lors de la composition des renvois aux nombreuses sources citées par les rédacteurs. Les caractères maigres et étroits de la variante italique mettent en évidence la présence des formes qui dérivent du mot-titre. Cette nouvelle hiérarchie visuelle accompagne le lecteur lors du processus de localisation de ces unités qui correspondent à de véritables portes d’entrée dans les articles du FEW.

Figure 3. Ensemble des variantes stylistiques de la famille typographique Walther.

Figure 4. Extrait de l’article transīre du FEW composé à l’aide de la famille typographique Walther.

Une première interface est développée pour accompagner le travail des rédacteurs du FEW. Une série d’outils offre un accès simplifié aux nombreux caractères utilisés dans le FEW. Une palette interactive permet au rédacteur de construire les caractères accentués qui lui sont nécessaires, en ajoutant des signes diacritiques à un caractère de base de manière dynamique. Les différentes options de stylisation du contenu de l’article assurent son balisage automatique. Cette opération permet le traitement du nouvel article rédigé par les algorithmes de rétroconversion puis son intégration à la base de données du FEW informatisé.

Une seconde interface correspond à une plateforme de consultation et réunit sous un format unifié l’ensemble des articles du dictionnaire, qu’ils aient été à l’origine publiés sous forme de fascicules imprimés ou de fichiers PDF. L’espace de l’interface se divise en deux zones distinctes: l’une affiche le contenu de l’article mis en forme à l’aide de la famille de caractères Walther, l’autre donne accès à un panneau interactif. Cet espace comporte une série d’outils de recherche et offre la possibilité d’afficher des informations complémentaires telles que le plan de l’article ou la résolution des différents sigles et abréviations employés. Il permet également à l’utilisateur de mettre en évidence différents éléments de la microstructure des articles en les colorisant. L’expérience de lecture des articles du FEW est ainsi complétée de nouveaux modes d’accès à son contenu. Elle s’adapte plus largement aux différents profils des utilisateurs, plus ou moins connaisseurs du projet du Wartburg.

Le format inédit de notre thèse a impliqué une collaboration entre les équipes de lexicographes de l’ATILF et des designers de l’ANRT. En dépassant les objectifs purement techniques que s’étaient initialement fixés les linguistes, cette collaboration s’est révélée particulièrement fructueuse. Elle participe à légitimer l’intégration de réflexions de design au sein d’autres projets d’édition scientifique, et plus largement, au champ des humanités numériques.

Sarah KREMER ATILF, ANRT, université de Lorraine, Nancy

Références bibliographiques

  • Atilf, Présentation du Französisches Etymologisches Wörterbuch de Walther von Wartburg. Disponible à l’adresse: www.atilf.fr/FEW.

  • Büchi E. (1996), Les structures du Französisches Etymologisches Wörterbuch. Recherches métalexicographiques et métalexicologiques. Tübingen: Niemeyer.

  • Renders P. (2015), L’informatisation du Französisches Etymologisches Wörterbuch Modélisation d’un discours étymologique. Strasbourg: Éditions de linguistique et de philologie. Linguistique de corpus et philologie informatique.

  • Thèse soutenue le 20 décembre 2018 à l’université de Lorraine, devant un jury composé d’Éva Buchi (ATILF-CNRS), examinatrice, Yan Greub (ATILF-CNRS), directeur de la thèse, Elton Prifti (université de Mannheim), rapporteur, Fiona Ross (université de Reading), examina- trice, Alice Savoie (ANRT-ENSAD Nancy), co-directrice de la thèse, Marc Smith (École nationale des chartes), rapporteur et président du jury.

  • Les articles issus de la refonte de la lettre B sont consultables disponibles sur le site du laboratoire ATILF : http://www.atilf.fr/FEW/

  • Au sujet des structures du FEW, se référer à l’étude d’Éva Buchi (Büchi, 1996).

  • Les archives von Wartburg, qui regroupent des documents professionnels et personnels de Walther von Wartburg, sont conservées dans les archives du Romanisches Seminar, à la bibliothèque de l’université de Bâle. Les archives du centre du FEW, relatives au travail de rédaction et de publication du dictionnaire depuis son installation à Nancy en 1993, sont quant à elles conservées à l’ATILF, à Nancy.

  • Cette interface de saisie est développée par Sylvain Julé, designer indépendant, alors étudiant-chercheur à l’ANRT.

  • Cette interface de consultation est développée par Benjamin Husson, ingénieur d’étude à l’ATILF.