Présentation générale
Ramses Online est une interface web donnant accès à une partie des données et des fonctionnalités du corpus annoté des textes néo-égyptiens développé à l’Université de Liège et connu sous le nom de Projet Ramsès.
Dans sa version bêta, qui a été mise en ligne à l’occasion du 11e Congrès International des Égyptologues en août 2015, Ramses Online offre aux utilisateurs un sous-corpus de textes néo-égyptiens traduits en français et dont toutes les occurrences sont lemmatisées et annotées morphologiquement.
Il est dès à présent possible de visualiser les textes de ce corpus et d’y effectuer des recherches simples portant (a) sur les lemmes (translitération ou traduction française du lemme), (b) sur les graphies hiéroglyphiques ou (c) sur les traductions des propositions en contexte.
En sus, les utilisateurs enregistrés ont accès à un moteur de recherche avancé permettant de construire des requêtes complexes portant simultanément sur les niveaux d’annotations suivants :
- le lemme ;
- la graphie ;
- l'analyse grammaticale.
Outre le corpus des textes qui sera enrichi en permanence, à brève échéance, la version bêta de Ramses Online évoluera notamment sur les trois points suivants :
- L’interface deviendra entièrement bilingue (français et anglais).
- Pour chacun des lemmes, il sera possible de visualiser une fiche lexicale comprenant : (a) des précisions de nature morphologique et sémantique, (b) des références à des outils et études lexicographiques portant sur le mot, (c) l’ensemble des graphies attestées pour le lemme en question.
- L’utilisateur pourra choisir les niveaux d’annotation qu’il souhaite visualiser : les hiéroglyphes, la lemmatisation, l’analyse morphologique, la traduction des propositions.
Version bêta | Version finale | |
Interface | français | français & anglais |
Nombre d'occurrences | 65.000 | 500.000+ |
Navigation dans le lexique | - | |
Navigation dans le corpus | ||
Recherches simples et avancées | ||
Choix des annotations affichées | - | |
Tris sur base des métadonnées | - |
Historique du projet
Depuis le milieu des années quatre-vingt, les études de néo-égyptien ont pris une place importante au sein du service d’égyptologie de l’Université de Liège. Dans le même temps, les perspectives offertes par les nouvelles technologies faisaient l’objet d’un intérêt croissant (cf. les Tables rondes bisannuelles du groupe Informatique et Égyptologie). Le Projet Ramsès, lancé en 2006, se trouve ainsi au confluent de ces deux courants majeurs de l’égyptologie liégeoise.
Grâce à des supports institutionnels variés (ULg, FNRS, Communauté française, et, plus récemment, la Fondation von Humboldt), le Projet Ramsès a pu se développer régulièrement selon deux axes principaux :
- l’architecture de la base de données : ajout régulier de nouvelles fonctions, amélioration de l’ergonomie, optimisation des procédures ;
- l’annotation des données textuelles.
Aujourd’hui, nous avons estimé qu’il était temps d’ouvrir la base de données à la communauté scientifique internationale. Ramses Online, l’outil mis en ligne ici, ne livre cependant pas l’intégralité des données et fonctionnalités du Projet Ramsès. En effet, Ramses Online connaît deux types de limitations :
- La première concerne le corpus ; tous les textes du Projet Ramsès n’ont pas encore fait l’objet des relectures et corrections nécessaires. Afin de ne pas retarder inutilement les choses, nous avons opté pour une production continue, c’est-à-dire pour une mise en ligne des textes une fois qu’ils ont atteint un état d’achèvement jugé satisfaisant. On se reportera à la Présentation du corpus pour plus de détails.
- La seconde limitation tient au type d’informations accessibles et aux recherches qui seront autorisées. Le Projet Ramsès a d’abord été pensé comme un outil de recherche pour les grammairiens, linguistes et philologues. Ses possibilités de requêtes sont particulièrement étendues (voir la liste de références, ci-dessous). La consultation de la base en ligne a été volontairement limitée aux opérations les plus courantes, afin de préserver les projets de recherche propres au service d’égyptologie de l’ULg. Les scientifiques qui souhaitent mener des enquêtes approfondies faisant appel à toutes les potentialités du Projet Ramsès sont dès lors invités à se mettre en contact directement avec nous afin de déterminer un protocole d’accord.
Principes d'annotation du corpus
Ainsi que cela a été rappelé, le Projet Ramsès est d’abord une base de données destinée à faciliter les recherches dans le domaine grammatical, linguistique au sens large, et philologique. Cette orientation explique certains choix qui ont été posés en matière d’annotation du corpus. On décrit ci-dessous brièvement les points les plus importants.
- Les textes encodés dans le Projet Ramsès sont des témoins, ce qui implique que l’on trouvera autant de textes qu’il existe de versions (sens auquel nous entendons « témoin ») d’un texte littéraire. Tous les textes encodés sont accompagnés de :
- métadonnées concernant le support du texte (matériau, type d’écriture, datation, provenance géographique) et les textes eux-mêmes (datation, genres textuels, niveau de langue) ;
- références bibliographiques de base concernant le texte ; des références plus spécifiques peuvent être liées directement à un lemme, une graphie, une analyse en contexte ou une traduction.
- Les textes sont segmentés en propositions ; à l’intérieur d’une proposition chaque mot est traité comme une unité sur laquelle viennent se greffer les annotations. Pour des raisons pratiques, tous les pronoms suffixes et dépendants sont traités comme des mots indépendants ; sauf exception motivée graphémiquement (p. ex. ḥm-nṯr « prêtre »), les éléments des mots composés sont traités séparément, comme des mots isolés (p. ex. rmṯ js.t « homme d’équipe », et non rmṯ-js.t).
- Les mots font l’objet d’une transcription hiéroglyphique qui suit l’édition de référence choisie. Il n’y a pas eu de collationnement avec les originaux ni de standardisation des graphies hiéroglyphiques : Ramsès ne prétend donc nullement être une nouvelle édition philologique. Le codage est réalisé suivant les normes du Manuel de codage grâce à une intégration dans l’interface du Projet Ramsès des fonctionnalités du logiciel Jsesh. Les lacunes, restitutions, suppressions, émendations, signes de ponctuation et rubriques font l’objet d’un encodage spécial.
- Les mots font l’objet d’une lemmatisation (p. ex. pr.w « maisons » ⇒ pr « maison » ; jj.kwj ⇒ jwj « venir ») ; si un mot ne peut être rattaché à un lemme — p. ex. parce que les lacunes sont trop importantes —, les signes hiéroglyphiques seuls sont encodés afin de préserver l’information. À chaque lemme est attribué une partie du discours. Selon les classes, il peut exister des sous-catégories (p. ex. pronoms ⇒ pronoms suffixes, pronoms dépendants, etc. ; verbes ⇒ 2-lit, 3ae inf., etc.). Le lexique du Projet Ramsès n’a d’autre ambition que d’identifier les mots de manière non ambiguë. Les traductions fournies dans le lexique n’ont qu’une valeur générique. On se reportera donc aux textes pour avoir les traductions en contexte. En tout état de cause, le lexique ne s’apparente ni de près ni de loin à un dictionnaire.
- La translitération des mots n’a pas pour objectif de refléter fidèlement la graphie hiéroglyphique ; il s’agit d’avantage d’un outil d’identification morphologique (cf. ci-dessous). Chaque mot, dans un contexte grammatical donné, fait donc l’objet d’une translitération standardisée. Par exemple, la translitération des formes relatives prend systématiquement un yod prothétique, que celui-ci soit présent au niveau graphique ou non. De même, la translitération des substantifs prend systématiquement les marques de genre et de nombre (.w, .t, .wt, etc.), que celles-ci soient actualisées ou non au niveau graphique. Cette convention n’est pas gênante dans la mesure où les graphies hiéroglyphiques sont encodées et peuvent donc faire l’objet de recherches spécifiques : la translitération correspond à une lecture idéalisée de l’analyse morphologique du mot.
- Les mots font l’objet d’une analyse morphologique complète. Cette analyse est contextuelle (p. ex. s.t « place » dans s.t.f « sa place » sera analysé comme un substantif féminin singulier à l’état pronominal). Toutes les informations grammaticales sont abrégées en suivant la Liste d’abréviations.
- Les textes font l’objet d’une traduction suivie (en français ou en anglais, selon la langue maternelle du collaborateur).
- Les requêtes qui peuvent être effectuées sur la base se font en utilisant, suivant les besoins, deux modules de recherche : un module de recherche simple et un module de recherche avancée.
Procédure d'encodage et citation des données
L’encodage des textes du Projet Ramsès qui sont accessibles grâce à Ramses Online a été réalisé par des étudiants de Master et des boursiers de doctorat de l’Université de Liège et du F.R.S.-FNRS attachés au service d’égyptologie, ainsi que par des post-doctorants ayant collaboré au projet (voir la liste des collaborateurs).
Il s’agit d’un travail ardu demandant une importante expertise, à la fois technique et philologique. C’est pourquoi il était important de fournir pour chaque texte de Ramses Online un modèle de citation (comprenant encodeur(s), référence du texte et date) permettant aux utilisateurs de référencer les analyses et traductions qu’ils y trouveront et auxquelles ils pourront ainsi renvoyer dans leurs propres travaux.
Comme dans toute entreprise humaine, les erreurs sont bien sûr inévitables et seront plus ou moins nombreuses en fonction de la difficulté des textes encodés. Afin d’améliorer en permanence la qualité des données du corpus, nous avons donc mis en place un système qui permet aux utilisateurs enregistrés de signaler une erreur, une analyse alternative, etc. dans l’encodage et l’annotation de chaque proposition. Ces remarques seront examinées par les administrateurs et les utilisateurs dûment crédités pour les corrections apportées au corpus Ramsès.
Références
On trouvera ci-dessous une liste des articles publiés concernant le Projet Ramsès :