Spiderlex browser

[English version soon available]

Responsables scientifiques : Sandrine Ollinger et Alain Polguère
Ingénieur développeur : Yannick Chudy
Collaborateur scientifique : Bruno Gaume
Financement : projet PaToMo (2017), valorisation non économique de la recherche, Université de Lorraine
Dernière mise à jour de cette page : 14/05/2020

Spiderlex est un instrument de navigation mis au point pour permettre une exploration dynamique de deux Systèmes Lexicaux développés à l’ATILF : le Réseau Lexical du Français (RL-fr) et le Réseau Lexical de l’Anglais (RL-en). Il s’agit à la fois d’un outil de visualisation des données lexicales et d’un instrument de travail pour les lexicographes. Les données des RL-fr et RL-en auxquelles Spiderlex donne accès sont mises à jour quotidiennement (dans la nuit). Spiderlex s’appuie sur les travaux de Bruno Gaume (Gaume 2008) sur la proxémie afin de déterminer les meilleurs sous-graphes susceptibles de présenter l’entourage d’une unité lexicale ou d’un vocable (entrée polysémique) au sein d’un Système Lexical.

Utiliser Spiderlex

Petit guide d'utilisation et démonstration

Il est recommandé de lire la courte documentation Ollinger & Polguère (2020) et de visualiser la démonstration préparée pour le congrès TALN 2020 avant de commencer à utiliser Spiderlex :

Guide de navigation SpiderlexDémonstration de Spiderlex

 
Accès Spiderlex au Réseau Lexical du Français (RL-fr)

Le RL-fr est composé à ce jour de plus de 28 700 nœuds et 77 800 arcs. Il est entièrement construit lexicographiquement au sein du laboratoire ATILF depuis 2011. Il a déjà atteint une grande maturité, en tant que Système Lexical, même si sa couverture du lexique français est encore partielle.

Voir les onglets Historique et Lexicographie du site des Systèmes Lexicaux pour plus d’information sur le travail lexicographique de construction du RL-fr.

Navigation dans le RL-fr

 
Accès Spiderlex au Réseau Lexical de l'Anglais (RL-en)

Le RL-en est composé à ce jour de plus de 200 000 nœuds et près d’un million d’arcs. Il a été amorcé automatiquement à partir du WordNet de Princeton et, depuis, fait l’objet d’un travail de correction et d’enrichissement. Pour l’instant, l’essentiel des données qu’il contient est directement issu de WordNet. Du fait de sa source lexicographique – cf. les synsets de WordNet –, le RL-en est avant tout structuré par des relations lexicales de (quasi-)synonymie ; contrairement au RL-fr, il est subdivisé en une multitude de sous-graphes non connectés. Le travail lexicographique effectué à l’ATILF a pour but de faire évoluer graduellement la structure du RL-en vers celle d’un Système Lexical à part entière.

On trouvera dans Gader et coll. (2014) une description de la méthode utilisée pour compiler les données du WordNet de Princeton en une ressource lexicale organisée selon l’approche des Systèmes Lexicaux.

Navigation dans le RL-en

 

Références bibliographiques

Gader N., Ollinger S., Polguère A. (2014). One Lexicon, Two Structures : So What Gives ? Dans H. Orav, C. D. Fellbaum & P. Vossen (dir.) : Proceedings of the Seventh Global Wordnet Conference (GWC2014), Global WordNet Association, Tartu, pp. 163–171 [http://www.aclweb.org/anthology/W14-0122].

Gaume B. (2008). Mapping the forms of meaning in small worlds. International Journal of Intelligent Systems 23(7), pp. 848–862 [https://hal.archives-ouvertes.fr/hal-01322013].

Ollinger S., Polguère A. (2020). Guide de navigation Spiderlex (version du 19 mai 2020). Rapport technique, ATILF CNRS, Nancy [https://lexical-systems.atilf.fr/wp-content/uploads/2020/05/Spiderlex-doc-FR-19v20.pdf].