Spiderlex est un instrument de navigation mis au point pour permettre une exploration dynamique de deux Systèmes Lexicaux développés à l’ATILF : le Réseau Lexical du Français (RL-fr) et le Réseau Lexical de l’Anglais (RL-en). Il s’agit à la fois d’un outil de visualisation des données lexicales et d’un instrument de travail pour les lexicographes. Les données des RL-fr et RL-en auxquelles Spiderlex donne accès sont mises à jour quotidiennement (dans la nuit). Spiderlex s’appuie sur les travaux de Bruno Gaume (Gaume 2008) sur la proxémie afin de déterminer les meilleurs sous-graphes susceptibles de présenter l’entourage d’une unité lexicale ou d’un vocable (entrée polysémique) au sein d’un Système Lexical.
Utiliser Spiderlex
Petit guide d'utilisation et démonstrationIl est recommandé de lire la courte documentation Ollinger & Polguère (2020) et de visualiser la démonstration préparée pour le congrès TALN 2020 avant de commencer à utiliser Spiderlex :
Accès Spiderlex au Réseau Lexical du Français (RL-fr)
Le RL-fr est composé à ce jour de plus de 28 700 nœuds et 77 800 arcs. Il est entièrement construit lexicographiquement au sein du laboratoire ATILF depuis 2011. Il a déjà atteint une grande maturité, en tant que Système Lexical, même si sa couverture du lexique français est encore partielle.
Voir les onglets Historique et Lexicographie du site des Systèmes Lexicaux pour plus d’information sur le travail lexicographique de construction du RL-fr.
Accès Spiderlex au Réseau Lexical de l'Anglais (RL-en)
Le RL-en est composé à ce jour de plus de 200 000 nœuds et près d’un million d’arcs. Il a été amorcé automatiquement à partir du WordNet de Princeton et, depuis, fait l’objet d’un travail de correction et d’enrichissement. Pour l’instant, l’essentiel des données qu’il contient est directement issu de WordNet. Du fait de sa source lexicographique – cf. les synsets de WordNet –, le RL-en est avant tout structuré par des relations lexicales de (quasi-)synonymie ; contrairement au RL-fr, il est subdivisé en une multitude de sous-graphes non connectés. Le travail lexicographique effectué à l’ATILF a pour but de faire évoluer graduellement la structure du RL-en vers celle d’un Système Lexical à part entière.
On trouvera dans Gader et coll. (2014) une description de la méthode utilisée pour compiler les données du WordNet de Princeton en une ressource lexicale organisée selon l’approche des Systèmes Lexicaux.
Références bibliographiques
Gader N., Ollinger S., Polguère A. (2014). One Lexicon, Two Structures : So What Gives ? Dans H. Orav, C. D. Fellbaum & P. Vossen (dir.) : Proceedings of the Seventh Global Wordnet Conference (GWC2014), Global WordNet Association, Tartu, pp. 163–171 [http://www.aclweb.org/anthology/W14-0122].
Gaume B. (2008). Mapping the forms of meaning in small worlds. International Journal of Intelligent Systems 23(7), pp. 848–862 [https://hal.archives-ouvertes.fr/hal-01322013].
Ollinger S., Polguère A. (2020). Guide de navigation Spiderlex (version du 19 mai 2020). Rapport technique, ATILF CNRS, Nancy [https://lexical-systems.atilf.fr/wp-content/uploads/2020/05/Spiderlex-doc-FR-19v20.pdf].