Qu'est-ce qu'un thésaurus ?


Un thesaurus est un vocabulaire de termes contrôlés d'indexation, structuré de manière à ce qu'il mette en évidence les relations a priori entre les concepts. Comme une liste de mots-clés, c'est un instrument qui utilise une terminologie normalisée et contribue à aider l'utilisateur à sélectionner de manière logique des occurrences dans une base de données.

Cet outil documentaire offre en outre un certain nombre de développements et d'enrichissements propres à l'organisation des thesaurus monolingues telle qu'elle est définie par les normes ISO 2788 et AFNOR NF Z47-100.

Un thesaurus se distingue d'une liste de termes par les points suivants :

  • il permet de regrouper les termes d'un même domaine à l'intérieur d'une hiérarchie, et de les mettre en relation avec des termes d'autres domaines ;
  • la relation hiérarchique permet d'accéder à des concepts plus larges ou plus étroits à l'intérieur d'un même domaine ;

  • lorsque plusieurs termes peuvent rendre compte d'un même concept l'utilisateur est guidé vers le terme préférentiel choisi par l'indication des autres termes possibles dans le champ " employé pour " ; 
  • le thesaurus est un outil dynamique qui peut être mis à jour par ajout, modification ou suppression de termes ou relations entre termes.

Malgré la complexité de sa mise en oeuvre, un thesaurus présente des avantages certains sur une simple liste de mots-clés. Ainsi il permet en particulier d'améliorer la qualité de la sélection et d'éliminer les données récurrentes par l'utilisation de sa structure hiérarchique et relationnelle ; il permet aussi à un groupe d'utilisateurs de se servir d'un même système d'indexation quel que soit le niveau de précision requis par leur recherche.

Le thesaurus étant conçu avant tout pour l'indexation , il peut parfois mal se prêter à la recherche à partir du langage naturel. La nécessité de maîtriser le langage avant la recherche, l'absence de prise en compte de certaines relations associatives ou d'équivalence peuvent entraîner du "silence" lors de l'interrogation.

retour
haut de page