Ingénierie linguistique - les outils et les applications :

Dictionnaire intégral : MEMODATA

C'est le dictionnaire lui-même, son modèle linguistique, sa base de données et son modèle conceptuel. Cela signifie qu'il est utilisé à la fois pour des projets éditoriaux de dictionnaire et pour les travaux de traitement automatique de la langue (interprétation, génération, résumé...)

Il existe et gère jusqu'à cinq langages. Prochainement le russe, le grec et le portugais seront ajoutés.

Le niveau conceptuel

La partie conceptuel (non-linguistique) comporte 40.000 concepts structurés sur près de 40 niveaux et est utilisée par les cinq langues (Français, Anglais, Italien, Espagnol and Allemand).

Ce niveau considère les mots-sens dans leurs relations avec le monde : c'est un modèle du monde (quelque chose comme un gros thésaurus fortement structuré).

Ce niveau extra-linguistique fournit des liens comme la thématique, l'isotopie, le générique-spécifique, le métonyme-holonyme.

D'autre part ce niveau prend en charge un certain nombre de fonctions lexicales considérées par nous comme non-linguistique. Par exemple, "être un ensemble de", "être le chef de", ...

Pour le français, 180.000 mots-sens sont concernés par ce niveau. Il y a environ 35.000 mots qui correspondent à 45.000 mots-sens pour chacune des quatre autres langues.

Ce niveau est destiné à fournir une interprétation extra-linguistique des textes.

Le niveau linguistique

Une zone linguistique - ou sous-conceptuel , ou encore micro-systémique - fournit des liens entre les mots comme :

  • une définition complète
  • des exemples d'emploi des mots-sens
  • les traductions courantes d'un mot-sens
  • des fonctions lexicales comme :
    • des synonymes et antonymes
    • des modificateurs typiques
    • des verbes supports
    • des dérivés syntaxique
    • ...

Ce niveau fortement dépendant de chaque langue est beaucoup plus développé pour le français que pour les autres langues.

Enfin, il y a environ 350 étiquettes (niveau de langue, origine, domaine, ...) qui fournissent des limitations formelles pour certains mots-sens.

Les produits : Dicologique, Ideoptima, Lexidiom, Semiographe

Coordonnées de Memodata.