Dossiers



Les « chantiers numériques » : un accès à la culture pour tous
23 janvier 2007


> Communiqué de presse

> Dossier de presse (format pdf)

> Dossier de presse (format html)

> Discours de Renaud Donnedieu de Vabres




La valorisation du patrimoine linguistique


Depuis 2004, plusieurs chantiers pour la numérisation et la valorisation des corpus de langues parlées ont été mis en oeuvre. L'objectif de ce programme est de permettre la conservation du patrimoine linguistique tout en assurant l'accessibilité de celui-ci à l'ensemble des internautes. Le patrimoine linguistique français est en effet méconnu et de nombreux documents sonores uniques, conservés sur des supports physiques à bout d’usage (bandes magnétiques) sont voués à disparaître définitivement. La numérisation offre ainsi la possibilité non seulement de sauver ces documents, mais aussi de les valoriser en les transformant en de véritables ressources linguistiques numériques.

CREATION D'UN CENTRE DE RESSOURCES LINGUISTIQUES ACCESSIBLES A TOUS SUR LE SITE DE LA DGLFLF

Les langues de France représentent un patrimoine méconnu et une réalite vivante.

A côté du français, langue nationale, langue commune, elles sont notre bien collectif, elles contribuent à la créativité de notre pays et à son rayonnement culturel. Ce sont les langues régionales ou minoritaires parlées traditionnellement par Français sur le territoire de la République, et n’ont pas de statut de langue officielle. Une grande diversité les caractérise : langues romanes, langues germaniques, breton (celtique), basque (non indo-européen) dans l'Hexagone ; créoles, langues amérindiennes, polynésiennes, austronésiennes, bantoue outre-mer ; elles ont un nombre très variable de citoyens. Si des archives sonores existent, force est de reconnaître que la richesse constituée du français parlé et de la diversité des langues de France n’est accessible ni à l’ensemble de la communauté scientifique, ni au grand public.
Un véritable centre de ressources sur le plurilinguisme français a donc été mis en place sous la forme de liens thématiques structurés, proposant par exemple des dictionnaires en ligne, des données sur l'orthographe, la terminologie, le traitement automatique des langues, le plurilinguisme etc. Ces données ont vocation à être rassemblées, dans une étape ultérieure, sur une véritable plateforme de ressources linguistiques en ligne, construite autour de la base de données terminologiques Criter, dont une version rénovée (Criter +) sera mise en service fin juin 2007.

Adresses :

http://www.dglflf.culture.gouv.fr


Développement du programme « Corpus de la parole » et préparation d’un site-vitrine

Ce programme, lancé par la DGLFLF, en liaison avec la MRT et en partenariat avec les laboratoires linguistiques du CNRS, doit permettre de pallier le retard de la France dans la diffusion de son patrimoine numérique oral et assurer ainsi la vitalité du français et des langues de France comme source de diversité culturelle. Il vise à assurer la conservation des corpus oraux grâce à un plan de numérisation, le traitement d’archives scientifiques qui les transforme en objets du patrimoine culturel, et leur mise à disposition sur un site-vitrine qui rendra accessibles des extraits dans des dizaines de langues.
Un corpus oral n'est pas en effet une simple collection d'enregistrements de la parole humaine, mais un objet « construit », (enregistrements + catalogage, indexation, transcription, synchronisation du son et de la transcription...) : c’est la numérisation, la transcription, l'élaboration de métadonnées... qui permettent de passer d'un simple enregistrement à un objet patrimonial pouvant faire l'objet de recherche et de valorisation (par exemple, s'agissant de la parole, il est techniquement impossible de faire de la recherche d'occurrences sur du son, ce n'est possible que sur une transcription).
C'est un enjeu pour la recherche linguistique et pour le développement de l'ingénierie linguistique (reconnaissance et synthèse de la parole, traitement automatique des langues), c'est un enjeu aussi pour l'enseignement de ces langues, pour la sauvegarde et la diffusion du patrimoine oral.

Mise en ligne du site « voyage en chansons à travers les langues de France »

Le site « Langues de France en chansons » est destiné à sensibiliser le public à l'extraordinaire pluralité linguistique de la France à travers le vecteur de la chanson.
Il propose de découvrir la richesse des chansons traditionnelles et contemporaines dans ces différentes langues : langues régionales (alsacien, basque, breton, catalan, corse, flamand occidental, francique, francoprovençal, occitan, langues d'oïl) ; langues « non-territoriales » (arabe dialectal, arménien occidental, berbère, judéo-espagnol, romani, yiddish) ; langues d'outre-mer (créoles guadeloupéen, martiniquais, guyanais, réunionnais; langues de Guyane, langues canaques, langues de la Polynésie française; wallisien et futunien, langues de Mayotte...) ; la langue des signes française (LSF)...
Au cours de ce voyage, des données essentielles sur chacune de ces langues de France sont présentées à côté d'extraits musicaux de chansons d'hier et d'aujourd'hui.

Adresses :

http://www.languesdefranceenchansons.com