Corpus de la parole
La possibilité d’enregistrer la parole humaine a bouleversé nos connaissances sur les langues parlées. Le programme Corpus de la parole réalisé en partenariat avec le CNRS entreprend de donner accès à des documents sonores qui démontrent la richesse et la vitalité de notre patrimoine linguistique.
L'oral, cœur de la langue, reste un continent peu exploré. L'exploitation d'enregistrements oraux offre une description des langues dans toutes leurs finesses (variété des prononciations, richesse d'une grammaire peu connue, créativité lexicale, subtilité des conversations ordinaires ...) mais est aussi un enjeu pour l'ingénierie linguistique (synthèse de la parole, reconnaissance de la voix, transcription automatique, dialogue homme-machines…), pour la didactique (méthodes de langues…) et pour les recherches en acquisition ou même en pathologie du langage.
Mieux connaître l'oral, c'est aussi l'occasion de reconnaître un patrimoine linguistique dans toute sa diversité.
Réalisé en partenariat avec le CNRS, le site du ministère de la culture et de la communication offre une vitrine des langues qui valorise le patrimoine linguistique. Il donne accès en ligne à un catalogue collectif de fonds sonores provenant principalement du monde de la recherche et constitué de plusieurs centaines d'heures transcrites et numérisées de français parlé dans toutes ses variétés et variations, et de différentes langues de France ( occitan, judéo-espagnol, créoles, basque, nemi, drehu, breton…) parlées sur le territoire national.
Ces corpus offerts à tous permettront à chacun de mieux appréhender la richesse de ces ressources linguistiques. Les chercheurs pourront étudier ces langues et repérer les corrélations entre les énoncés et les circonstances de leur production. Les curieux pourront découvrir ces langues à travers un parcours sonore.
Partager la page