Corpus oraux en ligne

 



® Sur le site de Caen, on trouve un inventaire des corpus accessibles, un descriptif (souvent lacunaire) et un lien vers les corpus

http://www.unicaen.fr/corpus/consultation_disponibilite.php?type=transcription&dispo=oui

® Inventaire des corpus oraux de la DGLFLF

http://www.culture.gouv.fr/culture/dglf/recherche/corpus_parole/Inventaire.pdf

 

 

® site de Asila :

http://www.loria.fr/projets/asila/corpus_en_ligne.html

Permet de télécharger ou d’accéder à 9 corpus (mais qui sont sous des formats différents : .doc, .txt, .xml). Il s’agit souvent de conversations (transactions commerciales pour le corpus Air France, conversation téléphoniques…). La transcription s’écarte de la simple orthographe standard, ce qui peut rendre l’exploitation difficile.

 

® Site de Kate Beeching

http://www.uwe.ac.uk/facults/les/staff/kb/main.html

Permet de télécharger un fichier (de 698 pages) au format pdf : Il s’agit de 95 entretiens (de 1 à 30 minutes). Taille du corpus : environ 150 000 mots.

 

 

Sur certains sites, il est possible d’interroger la base mise en ligne (mais il n’est pas possible de rapatrier les corpus eux-mêmes).


® Sur le site DELIC, la requête porte sur le CRFP (Corpus de Référence du Français Parlé):

http://www.up.univ-mrs.fr/delic/crfp/

Le corpus présente des situations variées (avec une majorité d’entretiens). Taille du corpus : environ 440 000 mots.
Seules les 50 premières réponses sont fournies.

 

® Sur le site de la Base CLAPI, il est possible de sélectionner des corpus pour formuler une requête. L’investigation porte sur 19 corpus.

http://clapi.univ-lyon2.fr/

 

® Sur le site Elilap / Lancom / Elicop, il est possible de formuler des requêtes sur le Corpus d’Orléans, le corpus de Tours et le corpus d’Auvergne.

http://bach.arts.kuleuven.be/elicop/

Lancom contient presque 5 h de Français de France.
Corpus Voix d’Auvergne : 176 000 mots
Livre parlé de Tours : 36 000 mots
Corpus d’Orléans (Elicop) : plus de 900 000 mots.