|
Corpus oraux en ligne

® Sur le site de Caen, on trouve un inventaire des
corpus accessibles, un descriptif (souvent lacunaire) et un lien vers
les corpus
http://www.unicaen.fr/corpus/consultation_disponibilite.php?type=transcription&dispo=oui
® Inventaire des corpus oraux de
la DGLFLF
http://www.culture.gouv.fr/culture/dglf/recherche/corpus_parole/Inventaire.pdf

® site de Asila :
http://www.loria.fr/projets/asila/corpus_en_ligne.html
Permet de télécharger ou d’accéder
à 9 corpus (mais qui sont sous des formats différents
: .doc, .txt, .xml). Il s’agit souvent de conversations (transactions
commerciales pour le corpus Air France, conversation téléphoniques…).
La transcription s’écarte de la simple orthographe standard,
ce qui peut rendre l’exploitation difficile.
® Site de Kate Beeching
http://www.uwe.ac.uk/facults/les/staff/kb/main.html
Permet de télécharger un fichier (de 698
pages) au format pdf : Il s’agit de 95 entretiens (de 1 à
30 minutes). Taille du corpus : environ 150 000 mots.

Sur certains sites, il est possible d’interroger la
base mise en ligne (mais il n’est pas possible de rapatrier les
corpus eux-mêmes).
® Sur le site DELIC, la requête porte sur le
CRFP (Corpus de Référence du Français Parlé):
http://www.up.univ-mrs.fr/delic/crfp/
Le corpus présente des situations variées
(avec une majorité d’entretiens). Taille du corpus : environ
440 000 mots.
Seules les 50 premières réponses sont fournies.
® Sur le site de la Base CLAPI, il
est possible de sélectionner des corpus pour formuler une requête.
L’investigation porte sur 19 corpus.
http://clapi.univ-lyon2.fr/
® Sur le site Elilap / Lancom / Elicop,
il est possible de formuler des requêtes sur le Corpus d’Orléans,
le corpus de Tours et le corpus d’Auvergne.
http://bach.arts.kuleuven.be/elicop/
Lancom contient presque 5 h de Français de France.
Corpus Voix d’Auvergne : 176 000 mots
Livre parlé de Tours : 36 000 mots
Corpus d’Orléans (Elicop) : plus de 900 000 mots.
|