|
|
Ingénierie linguistique - les enjeux :La reconnaissance vocaleDe la voix à l'écran. La reconnaissance vocale, c'est :
De la dictée en mots isolés à la dictée en temps réel
Auparavant l'ordinateur arrivait à comprendre
un mot après l'autre. Tous les logiciels de reconnaissance vocale imposaient au locuteur une pause entre chaque mot. Le locuteur devait au préalable enregistrer son texte puis le confier à la machine qui lui en rendait une version informatique.
Maintenant des systèmes se lancent dans la reconnaissance en continu de la parole. Le texte est dicté et il apparaît presque instantanément à l'écran.
Le système doit alors reconnaître les
mots mais surtout déterminer le début et la fin
de chacun d'entre eux. Quelles sont les principales applications ?
Grâce à sa carte sonore, l'ordinateur
numérise la voix. Celle-ci est découpée en
portions très réduites (de l'ordre d'un centième
de seconde). Ces portions sont ensuite reconstruites en " phonèmes "
(élément caractéristique et indivisible du langage). Ces phonèmes sont déterminés
acoustiquement par traitement du signal sonore et par comparaison
avec une bibliothèque de phonèmes stockée
dans le système. Celui-ci va ensuite coller ces phonèmes les uns aux autres afin de retrouver les mots dictés.
Les avantages de la reconnaissance vocale : Faciliter la navigation d'usagers inexpérimentés avec : L'ordinateur devient alors plus facile à utiliser pour ceux qui ne connaissent pas l'informatique, mais aussi pour les malvoyants et les handicapés.Voir quelques outils existants. |