L'IA est-elle une opportunité ou une menace pour la langue française ?
L’IA représente un enjeu majeur pour toutes les langues, y compris le français. D'un côté, elle peut favoriser la présence du français en facilitant la production de contenus de qualité dans notre langue. De l'autre, si les modèles sont mal conçus, ils risquent d'appauvrir la langue, voire de favoriser l'anglais par défaut. C'est pourquoi nous devons développer nos propres outils, basés sur des données européennes de qualité, pour garantir un traitement respectueux et précis de nos langues.
Quels sont les enjeux pour la langue française dans le numérique et l'IA ?
Il y a un double enjeu. D'abord, un enjeu de souveraineté : nous ne pouvons pas dépendre d'outils conçus hors d'Europe pour traiter nos langues. Ensuite, un enjeu culturel : les modèles d'IA sont influencés par les contenus avec lesquels ils sont entraînés. Aujourd'hui, la majorité des modèles sont américains et l'anglais domine les bases de données. Cela fausse la manière dont nos langues et nos cultures sont représentées. Un modèle européen garantirait un équilibre et une meilleure représentation de notre diversité linguistique.
L'Europe peut-elle rivaliser avec les modèles américains ?
Oui, et c'est tout l'enjeu d'ALT-EDIC, dont le siège est situé au sein de la Cité internationale de la langue française, sur le site historique du Château de Villers-Cotterêts. Ce consortium européen, initié en février 2024, contribue au développement d’un grand modèle de langue multilingue, transparent et conforme à nos réglementations. Contrairement aux modèles américains, dont on ignore souvent les sources de données, nous voulons une approche plus éthique et transparente. L'ALT-EDIC offre une opportunité pour les pays européens de promouvoir et préserver leur diversité linguistique grâce à des outils numériques innovants et respectueux des droits et réglementations en vigueur.
Quels sont ses prochains défis ?
L'ALT-EDIC a remporté OpenEuroLLM, un projet européen d’un budget total d’environ 50 millions d'euros qui débutera en mars 2025 et visera à proposer un modèle de langue européen multilingue. Un autre projet européen, LLMs4EU, sera également coordonné par l'ALT-EDIC pour collecter des données dans toutes les langues européennes et développer des cas d'usage concrets en entreprise. L'avenir de nos langues se joue dans les technologies et il est crucial que les pouvoirs publics prennent conscience de l’importance de ces enjeux. Il n’est pas trop tard pour investir massivement et rapidement dans ces technologies.
La Délégation générale à la langue française et aux langues de France du ministère de la Culture, a publié en janvier dernier un recueil de 50 termes français recommandés de l’intelligence artificielle. Ces notions et leur définition sont enrichies d’équivalents dans d'autres langues fournis par des institutions partenaires.
ALT-EDIC, les langues sous le prisme de l’intelligence artificielle
En février dernier, lors du Sommet pour l’action sur l’IA, le ministère de la Culture et le ministère de l’Économie, des Finances et de la Souveraineté industrielle et numérique avaient annoncé la tenue d’un événement inaugural pour l’Alliance pour les technologies des langues (ALT-EDIC). Ce consortium européen pour une infrastructure numérique soutient le développement des technologies des langues et l’intelligence artificielle générative et contribue à la préservation de la diversité linguistique et de la richesse culturelle de l’Europe. « La réunion de 25 États dans ce consortium européen permet à l'Europe de déployer son ambition en termes de technologies des langues et d'intelligence artificielle. Leur travail commun sur les corpus de données et l'évaluation est un levier opérationnel puissant pour être à la hauteur du défi », déclare la ministre de la Culture Rachida Dati. ALT-EDIC a été officiellement créé en février 2024 et est installé depuis cette année à la Cité internationale de la langue française de Villers-Cotterêts.
C’est d’ailleurs dans ce lieu que l’Alliance sera officiellement inaugurée pendant la Semaine de la langue française et de la francophonie, du 18 au 20 mars. Trois jours pendant lesquels seront rassemblés des délégations des vingt-cinq pays européens membres ou observateurs de l’Alliance ainsi que soixante-dix partenaires européens qui plancheront sur les tous premiers projets de développement technologique. Ces travaux seront clôturés, le 20 mars, par une cérémonie d’inauguration solennelle, par la ministre de la Culture et la ministre délégué chargée de l’Intelligence artificielle et du Numérique.
Partager la page