« Elle est ce grand courant d'air à travers le monde qui est constamment en métissage, en créolisation, en réinvention. » Elle, c’est la langue française dans l’espace immense de la francophonie, telle que l’a caractérisée, dans son discours d’ouverture de ce 19e Sommet de la Francophonie, le Président de la République. En effet, la langue française est à la fois une chance et une richesse pour les 88 Etats-membres de l’Organisation internationale de la Francophonie. Elle est aussi un véritable trait d’union qui réunit une communauté transnationale multipolaire, un réseau de performances humaines incroyables, de circulations, d’entraide et d’émulations.
Si la langue a ce pouvoir puissant de mettre les peuples en relation, c’est qu’elle est une réalité éminemment culturelle et sociale : sur ce point, le Sommet a donné lieu à plusieurs engagements. Sur l’un d’entre eux, le ministère de la Culture (Délégation générale à la langue française et aux langues de France (DGLFLF) est particulièrement en pointe, par un énorme travail préparatoire engagé dans la dynamique du plan présidentiel de 2018 langue française et plurilinguisme, qui va donner le jour, en 2025, au Centre de référence des technologies des langues, à Villers-Cotterêts.
Espace numérique et francophonie : pour une action publique volontariste
Le ministère de la Culture est en effet au cœur de l’une des grandes batailles de la francophonie : la lutte pour l’existence de la langue française dans l’espace numérique (et, avec elle, celle de la diversité culturelle et linguistique). Le lancement de l’Appel de Villers-Cotterêts adressé aux grandes plateformes numériques, un texte désormais de référence, ne peut que renforcer sa détermination. De même, l’article 20 de la Déclaration de Villers-Cotterêts : « [Nous] reconnaissons l’urgence d’agir dans l’environnement numérique et enjoignons aux institutions et opérateurs de la Charte de la Francophonie de mettre en œuvre des solutions en faveur de l’accessibilité, de la diversité linguistique et de la découvrabilité des contenus culturels, éducatifs et scientifiques francophones et l’entraînement en français de l’Intelligence artificielle générative… »
Avec l’essor de l’Intelligence Artificielle, ce qu’on appelle aujourd’hui les « technologies des langues » parviennent à réduire un fossé réputé infranchissable, celui de l’utilisation du langage humain, que les machines analysent, traitent et génèrent. Or, cette Intelligence Artificielle travaille actuellement sur des données en langue anglaise à 90%, au service d’entreprises anglo-saxonnes à plus de 80%. Les autres langues se partagent le reste et ce qui est alarmant, c’est que la moyenne des données françaises utilisées actuellement est dérisoire : 0,2% !
Il est donc urgent de lutter contre cet étouffement hégémonique, afin que les machines puissent parler et « penser » dans d’autres langues, notamment la nôtre, dans nos propres formes linguistiques, et surtout à partir de contenus francophones qui expriment nos références, nos cultures, nos choix. Il s’agit donc d’intervenir. De proposer d’autres modèles de collecte des données, pour entraîner, affiner et tester de nouvelles formes d’IA selon nos critères culturels.
Le Centre de référence des technologies des langues à Villers-Cotterêts : mutualiser et monter en puissance
Une plateforme complète de données francophones et plurilingues de haute qualité, voilà le besoin clairement exprimé par les industriels, les PME aussi bien que les grands groupes. C’est dans cet esprit que s’est préparée la fondation du Centre de référence des technologies des langues à Villers-Cotterêts : un grand pôle d’expertise réunissant les professionnels du traitement automatique du langage, écosystème opérationnel fondé sur l’excellence de nos entreprises, de nos chercheurs et de nos institutions, appuyé sur la mise en commun des outils les plus performants. En somme, un grand accélérateur de super-calculs génératifs, à base de données francophones.
Ce Centre comprendra deux composantes : le consortium ALT-EDIC et le projet LANGU:IA.
ALT-EDIC, autrement dénommé Alliance pour les technologies des langues, représente la composante européenne du Centre de Villers-Cotterêts. 17 Etats membres de l’Union Européenne contribuent à son budget, pendant que 8 autres s’y sont associés en tant que membres observateurs. Une centaine d’entreprises européennes travaillent aujourd’hui d’ores et déjà avec ALT-EDIC. Il s’agit de créer et développer des outils industriels et technologiques à partir de modèles de langues géants, au service du plurilinguisme, en soutenant les projets les plus prometteurs.
LANGU:IA est un projet francophone, composante nationale de l’ALT-EDIC, qui réunit des entreprises, des acteurs académiques, des collectivités ainsi que des acteurs publics et culturels autour des technologies de l'IA pour la langue française et les langues de France, avec pour objectif de développer une plateforme de coopération francophone. D’une part, en fédérant un écosystème du traitement automatique des langues au niveau local, national, européen et international francophone. D’autre part, en alimentant de contenus francophones les modèles de langage géants dont se nourrit l’IA.
LANGU:IA comprend également un projet pour la découvrabilité des contenus scientifiques en ligne, en partenariat avec le Québec. Ici il s’agit d’intervenir sur les applications des technologies des langues comme la traduction automatique, la publication, le partage, la visibilité, dans le but de rendre disponibles et facilement repérables les savoirs francophones par les usagers du net.
Signalons pour finir que le ministère de la culture (DGLFLF) va continuer à porter et à concrétiser ces grands projets. Pour en savoir plus, rendez-vous au prochain Sommet pour l’action sur l’Intelligence artificielle, que la France accueillera les 10 et 11 février 2025 !
Mutualiser la lutte contre la désinformation
C’est un autre enjeu majeur porté par le ministère de la Culture (Direction générale aux médias et aux industries culturelles – DGMIC), qui s’est rapproché pour cela du réseau francophone Théophraste, lui-même articulé à l’Agence universitaire de la francophonie : lutter contre la désinformation dans l’espace francophone.
Théophraste regroupe une vingtaine de centres de formation en journalisme qui ensemble contribuent à la définition du caractère spécifique des métiers du journalisme, au développement de la pédagogie de son enseignement face aux défis technologiques, économiques contemporains. Le respect de la pluralité culturelle, la réflexion sur les pratiques du métier et sur sa dimension éthique traversent les préoccupations constantes de Théophraste.
Théophraste va mener une recherche associant ses membres experts du Nord et du Sud de la francophonie, afin d’aboutir à un document de référence mutualisable entre toutes les écoles et institutions de formation en journalisme, mais aussi à l’attention d’enseignants et de personnels d’encadrement communautaire. Ce document, diffusé gratuitement sous forme numérique et imprimée, visera à développer les compétences de déconstruction critique des médias. Grâce à des exercices pratiques, il permettra d’outiller les écoles de journalisme et de contribuer à la formation des adultes en éducation aux médias et à l’information (EMI) à l’heure de l’intelligence artificielle générative.
Partager la page