Web sémantique : outils pratiques
Découvrez ici un certain nombre de publications, guides pratiques et outils pour vous approprier les enjeux du Web sémantique.
Le "Web sémantique", un ensemble de standards et technologies qui agissent en coulisses pour mieux mettre en lumière les contenus culturels
Le « Web 3.0 », dit aussi « Web sémantique », « Web des données » ou "Web des données liées", repose sur une extension des normes fondamentales du web. Cette évolution technologique transforme le Web, d'abord web de documents, puis un web social en web sémantique. C'est une des évolutions les plus importantes depuis la création du web au début des années 1990. Elle est en train de transformer le web en une gigantesque base de connaissance. Elle permet, entre autres, la réalisation d’outils de recherche d’information, de navigation, de visualisation, de traduction et de raisonnements automatiques (appelés inférences), hors de portée des moteurs de recherche classiques.
Elle est cependant quasiment inconnue du grand public (à la différence du Web 2.0, par exemple) car elle impacte en premier lieu l’écosystème profond du web, ce que l’on appelle « le web invisible », c’est-à-dire les gisements d’informations contenus dans les bases de données sous-jacentes au web. A terme, le Web 3.0 impactera fortement le champ culturel, tant sur le plan de l’organisation des ressources numériques que sur celui des usages, des outils et des infrastructures.
Le Web des données liées repose sur un ensemble de technologies et de standards qui ont pour but de favoriser l’interopérabilité. La structuration des métadonnées selon les standards et les technologies du web sémantique représentent un enjeu majeur pour améliorer la visibilité et la découvrabilité des contenus culturels. Les données liées permettent de valoriser les connaissances spécifiques à un secteur spécifique mais aussi de les mettre en perspective avec les données d’autres secteurs. Ces données liées peuvent constituer des graphes de connaissances qui pourront alimenter des algorithmes et des solutions tels que des moteurs de recommandation ou encore des systèmes d’annotation semi-automatiques.
Feuille de route Métadonnées culturelles et transition Web 3.0
Le secteur culturel, qui au niveau français a été l’un des premiers secteurs à amorcer un pas vers le web des données liées, est pleinement conscient de ses enjeux et bénéfices. A ce jour, la mise en œuvre et les choix techniques à opérer ou prioriser dans les projets de sémantisation nécessitent un appui et un accompagnement. C’est donc pour faciliter et encadrer cet appui et cet accompagnement que le Ministère de la Culture a établi une stratégie pour la sémantisation des données culturelles. Cette stratégie « Métadonnées culturelles et transition Web 3.0 » publiée dans une première version en 2014, s’articule autour de quatre grands axes : l’identification, l’interconnexion, l’interaction et la confiance. Une refonte de cette stratégie est actuellement en cours.
A télécharger
Vade-mecum pour les producteurs de données
Ce document s’adresse à tous les producteurs de données du secteur culturel (services du Ministère de la culture et de la communication, établissements publics, administrations territoriales, associations etc.) et même au-delà. On entend par producteur de données toute personne ou organisation chargée de la création, de l’alimentation ou de la gestion d’une base de données ou d’un service en ligne décrivant, à l’aide de métadonnées, des documents, des ressources, des contenus, que ceux-ci soient disponibles sous forme numérique ou analogique.
L’attribution d’identifiants uniques et pérennes aux entités que l’on décrit, quelle que soit leur nature, est absolument nécessaire pour garantir la bonne gestion, l’accessibilité et la réutilisabilité des données et des métadonnées que l’on produit.
L’objectif du vade-mecum Identifiants pérennes pour les ressources culturelles est de guider les producteurs de données, à partir de douze questions simples, dans la mise en place de ces identifiants.
A télécharger
Des guides pratiques
Recommandations techniques pour les métadonnées et standards
Les enjeux des métadonnées et des standards
Un programme de formation
Un programme de formation transverse est en place depuis 2018. Il est destiné à l’ensemble des personnels potentiellement ou directement acteurs dans ces évolutions au sein du ministère de la Culture et de ses établissements sous tutelle. La sensibilisation et le développement des compétences apparaît en effet d’autant plus décisif que les spécificités du Web 3.0 ne sont pas suffisamment connues, et encore moins techniquement maîtrisées, au sein des institutions culturelles.
L’enjeu de ce programme de formation transverse est :
- de faire monter en compétence, de façon homogène, l’ensemble des agents impliqués dans des projets orientés Web 3.0,
- de développer au sein du ministère et de ses établissements une culture commune du changement et de l’innovation,
- de faciliter l’émergence de projets traversant les disciplines et les organisations.
Le référentiel propose une découpage en quatre modules associés aux fonctions concernées par le web sémantique. Le parcours de formation propose trois séquences :
- Une initiation aux enjeux du Web 3.0
- Une mise en pratique
- La conduite de projet
A télécharger
Retracer la provenance des données pour plus de fiabilité et de confiance
Le Web sémantique et ses technologies favorisent l’interconnexion de nombreuses sources de données qui n’auront pas toutes la même fiabilité. Dans ce contexte, il est important de pouvoir retracer la provenance des données pour permettre aux utilisateurs de les réutiliser avec confiance. Le consortium W3 a élaboré un modèle, PROV, générique, extensible et interopérable, pour les métadonnées de provenance.
L'objectif de ce document est de « positionner le MCC en tant qu’expert sur la traçabilité des données numériques » et à faire un « état de l’art sur les modèles permettant de reconstituer la provenance des données ».
Un groupe de travail spécifique rassemblant des représentants des ministères de la Culture (MC) et des Affaires étrangères et du Développement international (MAEDI), d’une collectivité territoriale (Conseil général de la Gironde) et du Laboratoire d’informatique en image et systèmes d’information (LIRIS) s’est donc réuni d’avril à octobre 2014 pour dresser un état de l’art en matière de description de la provenance.
A télécharger
Application des technologies 3.0 à la description des événements culturels
Comment l’utilisation de technologies sémantiques (ou dites orientées Web 3.0) peut permettre le décloisonnement par l’interconnexion de données événementielles ?
Ce document s'adresse en priorité aux personnels des établissements culturels qui gèrent les agendas, les réseaux sociaux institutionnels, les productions multimédias, les ressources documentaires en ligne et les sites web en général.
Le Web est l’un des premiers vecteurs de diffusion et de valorisation de l’offre des institutions culturelles. Depuis quelques années, il détermine aussi les mécanismes de recommandation et, au final, les choix des sorties et visites culturelles.
Des conseils et des exemples pour interconnecter les données
Les institutions n’ont aujourd’hui aucun moyen technique d’organiser entre elles, à grande échelle, l’interconnexion de leurs données décrivant leurs collections ou leur programmation, car leurs agendas en ligne fonctionnent en mode silo.
Ce document montre, par l’exemple, comment l’utilisation de technologies sémantiques (ou dites orientées Web 3.0) permettra le décloisonnement par l’interconnexion de ces données. Il présente un panorama des modèles pour représenter ces données et il survole l’écosystème très riche des applications permettant de produire ou de consommer ces données, de visualiser et d’interagir avec des agendas culturels. Il offre enfin un certain nombre de préconisations quant à une évolution technique possible des systèmes d’information gérant les agendas culturels pour que ceux-ci bénéficient pleinement de la révolution des technologies dites 3.0.
Un projet pilote
Il recommande de mettre en place un projet pilote, sur un territoire restreint mais culturellement très riche (e.g. le bassin de la Villette à Paris), qui reprendrait ces préconisations pour accroître la visibilité de l’offre culturelle de ce territoire.
Quels bénéfices ?
Les bénéfices attendus sont multiples :
- pour le public, la possibilité d’effectuer des recherches thématiques transverses ou encore l’interconnexion des agendas avec les données de géolocalisation et de transport permettant un meilleur accès physique où les événements ont lieu; pour les centres de ressources culturelles, de nouveaux points d’accès pour leurs collections et leurs ressources, une meilleure visibilité dans les moteurs de recherche, le multilinguisme et la traduction favorisant le tourisme culturel;
- pour les acteurs culturels, un suivi précis de l’activité des créateurs (groupes musicaux, troupes de théâtre, danseurs…) tant au plan national qu’international.
- De manière générale, pour les professionnels de la culture, le recours à ces technologies et l’interconnexion de leurs agendas présentent un bénéfice certain en ressources humaines et moyens financiers sur le long terme.
A télécharger
Partager la page