Plateforme web sémantique pour l'archéologie

MASA (Mémoire des Archéologues et des Sites Archéologiques), consortium de la TGIR Huma-Num, en partenariat avec la société SPARNA, spécialisée en Web sémantique, et le Laboratoire d’Informatique Fondamentale et Appliquée de Tours (LIFAT), a développé la plateforme web sémantique OpenArchaeo. Exploitant les triplestores archéologiques appariés avec le CIDOC de manière fédérée, OpenArchaeo a été conçu avec deux interfaces distinctes.

Interface Machine : la Fédération

Accéder au Endpoint SPARQL

Ce service d'interrogation permet d'écrire des requêtes fédérées vers de multiples sources en langage SPARQL (langage de requête dédié au web sémantique). Cette fédération se présente comme un service SPARQL unique, mais capable d'interroger de façon transparente plusieurs sources de données de façon décentralisée.
Cette interface est couplée à des services web pour exploiter le triplestore MASA. Sa vocation est d’être exploitée par des machines et est donc davantage accessible à des informaticiens.

Interface Utilisateur : l'Explorateur

Accéder à l’Explorateur

L'explorateur, résolument convivial, est basé sur un système d’icônes et de concepts bien maîtrisés par les archéologues (Unité stratigraphique, Mobilier, Fait, Site...). Pour produire une requête SPARQL à partir du langage naturel, OpenArchaeo a fait l’objet du développement du composant SPARNATURAL, modulable et réutilisable. Ce système permet ainsi de générer une requête de manière intuitive, sans connaissance du langage SPARQL, mais en ayant une connaissance des principaux concepts de l’archéologie.


Le modèle de données d'OpenArchaeo

Pour mettre en place le triplestore MASA, les jeux de données sont appariés avec le CIDOC Conceptual Reference Model (CRM), l’ontologie de domaine dédiée au patrimoine culturel, coordonné par un consortium international (CRM SIG). Le rôle du CIDOC CRM, pour MASA, est de servir de surcouche unique et transversale pour faire communiquer des jeux de données archéologiques hétérogènes publiés sur le web, afin de les rendre interopérables sans modifier ni le format ni la structure des jeux de données initiaux.

Le triplestore MASA s'appuie sur l'ontologie du CIDOC-CRM et quelques unes de ses extensions (CRMarchaeo, CRMsci et CRMba). Il s'agit d'un modèle générique qui reprend les concepts de base rencontrés dans la plupart des corpus archéologiques (le site, l'opération, la structure, le fait, le mur, la sépulture, l'unité stratigraphique et le mobilier).

Chaque concept de base est ensuite détaillé : identifiant, appellation, description, typologie. Deux modules viennent compléter ce modèle, un pour associer de la documentation à n'importe quel concept de base et un second pour la datation éventuelle de chaque concept.


Publication

Marlet Olivier, Francart Thomas, Markhoff Béatrice et Rodier Xavier - OpenArchaeo for Usable Semantic Interoperability, in : Poggi Antonella - Proceedings of First International Workshop on Open Data and Ontologies for Cultural Heritage (ODOCH) co-located with the 31st International Conference on Advanced Information Systems Engineering (CAiSE 2019), Rome, Italy, June 3, 2019, Sapienza University of Rome, Rome, 2019. En ligne : http://ceur-ws.org/Vol-2375/paper1.pdf (PDF)