Ouverture des inscriptions au colloque MASA

Bâtiment Max Weber

Le colloque « Archivage, publication et mise à disposition de données archéologiques » du consortium MASA aura lieu les 26 & 27 septembre 2016 à Nanterre (bâtiment Max Weber).

Le colloque comprend une après-midi de conférences (26/09), deux tables rondes
(27/09, matin) et six ateliers (27/09, après-midi).

Programme et inscriptions, obligatoires pour les ateliers :
https://masa2016.sciencesconf.org/

Accès gratuit, sur inscription et dans la limite des places disponibles.

#MASA2016

Colloque MASA les 26 et 27 septembre 2016

Le consortium MASA organise un colloque qui se tiendra sur le campus de Nanterre (bâtiment Max Weber) le lundi 26 septembre et le mardi 27 septembre.

Programme provisoire

Lundi 26 septembre 2016

13h30 Accueil des participants

14h Ouverture du colloque par Frédéric Hurlet, Université Paris Ouest Nanterre La Défense

14h30 « Du carnet de fouilles aux systèmes d’information archéologiques de terrain : quelques remarques sur l’évolution de l’enregistrement et l’impact de l’informatisation »- Bruno Desachy (ArscAn, CNRS-Université Paris 1-Université de Paris Ouest-MCC)

15h : « Présentation du consortium 3D » – Jean-François Bernard et Sarah Tournon-Valiente (Archéovision, CNRS-Université de Bordeaux)

15h30 Pause

15h45 : « Annotation sémantique spatialisée de représentations numériques d’objets patrimoniaux » – Livio De Luca (MAP, CNRS-MCC, Marseille)

16h15 « Digital Preservation and Access in a European Perspective: Introducing ARIADNE »- Julian Richards (University of York) et Federico Nurra (Inrap)

Mardi 27 septembre 2016

Matinée : Tables rondes

9h30-11h Table ronde « Retour d’expérience sur le traitement et la valorisation d’archives archéologiques », animée par Elisabeth Bellon et Corinne Jouy-Barbelin

9h Accueil des participants

9h15 « Traitements de la documentation archéologique conservée au Centre Camille Jullian : Fréjus, Cherchel et fonds G. Souville. » – Véronique Blanc-Bijon, Bruno Baudoin et Stéphanie Satre

9h30 « Le fonds d’archives Henri Hubert : traitement et valorisation complexe d’un père de l’archéologie comparée »- Corinne Jouys-Barbelin

9h45 « Le traitement du fonds Michel de Boüard » – Dominique Roux

10h00 « Les archives de Salamine de Chypre et le projet d’archivage électronique à la MOM » – Patrick Desfarges

10h15 Discussion puis Pause

10h45-12h45 Table ronde « Publication et données interopérables », animée par Xavier Rodier et Dominique Roux

10h45 « Internet Archaeology – the Editor’s tale. 20 years of publishing archaeology on the web » – Judith Winters (University of York)

11h05 « Publications logicistes » – Elisabeth Zadora-Rio (CITERES, CNRS-Université François-Rabelais, Tours) et Pierre-Yves Buard (MRSH, Caen)

11h25 « Médiation sémantique appliquée aux données de fouilles archéologiques » – Béatrice Bouchou-Markhoff (LI, Université François-Rabelais, Tours) et Olivier Marlet (CITERES, CNRS-Université François-Rabelais, Tours)

11h45 Discussion

12h30-13h15 Déjeuner

Après-midi : Ateliers

« Manipuler Protégé/Ontop pour rendre interopérable grâce au CIDOC CRM des systèmes d’informations archéologiques (CITERES) » -Olivier Marlet et Anne-Violaine Szabados

« La traçabilité de l’image en archéologie de sa production à sa diffusion et conservation pérenne » -Esther Magnière et David Sarmiento-Castillo

« Des mots-clefs pour les données archéologiques : l’écosystème PACTOLS » – Blandine Nouvel, Evelyne Sinigaglia

« Comment gérer et exploiter ses référentiels avec OpenTheso » – Miled Rousset

« Démonstration du logiciel AtoM : utilisation et réalisations » – François Rimelen et Bruno Morandière

« Retour d’expérience sur la re-documentarisation d’une BDD FileMaker « – Nathalie Le Tellier-Becquart et Thomas Francart

Des outils d’enrichissement documentaire multilingues pour l’archéologie

Le thésaurus PACTOLS pour l’archéologie est né en 1987 de la nécessité d’organiser les mots-clés utilisés pour l’indexation les notices du tout jeune Catalogue Collectif Indexé du réseau FRANTIQ. Organisé en 7 branches principales (Peuples et cultures, Anthroponymes, Chronologie relative, Toponymes, Œuvres, Lieux, Sujets), il concerne l’ensemble de la discipline archéologique, depuis la Préhistoire jusqu’aux époques contemporaines, et les sciences des l’Antiquité dans tous leurs domaines. Il compte aujourd’hui plus de 30.000 descripteurs. Leur traduction est entreprise très tôt pour assoir sa normalisation et favoriser la diffusion du thésaurus : l’anglais d’abord, puis progressivement l’italien, l’espagnol, l’allemand. Le soutien du TGE Adonis puis de la TGIR Huma-Num ne s’est jamais démenti au cours de ces travaux, que ce soit dans le cadre du consortium Référentiels (2009-2010) pour la traduction dans les quatre langues européennes, nécessaire à la transformation en SKOS du thésaurus, puis récemment au sein du consortium MASA pour la traduction en langue arabe. L’appui du programme MULTITA (2012-2014), piloté par les Musées royaux d’art et d’histoire (RMAH) et l’Institut royal pour le patrimoine culturel (RICH) de Belgique, a par ailleurs permis la traduction des termes en néerlandais. Ainsi, les PACTOLS constituent un réservoir terminologique riche, sans cesse mis à jour par le groupe de travail dédié de FRANTIQ. Aujourd’hui, son multilinguisme est mis à profit par le moteur de recherche ISIDORE pour l’enrichissement des résultats du moteur de recherche.

Notice ISIDORE en provenance de Persée, enrichie avec les métadonnées de PACTOLS

Contribution française à l’infrastructure DARIAH, le thésaurus PACTOLS est impliqué aussi dans des projets d’alignement avec d’autres vocabulaires spécialisés, par exemple avec le Art and Architecture Thesaurus (AAT) du Getty Trust grâce au projet d’infrastructure européenne pour l’archéologie ARIADNE, ou avec le Thésaurus du DAI, ou bien encore plus pointus comme les index de la base ArSol de l’équipe LAT de CITERES (voir le billet de O. Marlet : Alignement ArSol-PACTOLS).

Mais c’est le logiciel OpenTheso qui révèle la richesse des PACTOLS : développé sous licence libre par la Tête de Réseaux Documentaires de la Maison de l’Orient et de la Méditerranée pour répondre aux besoins de FRANTIQ, ce gestionnaire de thésaurus offre des fonctionnalités de gestion avancée et de recherche multilingue dont les deux dernières versions ont largement bénéficié de l’appui du Consortium MASA. Il constitue un atout fort pour la diffusion et l’utilisation des PACTOLS grâce à ses webservices et à la génération automatique d’identifiants pérennes pour chacun des descripteurs. Ainsi, il permettra prochainement l’accès direct aux PACTOLS depuis le nouveau portail de la fédération pour faciliter la recherche dans le catalogue. Son intégration à des chaînes XML de production éditoriale (en particulier la solution développée par le pôle éditorial de l’université de Caen) permettra aussi d’offrir à la communauté des éditeurs académiques un outil d’indexation multilingue et clé en main pour l’ajout de mots-clés spécialisés dans les publications scientifiques.

Journée d’études « Archives de la recherche française à l’étranger » à Aix le 3 décembre

La MMSH organise une journée d’étude le 3 décembre sur le thème :

» Archives de la recherche française à l’étranger: Que faire de nos archives ? Du traitement à la valorisation »

MMSH, Aix-en-Provence
le jeudi 3 décembre 2015
salle 101, 10h – 13h

Programme

10h : Présentation

10h10 : « Gestion et valorisation des archives de la fouille de Baelo Claudia par la Casa de Velázquez », par Laurent CALLEGARIN (directeur des études, École des Hautes Études Hispaniques et Ibériques, Casa de Velázquez, Madrid)

10h45 : « Projet de traitement des archives du Centre Camille Jullian, fonds Souville (Préhistoire du Maroc) : de la numérisation à la gestion des métadonnées », par Abdeljalil BOUZOUGGAR (Institut national des Sciences de l’Archéologie et du Patrimoine, Rabat – IMéRA, Aix-Marseille Université, Marseille)

11h30 : « Les archives inédites berbères de la MMSH (IREMAM / Encyclopédie berbère) : a) le fonds linguistique et littéraire Arsène Roux ; b) le fonds photographique touareg Marceau Gast », par Salem CHAKER (Directeur de l’Encyclopédie berbère, Professeur de berbère, Aix-Marseille Université, IREMAM-MMSH, Aix-en-Provence)

12h15 : « L’épigraphie de Cherchel au Centre Camille Jullian, de l’inventaire à une base de données épigraphique », par Philippe LEVEAU (professeur émérite, Aix-Marseille Université, Centre Camille Jullian, Aix-en-Provence), Bruno BAUDOIN (responsable de la photothèque du CCJ UMR 7299, AMU-CNRS) et Stéphanie SATRE (CCJ UMR 7299, AMU-CNRS)

12h50 : DiscussionsRencontre ouverte à tous, inscrite dans le cadre du consortium « Mémoires des archéologues et des sites archéologiques ».

Contacts :
V. Blanc-Bijon (antafr@mmsh.univ-aix.fr)
Bruno Baudoin (baudoin@mmsh.univ-aix.fr)
Stéphanie Satre (satre@mmsh.univ-aix.fr)

Plan d’accès

Journées « Ontologies en Sciences Humaines et Sociales »

Xavier Rodier (UMR 7324 CITERES – LAT) – Introduction

Les 9 et 10 novembre 2015 s’est tenu à Tours le séminaire sur les ontologies en SHS, co-organisé par le Laboratoire Archéologie et Territoire de l’UMR CITERES, le consortium MASA (« Mémoire des Archéologues et des Sites Archéologiques », labellisé par la TGIR Huma-Num) et la MSH Val de Loire qui accueillait cet événement.

L’affluence dès l’ouverture des inscriptions est révélatrice de l’intérêt croissant de la communauté SHS pour le sujet, ainsi que du besoin de formation vu la rapidité à laquelle les ateliers du 10 novembre ont été complets alors que la capacité d’accueil a été finalement doublée grâce à Thérèse Libourel et Benjamin Cogrel qui ont accepté de doubler leur atelier.

Aujourd’hui, le développement des outils et méthodes de l’archéologie s’inscrit, avec toute l’informatisation des sciences humaines et sociales (SHS), dans ce qu’il est convenu d’appeler les Digital Humanities, maladroitement traduit littéralement par « humanités numériques ». Le champ que cela recouvre est beaucoup plus large que la vitrine des données accessibles en ligne et correspond à un mouvement de fond qui fait sans conteste progresser la recherche en SHS. Si cela donne l’impression d’un pas de géant en avant, avec lequel les domaines jusque-là les moins versés dans l’informatique se retrouvent au-devant de la scène ayant en quelque sorte l’avance de leur retard, cette dynamique masque de nombreux travaux de fonds engagés de longue date mais moins spectaculaires. En d’autres termes, la dynamique des Digital Humanities est incontestablement positive pour l’ensemble des SHS. Avec des moyens informatiques offrant des puissances de calcul et des capacités de stockage colossales et en croissance permanente, l’accès aux données et les perspectives de mise en relation des informations sont incommensurables. Néanmoins, la modélisation et la structuration des données restent fondamentales pour que le mouvement soit efficace. Dans ce domaine, de nombreux travaux ont été menés dès les débuts de l’informatique dans différentes disciplines des SHS et en particulier en archéologie avec Jean-Claude Gardin dès la fin des années 1950.

Les inventaires, les classifications et les typologies archéologiques entretiennent une relation évidente avec la gestion informatique de données. De même, les méthodes d’enregistrement des données de fouilles qui fondent le raisonnement archéologique présentent bien des similitudes avec les procédures informatiques. Jean-Claude Gardin relevait ainsi une analogie entre le raisonnement archéologique et le modèle de la machine « boîte noire » en cybernétique pour le passage des données initiales que Jean-Claude Gardin qualifie de matériaux, aux propositions finales, interprétations inférées qui constituent les résultats synthétiques. La machine, elle, est composée de toutes les opérations permettant de passer de l’un à l’autre qu’ils soient analytiques, quantitatifs, analogiques ou numériques, intellectuelles.

L’avènement des Digital Humanities auquel on assiste, va de pair avec l’augmentation exponentielle de la documentation numérique dans toutes les disciplines des SHS. En archéologie, Il existe autant de bases de données qu’il existe d’équipes d’archéologues, voire plus. Les logiciels et les structurations sont extrêmement hétérogènes mais, une fois abandonné le débat stérile sur la possibilité de faire adopter par la communauté des archéologues un système unique, capable de répondre à toutes les situations, il faut mettre en place des solutions d’interopérabilité pour interroger les données. Les ontologies, en proposant une structuration globale par grand domaine, permettent de faire communiquer des corpus hétérogènes. La publication des systèmes d’information dans le web des données constitue l’aboutissement de la démarche qui offrira l’interconnexion des données. Là encore, en archéologie ainsi que dans l’ensemble des SHS, les ontologies et le web apparaissent comme le nouvel Eldorado qui va permettre de pallier les lacunes de structuration en mettant en relation toutes les données entre elles, comme par magie. Nous avons choisi une approche, plus besogneuse, qui consiste à concevoir un outil d’interrogation des bases de données existantes sans les modifier via une ontologie avec laquelle il convient de les mettre en correspondance.

La définition d’ontologie se trouve à l’interface entre la philosophie et l’informatique. Pour la première il s’agit de la science de ce qui est en tout domaine de la réalité et de ce qui pourrait être. Pour la seconde, il s’agit d’une spécification de la conceptualisation d’un domaine donné. Dans les systèmes d’information, l’ontologie est fondée sur trois éléments fondamentaux : entités (choses ou objets), attributs (caractéristiques des objets) et relations (d’une part entre objet et attributs, d’autre part entre objets de même nature ou de nature différentes et entre attributs). Que ce soit en philosophie, en informatique ou pour les systèmes d’information, les définitions convergent dans leur ambition de décrire le monde ou un domaine du monde à l’aide d’une conceptualisation générique. Il existe bien sûr des différences d’approchent que Lena Sanders et Hélène Mathian résument dans leur ouvrage récent Objets géographiques et processus de changement, en qualifiant l’approche philosophique de top down et l’approche informatique de bottom up. Sans approfondir cette approche théorique à partir des définitions, je veux simplement insister sur le fait qu’appliquer une ontologie à son domaine de recherche constitue une démarche ambitieuse qui d’une part nécessite une formalisation robuste des objets, attributs et relations du domaine, d’autre part ne se résume évidemment pas à une ou des solutions techniques.

Dans le cas de l’archéologie, le Consortium MASA, réunit plusieurs acteurs de la recherche archéologique française et a pour mission, entre autres, de proposer des solutions pour pérenniser et homogénéiser l’information archéologique. Au sein de ce consortium, La Laboratoire Archéologie et Territoire travaille sur l’interopérabilité des données archéologiques à partir d’ArSol.

L’objectif est de mettre en place un accès unifié à des corpus numérisés en utilisant des procédures et des outils communs. Pour partager les données, sans modifier le système d’origine, et pour permettre leur interrogation, il est nécessaire de s’affranchir à la fois du logiciel, de la structure, du vocabulaire, de l’accessibilité et de la langue. L’utilisation de l’ontologie du CIDOC-CRM (http://www.cidoc-crm.org/), que Patrick Le Bœuf présentera et qui porte sur la structuration des données numériques pour le patrimoine culturel, s’est donc imposée comme étant le modèle le plus complet pouvant constituer un point de concordance entre diverses bases de données archéologiques. L’ontologie est utilisée comme une surcouche de description commune par laquelle peut passer l’interrogation, ce qui permet de communiquer avec chaque base de données moyennant un système d’équivalences. Le principe est de faire correspondre les entités de l’ontologie avec les champs de la base de données. Le fait de passer par la modélisation d’une ontologie permet de s’affranchir à la fois du logiciel du système de gestion de base de données et de la structure propre à la base de données source. On touche alors une puissante solution d’interopérabilité et une ouverture vers le web sémantique.

Lundi 9 novembre 2015

Thérèse Libourel (Université de Montpellier) – Les ontologies.

Thérèse Libourel a ouvert ces journées par une présentation des grands principes des ontologies. Elle en a présenté les origines, les définitions possibles et les différents formalismes existant. Un tour d’horizon complet pour bien situer le cadre de nos journées.

Thérèse Libourel, Ontologies en SHS, 2015-11-09, Tours from UMR 7324 CITERES – Laboratoire Archéologie et Territoires, Tours

Patrick Le Bœuf (BNF) – Présentation du CIDOC CRM.

La présentation de Patrick Le Bœuf était axée sur le CIDOC CRM, avec description de sa structure centrale et quelques notions clés nécessaires pour bien comprendre le fonctionnement de cette ontologie destinée aux objets patrimoniaux.

Présentation du CIDOC CRM 20151109 from Patrick Le Boeuf

Anne-Violaine Szabados (UMR 7041 ArScAn – ESPRI&LIMC) – Objets & Cie : réseaux d’informations dans le graphe culturel.

En pratique, que faire d’une ontologie comme le CIDOC CRM ? Anne-Violaine Szabados a présenté les utilisations possibles pour le projet Lexicon Iconographicum Mythologiae Classicae dont l’objet est l’étude de l’iconographie de la mythologie classique à travers des objets antiques très variés.
Béatrice Bouchou-Markhoff (Université de Tours, Laboratoire d’Informatique) – Ontologies en SHS, exemples d’architectures logicielles.

Pour commencer à aborder la partie logicielle, la présentation de Béatrice Bouchou-Markhoff faisait le point sur les différentes architectures possibles pour intégrer différentes sources de données, en replaçant l’ontologie au sein de ces architectures.

Oshs_9_11_2015 from Béatrice Bouchou

Benjamin Cogrel (Université de Bozen-Bolzano, Italie) – Accès aux données suivant le principe OBDA avec Ontop.

Avec l’intervention de Benjamin Cogrel, l’aspect logiciel a été abordé très concrètement avec la présentation d’Ontop (cadriciel de reformulation de requêtes) et SPARQL (qui permet de faire des requêtes sur des bases de données transformées en graphe RDF virtuels).

Benjamin Cogrel, Accès aux données à un niveau conceptuel avec Ontop from UMR 7324 CITERES – Laboratoire Archéologie et Territoires, Tours

Pierre-Yves Buard (Université de Caen) – Micro-ontologies : expérimentations et perspectives.

Si l’ontologie peut paraître complexe, Pierre-Yves Buard nous a prouvé avec quelques exemples très concrets qu’il était possible de mettre en œuvre de manière pragmatique des micro-ontologies pour des projets de recherche spécifique.
Stefanie Gehrke (Equipex Biblissima) – L’utilisation d’ontologies dans le cadre de Biblissima.

Biblissima est un projet Equipex portant sur le patrimoine écrit du Moyen-Âge et de la Renaissance. Stefanie Gehrke a présenté la complexité de la structuration des différents éléments du projet et la nécessité d’utiliser les ontologies pour porter ces informations sur le web sémantique.

L'utilisation d’ontologies dans le cadre de Biblissima from Equipex Biblissima

Xavier Rodier et Olivier Marlet (UMR 7324 CITERES – LAT) – Ontologie et interopérabilité en archéologie, l’exemple d’ArSol.

Cette présentation est le retour d’expérience du l’utilisation d’une ontologie (le CIDOC-CRM) pour rendre interopérables plusieurs bases de données archéologiques (ArSol, pour ce prototype) et permettre de les interroger de manière unique tout en laissant les données dans leur base d’origine.

ArSol et ontologies 20151109 from UMR 7324 CITERES – Laboratoire Archéologie et Territoires, Tours

Mardi 10 novembre 2015 : Ateliers

Thérèse Libourel : L’utilisation du logiciel Protégé

L’atelier de Thérèse Libourel a permis aux stagiaires de découvrir les principes fonctions du logiciel Protégé qui permet de gérer des ontologies. Cette découverte a montré l’importance de la modélisation en amont afin de bien structurer les données et en faciliter l’exploitation ensuite par une ontologie.

Thérèse Libourel, atelier Ontologies avec Protégé from UMR 7324 CITERES – Laboratoire Archéologie et Territoires, Tours

Benjamin Cogrel : L’utilisation du logiciel Ontop

L’atelier de Benjamin Cogrel était un apprentissage, pas à pas, de l’utilisation de l’extension intégrant les fonctionnalités d’Ontop au sein du logiciel Protégé. Avec des exemples concrets, les stagiaires ont pu explorer les différentes étapes : connexion d’une base de données, création d’une ontologie, alignement entre l’ontologie et la source de données et enfin l’utilisation du moteur d’inférence pour traduire des requêtes SPARQL de haut-niveau en requêtes SQL à destination de la source de données.

Benjamin cogrel, atelier Ontologies et Ontop from UMR 7324 CITERES – Laboratoire Archéologie et Territoires, Tours

Alignement ArSol-PACTOLS

Le 12 octobre, s’est tenue à Nanterre une réunion regroupant des responsables du réseau Frantiq, les responsables de la base ArSol, base archéologique utilisée par le Laboratoire Archéologie et Territoires (MSH Val de Loire) à Tours, et d’autres membres du Consortium. Cette réunion avait pour objectif de définir les prérequis et les objectifs nécessaires pour permettre d’aligner les vocabulaires utilisés dans ArSol avec les thésaurus multilingues de PACTOLS.

L’objectif sera de lier chaque terme utilisé dans ArSol (entre autre les éléments permettant d’identifier le mobilier archéologique et les faits) avec les identifiants ARK du vocabulaire des PACTOLS pour permettre une interaction d’ArSol avec la ressource libre OpenTheso. En outre, les termes présents dans ArSol mais qui ne sont pas présents dans les PACTOLS seront proposés en tant que nouveaux candidats pour enrichir ces thésaurus.

un contrat, financé en majeure partie par MASA, débutera en novembre pour effectuer les développements indispensables pour améliorer l’interopérabilité d’ArSol et progresser vers sa diffusion dans le web de données.

Semantic Web for Cultural Heritage

Dans le cadre du 19th East-European Conference on Advances in Databases and Information Systems (ADBIS) qui se tenait à Poitiers du 8 au 11 septembre 2015, un workshop d’une journée était organisé le 8 septembre sur la thématique « Semantic Web for Cultural Heritage » (SW4CH) avec de nombreux intervenants présentant leurs travaux en lien avec le CIDOC-CRM.

Le Laboratoire Archéologie et Territoires y était présent pour présenter sous forme de poster le travail effectué dans le cadre de MASA sur l’interopérabilité des bases de données archéologiques grâce à l’ontologie du CIDOC-CRM.

PDF du poster présenté : MASAposterSW4CH_2015 (1,28Mo)

Formation XML-TEI du 8 au 10 septembre 2015

Du 8 au 10 septembre, l’équipe du pôle document numérique de Caen dispense une formation de trois jours à la MSH de Tours sur le standard XML-TEI. Cette formation organisée par Dominique Roux (co-pilote du segment « Edition » de la BSN) dans le cadre de MASA est animée par Dominique Roux, Edith Cannet, Guillaume Quéruel et Pierre-Yves Buard.

A lire :

What is the Text Encoding Initiative? de Lou Burnard
Guidelines de la TEI
Liste des modules TEI
XSLT pour les nuls de Lou Burnard (introduction à XSLT)
EAD (site de la BnF)
EAD (site de la bibliothèque du congrès : téléchargement de la dernière version)
Métadonnées géographiques (Directive INSPIRE)

Exemples :

Projet Epidoc (épigraphie)

Journées « Ontologie en Sciences Humaines et Sociales » – Du 9 au 10 novembre 2015 à Tours

Le Consortium Mémoire des Archéologues et des Sites Archéologiques (MASA), la MSH Val de Loire et l’UMR CITERES organisent conjointement deux journées sur les ontologies en Sciences humaines et sociales (SHS). Une première journée de séminaire sera consacrée à des présentations théoriques ou méthodologiques appuyées sur des études de cas. La seconde journée proposera deux ateliers sur le logiciel Protégé et sur l’extension Ontop permettant de créer et manipuler des ontologies.

Vous trouverez le programme complet sur le site de la MSH Val de Loire.

Objectifs

Ces journées ont pour objectif de présenter des exemples de mise en œuvre d’ontologies en SHS et d’échanger sur les pratiques et les perspectives dans ce domaine. L’atelier de la seconde journée offrira la possibilité de manipuler des logiciels dédiés aux ontologies (Protégé et Ontop).

Public

Les journées sont ouvertes aux chercheurs, enseignants-chercheurs, doctorants, ingénieurs et techniciens, rattachés aux disciplines des sciences humaines et sociales, qu’ils soient novices dans le domaine des ontologies, ou de niveau plus avancé.

Inscription

Inscription gratuite mais obligatoire via le formulaire d’inscription sur le site de la MSH Val de Loire avant le 16 octobre 2015 : http://msh.univ-tours.fr/article/journees-ontologie-en-sciences-humaines-et-sociales

Cette rencontre est construite autour des deux journées ; il est néanmoins possible de ne s’inscrire qu’à la première journée.

Places limitées.

Ces journées sont coordonnées par Xavier Rodier et Olivier Marlet du Laboratoire Archéologie et Territoires, UMR 7324 CITERES.

programme-journees-ontologie

Nouveau site web du service des archives de la MAE

Le service des archives de la MAE est heureux de vous annoncer la nouvelle version de son site Web.

Vous y découvrirez notamment :

une présentation du service et de ses missions,
les conditions pour accéder aux archives,
une rubrique d’aide à l’archivage (archives physiques et électroniques) à destination des personnels de la MAE.

Le nouvel outil que nous avons choisi, le logiciel AtoM, développé à l’origine par le Conseil international des archives, permet de réaliser des instruments de recherche en XML utilisant les DTD EAD et EAC conformes aux normes archivistiques internationales ISAD(G), ISAAR(CPF) et ISDIAH. Les instruments de recherche sont ainsi parfaitement interopérables.

Actuellement, vous pouvez consulter les inventaires de 95 fonds et plus de 22 000 documents numérisés.

Plusieurs types d’accès sont possibles :

par une recherche plein texte simple ou avancée,
par une navigation à travers tous les inventaires, toutes les notices de producteurs d’archives (laboratoires, chercheurs, équipes, missions archéologiques…) et tous les objets numériques,
par laboratoire et équipe de rattachement,
par un accès géographique aux archives de missions archéologiques et ethnologiques françaises à l’étranger.

Ce site a été réalisé en collaboration avec Vanessa Tubiana-Brun (service Audiovisuel et Multimédia de la MAE, USR 3225), Erick Coulon, Eric Gimel et Jean-Louis Guilleron (service Systèmes d’information de la MAE, USR 3225). Les visuels des équipes d’ArScAn ont été réalisés par Edmond Magnifique (ArScAn, UMR 7041).

Bonne navigation !

Elisabeth Bellon, Aurélie Montagne-Bôrras, Louise Corvasier et François Rimelen

Service des archives de la MAE

21, allée de l’Université – 92023 Nanterre Cedex

Bureaux 108 D et 111D

Tél. : +33 (0)1 46 69 24 59

Réunion de travail « Ontologies et redocumentarisation»

Lundi 13 octobre 2014, Nanterre, Maison Archéologie et Ethnologie

Présents

Béatrice Bouchou-Markhoff (Laboratoire d’Informatique, Blois)
Thomas Francart (consultant indépendant, Tours)
Nathalie Le Tellier-Becquart (MAE, Nanterre)
Olivier Marlet (CITERES-LAT/MSH VdL, Tours)
Emmanuelle Morlock (UMR HISoMA/MOM, Lyon)
Blandine Nouvel (MMSH, Aix)
Xavier Rodier (CITERES-LAT/MSH VdL, Tours)
Stéphanie Satre (MMSH, Aix)
Evelyne Sinigaglia (MAE, Nanterre)
Anne-Violaine Szabados (MAE, Nanterre).

PACTOLS, un thésaurus pour décrire les ressources documentaires en archéologie

Blandine Nouvel (MMSH, Aix) et Evelyne Sinigaglia (MAE, Nanterre) présentent les PACTOLS.

Voir la présentation : 01_PACTOLS_MASA20141013

Les PACTOLS sont un thesaurus géré par FRANTIQ. Ils permettent d’interroger le catalogue collectif indexé. Elaborés depuis 1987 en collaboration avec les chercheurs, les PACTOLS sont constitués de sept thésaurus : Peuples / Anthroponymes / Chronologie / Toponymes / Œuvres / Lieux / Sujets polyhiérarchiques et multilingues (langue pivot : français), incluant des relations d’associations entre termes (http://pactols.frantiq.fr). Ce thésaurus est utilisé pour des bibliothèques, photothèques, des archives, de la publication (mots-clés pour référencer) et sert de référentiel pour ISIDORE.

Un logiciel libre et gratuit permet d’exploiter les PACTOLS, OpenTheso. OpenTheso en est à sa version 3 en full web et respecte les normes ISO 25964-1 (2011) et 2 (2012). Ce logiciel utilise les lexiques et dictionnaires du domaine (www.frantiq.fr), indépendamment du catalogue collectif et répond aux nécessités du web sémantique. OpenTheso permet des imports-exports en XML, SKOS et CSV et peut être aligné avec d’autres thésaurus.

Des groupes de travail se sont mis en place pour enrichir les PACTOLS. Un partenariat avec la Belgique met un place un mapping avec MULTITA (Multilingual terminological research for the development and integration of semantically enriched scientific thesauri). De même, un workshop « interopérabilité » travaille au mapping des PACTOLS avec le réseau européen ARIADNE. Par ailleurs les termes de Pactols sont candidats pour entrer dans le thésaurus du Getty ATT (Art & architecture Thesaurus).

Les PACTOLS s’orientent vers le web sémantique :

par l’enrichissement terminologique : MOM, INRAP, etc.
par la consolidation de la structure sémantique
par l’ajout d’outils de géolocalisation et l’enrichissement par des notes et des images
par une réflexion pour transformer ce thésaurus en ontologie

Ce dernier point de transformer les PACTOLS en ontologie a suscité des interrogations concernant la pertinence d’un tel travail. En effet, une ontologie correspond à un modèle de description du monde tel qu’on se le représente et décrit la manière dont les termes sont reliés entre eux dans un langage formel, quand les thésaurus se contentent d’établir des relations cohérentes entre termes. L’équipe de Frantiq pense que cela permettra de s’ouvrir d’avantage à d’autres applications et de diffuser ce vocabulaire structuré plus largement. Il a été suggéré de se documenter au préalable sur les ontologies existantes, et plus particulièrement sur FRBRoo qui est une la fusion du CIDOC-CRM et de l’Ontologie FRBR des bibliothèques, et de voir les extensions au CIDOC-CRM qui peuvent exister pour l’archéologie (notamment CRM-EH). Qu’entend-on par faire de PACTOLS une ontologie ? C’est surtout la mise en parallèle de PACTOLS en tant qu’ontologie avec FRBRoo qui interpelle, FRBRoo étant plutôt comme le CRM.

Cette remarque engage une discussion autour des ontologies pouvant servir en SHS et plus particulièrement en archéologie. Par exemple OBOE qui est une ontologie pour la prise de mesure (observations scientifiques). On déplore le manque de formations sur l’utilisation des ontologies. Emmanuelle Morlock nous fait savoir qu’elle a pu participer à la summer school organisée par Ariadne en mai 2014 sur l’utilisation du CIDOC-CRM pour rendre des bases de données en archéologie interopérables avec des infrastructures comme ARIADNE qui utilisent le standard CIDOC-CRM (http://vast-lab.org/ariadne-2014-summer-school-at-pin/). Elle y a découvert un outil, en cours de développement intitulé « Mapping Memory Manager » (https://github.com/isl/Mapping-Memory-Manager) permettant de faciliter le mapping entre SGBD et CIDOC-CRM, le système permettant de documenter un SGBD sous forme de triplets cohérents avec la structure et les propriétés du CIDOC-CRM. Le site du VAST-LAB, organisateur de la formation, offre également sur son site un outil de références croisées pour facilitant la navigation dans l’ontologie : http://vast-lab.org/cidoc5/.

Sanctuaires : base des sanctuaires romano-celtiques de Gaule

Isabelle Fauduet (MAE, Nanterre) présente la base de données « Sanctuaires ».

Voir la présentation : 02_SANCTUAIRES_MASA20141013

Sanctuaires est une Base FileMaker qui nécessite une grosse actualisation logicielle (elle compte actuellement quelques 650 fanum). Elle a bénéficié d’une publication papier sous forme d’un Atlas en 1993 mais continue d’être alimentée. Il a donc été décidé de la migrer en format RDF et de mettre en place une interface d’exploitation et d’administration avec le logiciel VITRO. Cette migration nécessitera d’adapter la structure de la base de données qui, à l’origine, n’était pas relationnelle. Des problèmes se poseront à la migration, notamment celui de formaliser l’incertitude. Les données seront reprises pour renvoyer à des référentiels pour la géographie, la chronologie, les personnes (ISNI), la bibliographie.

Une discussion s’engage sur les difficultés de migrer des données qui manquent parfois de structuration, par exemple la bibliographie qui n’est structurée qu’en trois champs : auteurs, date, référence.

Thomas Francart présente le projet de migration en quatre étapes :

Mise au point d’un modèle basé sur le CIDOC-CRM
Migration des données de FileMaker en RDF basée sur l’ontologie
Alignement vers d’autres référentiels (PACTOLS)
chargement dans VITRO (outils web-collaboratif), ontology-driven, linked-data compatible.

VITRO est une application web, paramétrée avec une ontologie et alimenté en données RDF. VITRO permet de rechercher, naviguer et éditer les données.

http://vitro.mannlib.cornell.edu/

Des expériences déjà menées avec VITRO montrent l’avantage de republier les données en format RDF normalisé selon une ontologie : les bases peuvent ainsi être fédérées dans un portail de recherche unique.

La discussion fait ressortir les points suivants :

L’outil a été choisi car il fait partie des rares outils liés fondés sur les technologies du web sémantique qui offrent une interface de saisie.
Thomas Francart propose de l’héberger sur ses serveurs pendant la durée du projet. Cependant la question de l’hébergement post projet se pose.
Thomas Francart précise que les interfaces de saisie seront utilisées telles qu’elles sont distribuées via l’outil et qu’il n’y a pas de prestation de personnalisation prévue.

Interopérabilité de la base de données ArSol (Archives du Sol) fondée sur l’ontologie CIDOC-CRM

Olivier Marlet (MSH Val-de-Loire, Tours) présente le système ArSol utilisée par le Laboratoire Archéologie et Territoires de Tours et le travail effectué pour la rendre interopérable via le CIDOC CRM, présentation effectuée également lors du CAA 2014 à Paris, avec Émeline Le Goff.

Voir la présentation : 03_ArSolCIDOC_MASA20141013

ArSol est une base 4D en production à Tours depuis 1990, fondée sur le système d’enregistrement stratigraphique utilisé depuis la fin des années 1960. Elle est utilisée également par d’autres partenaires du Laboratoire Archéologie et Territoires : CG37, INRAP, Communauté d’Agglomération Bourges Plus.

Après une première étape de mise en ligne d‘ArSol (http://arsol.univ-tours.fr), l‘objectif d’interopérabilité nécessitait de trouver une solution permettant de s’affranchir de la base de données sans procéder à sa migration vers un nouveau système, afin de ne pas avoir à redévelopper les processus de traitement de données. Le CIDOC CRM s’est alors imposé comme la solution pertinente puisqu’il peut être utilisé comme une référence unique et normalisée permettant d’interroger les données d’ArSol, mais également de toute autre base de données archéologiques dans n’importe quel format interrogeable sur le web (Access, Filemaker, par exemple).

La première étape a consisté à faire le mapping d’une sélection de quelques champs pertinents de la base ArSol vers les entités et propriétés du CIDOC-CRM. La compréhension de la structure riche du CIDOC CRM a constitué une part importante dans le travail de mapping afin de faire correspondre au mieux les notions d’ArSol et du CIDOC-CRM, la complexité de cette tâche a été facilitée par l’aide précieuse de Patrick Le Bœuf, spécialiste du CIDOC-CRM à la BNF).

La seconde étape était de traduire ces équivalences dans un fichier RDF et de contrôler la validité de la modélisation réalisée, ce qui ne peut se faire que manuellement puisqu’il n’existe pas réellement d’outils permettant de valider un mapping.

Une spécificité d’ArSol a nécessité de modéliser une branche particulière dans le CIDOC-CRM. Il s’agit pour le mobilier archéologique des notions de « fonction » (ce pourquoi l’objet a été fait) et d’ « usage » (ce à quoi l’objet a été utilisé). Ainsi, une monnaie prévue pour du commerce, pourra se trouver en contexte funéraire utilisé comme un pendentif. Le CIDOC CRM ne proposant pas d’entité pour modéliser ces deux notions, Patrick Le Bœuf a proposé de recourir au très générique E55_Type qui nécessite d’être ensuite défini. Toutefois, ces deux notions bénéficient dans la structure d’origine du CIDOC-CRM de deux propriétés qui en facilite l’utilisation : P103.was_intended_for (fonction d’origine) et P16.1.mode_of_use (utilisation réelle).

Cet aspect a soulevé des questions : plutôt que d’utiliser des entités générique E55_Type pour répondre à une spécificité d’ArSol, ne faudrait-il pas plutôt générer une extension du CIDOC-CRM ?

Il a été alors rappelé l’objectif de ce projet soutenu par MASA puisque, à terme, ArSol ne doit pas être la seule base interrogeable par ce système. L’interrogation doit pouvoir porter sur plusieurs bases distinctes en exploitant à chaque fois le mapping spécifique à la base. L’utilisation d’entités génériques ne risque-t-elle pas de limiter l’interrogation standard de plusieurs bases ? Développer pour chaque base des extensions au CIDOC-CRM pour répondre aux spécificités ne posera-t-il pas le même problème ? La question reste ouverte et le développement en cours de la partie logicielle de ce système d’interrogation permettra de tester le choix effectué et donc peut-être d’y répondre. En outre, l’utilisation du E55_Type nécessite d’en préciser le concept, ne serait-ce que pour s’y référer ou l’associer à une documentation le définissant. Le choix d’une extension peut être pertinent si on utilise un standard déjà existant pour étendre un ensemble pauvrement pris en compte par le CRM. La question est alors de savoir si ces standards répondent aux spécificités que l’on souhaite conserver.

Interroger des données via une ontologie

Béatrice Bouchou-Markhoff (Laboratoire d’Informatique de l’Université de Tours, Blois) présente les moyens logiciels pour interroger des données via une ontologie.

Voir la présentation : 04_ONTOP_MASA20141013

Deux solutions sont possibles lorsque l’on a des données déjà bien gérées dans une base de données : soit les données peuvent être extraites, transformées et chargées dans un triplestore muni d’un schéma donné (duplication en RDF), soit on utilise une interface d’accès à la base de données de type OBDA (Ontology-Based Data Access), choix fait pour ArSol avec le logiciel Ontop : http://ontop.inf.unibz.it/. A noter que pour la base Sanctuaires la solution triplestore sera expérimentée, sans qu’il y ait maintenance en parallèle de la base d’origine.

Le Web des données a pour objectif de rendre les données interprétables automatiquement et de les lier entre elles. Le format RDF permet de représenter les données sous forme de triplets (sujet > prédicat > objet). Les données sont alors exploitées à travers des modèles de connaissance (ontologies) permettant des inférences, des combinaisons ou des médiations.

Le choix a été fait pour ArSol d’utiliser Ontop, plateforme permettant d’interroger une base de données comme un graphe de données virtuel, à travers le schéma de ces données, ceci grâce à la définition d’association entre les composants du schéma et les requêtes SQL qui récupèrent les données dans la base. Ainsi on obtient un point d’accès SPARQL aux données de la base, comme si elles se trouvaient dans un triplestore RDF. Ontop offre un plugin pour Protégé (outil populaire de travail sur les ontologies) qui permet de définir aisément le schéma des données comme une ontologie et de spécifier les associations entre ce schéma et les requêtes SQL. Son utilisation pour ArSol est en cours de développement à Tours.

Il sera nécessaire de définir un protocole d’affectation d’URIs pour chaque enregistrement pour pouvoir lier les données et permettre leur référencement par d’autres systèmes.

OpenTheso : Gestionnaire de thésaurus multilingue

Le développement d’OpenTheso a commencé en 2005 pour répondre à une demande du réseau Frantiq pour gérer son thésaurus. Il n’existait, en effet, à l’époque aucun outil équivalent et gratuit. OpenTheso a permis ainsi aux bibliothécaires du réseau Frantiq (aujourd’hui GDS 3378 du CNRS) de disposer d’un outil de gestion du thesaurus PACTOLS. Ce thesaurus est constitué de 7 micro-thesauri (Peuples, Anthroponymes, Chronologie, Toponymes, Oeuvres, Lieux et Sujets) multilingues et polyhiérarchiques. Il est utilisé aujourd’hui par plus de 80 bibliothécaires spécialisés en leur permettant une indexation normalisée de leurs fonds documentaires en archéologie (accessibles via le catalogue Frantiq).

Ces référentiels normalisés, initialement limités au monde des bibliothèques, suscitent un intérêt croissant dans le contexte du web sémantique (en témoignent les projets européens ARIADNE et MULTITA) auxquels participe Frantiq. Outre la normalisation sémantique, opérée par des bibliothécaires, chercheurs ou terminologues, une normalisation technique est requise pour gérer les versions numériques des thésaurus depuis les normes ISO 5964 : 1985 et NF – Z47-101: 1990 axées sur le multilinguisme (intégrées dans la version 2 de OpenTheso) jusqu’aux normes les plus récentes dédiées à l’interopérabilité des vocabulaires (ISO 25964-1 :2011 et ISO 25964-2 : « Thésaurus et interopérabilité avec d’autres vocabulaires »), auxquelles se conforme la version 3 du logiciel, tout juste mise à la disposition du consortium MASA.

Le développement d’OpenTheso, commencé avec l’assistance d’un stagiaire, puis d’un CDD se poursuit toujours sous la direction de la plateforme Tête de Réseaux Documentaire de la Maison de l’Orient et de la Méditerranée en partenariat avec la cellule documentaire et le groupe de travail Thesaurus PACTOLS et indexation de Frantiq. Notons que dès 2009 OpenTheso avait bénéficié du soutien du TGE Adonis afin de rendre les PACTOLS disponibles au format SKOS (recommandation du W3C s’appuyant sur le modèle de données RDF), ce qui en a accru l’interopérabilité. Ce travail avait permis de faire des PACTOLS, développés via OpenTheso, l’un des référentiels utilisés par la plateforme Isidore (Accès aux données numériques et services numérisés pour la recherche en sciences humaines et sociales), désormais soutenue par la TGIR Huma-Num. La version 3 d’OpenTheso ne fera qu’accroître l’intéropérabilité des thésaurus, notamment via l’alignement des vocabulaires et répondra mieux aux besoins des communautés de bibliothécaires mais aussi de chercheurs : elle permet un travail collaboratif via une interface web dont l’ergonomie a été testée en production par les équipes de Frantiq.

Les apports de la version 3 :

OpenTheso version 2 (2010)	openTheso version 3 (2014)
ISO 5964 : 1985 et NF – Z47-101: 1990	ISO 25964-1 2011 et ISO 25964-2:2012
2 modules :Une version « pro », qui permet aux responsables du thesaurus de faire des modifications. L’accès est protégévia une authentification individuelle (identifiant et mot de passe). Une version « Opac », qui permet la consultation libre des thésaurus par tout public, sans authentification.	Version full web : gestion des thésaurus en ligne par une seule application web pour la partie pro (après authentification) et pour la consultation publique (sans authentification).
Fonctionnalités :Gestion des liens (associés, synonymes, etc..) Gestion des traductions Corrections multiples Export et import en SKOS (Simple Knowledge Organization System) Opac-web pour la consultation et l’accès assistéau Système Intégréde Gestion de Bibliothèque (SIGB)	Fonctionnalités (Idem v2, plus):Alignement avec d’autres thésaurus Gestion collaborative des candidats Ouverture d’un service web Indexation ouverte aux moteurs de recherche gestion des images gestion des sous groupes ou facettes gestion des identifiants pérennes ARK

OpenTheso gère aussi les identifiants pérennes type ARK qui est un système d’identifiants basé sur la norme URI. La distribution d’identifiants est gérée par le projet Arkéo située à la MOM.

OpenTheso est un outil polyvalent, conçu pour répondre aux besoins de communautés de métiers et aux thématiques différents. Il est ainsi adopté par plusieurs services :

Le GDS Frantiq (thesaurus PACTOLS pour l’archéologie, constitué de près de 30.000 concepts et plusieurs micro-thesaurus poly-hiérarchiques, et notamment un micro-thesaurus « sujets » traduit en 7 langues)

Les Hospices Civils de Lyon « HCL » (près de 60.000 Concepts)

L’ISH Lyon (pour gérer une branche du thésaurus Rameau du SUDOC)

La version 3 a été développée par Miled Rousset, responsable de la plateforme TRD de la Maison de l’Orient et de la Méditerranée et sur prestation par Mme Carole BONFRE grâce à un financement du Consortium MASA. Huit mois ont été nécessaires pour arriver à une version stable et exploitable), cette nouvelle version, disponible dès à présent pour les partenaires du consortium MASA, sera bientôt plus largement diffusée en version libre.

En savoir plus sur FRANTIQ
Consulter les PACTOLS avec OpenTheso

(Merci à Nathalie le-Tellier-Becquart, Evelyne Sinigaglia et Blandine Nouvel pour les contributions et les corrections)

Copie d’écran :

Traduction des PACTOLS en arabe

Le multilinguisme est un enjeu pour la construction de référentiels comme le thésaurus PACTOLS.

Grâce au financement du consortium MASA, la traduction en arabe des microthésaurus « Sujets » et « Chronologie » PACTOLS a été réalisée au sein de la MAE de mai à septembre 2014.

Complémentaires, Imad Alhussain, récent titulaire d’une thèse de doctorat en Préhistoire, Protohistoire, Paléoenvironnement méditerranéen et africain soutenue à Montpellier III-Paul Valéry et Anis Mkacher, spécialiste de l’Antiquité tardive, post doctorant dans le cadre du Labex « Les Passés dans le présent », se sont partagé les sections du thésaurus en fonction de leurs compétences respectives.

Cet enrichissement linguistique, encouragé par le conseil scientifique de FRANTIQ, n’est pas un hasard. En effet, l’archéologie orientale constitue un des domaines d’excellence du réseau : Bibliothèque de la Maison de l’Orient et de la Méditerranée, fonds d’assyriologie et d’archéologie orientale de la Maison Archéologie et Ethnologie René-Ginouvès, fonds d’égyptologie de la bibliothèque Archéologie des Sociétés Méditerranéennes, bibliographie de Paléorient…

Ce travail est rendu possible par le gestionnaire de thésaurus OpenTheso développé par Miled Rousset qui permet la traduction des descripteurs dans un nombre illimité de langues.

Une ontologie pour rendre interopérables des bases de données en archéologie ?

Il existe autant de bases de données en archéologie qu’il existe d’équipe d’archéologues, voire plus ! Les logiciels et les structurations sont extrêmement hétérogènes. Uniformiser les outils et la façon de structurer l’information reste un objectif inaccessible et cela ne résoudrait pas le problème des bases déjà existantes car, outre les réticences des chercheurs pour homogénéiser un jeu de données, les moyens manqueraient pour venir à bout de l’énorme chantier de migration des bases d’un système à un autre.

La solution envisagée au sein du Consortium MASA est de permettre d’utiliser un système commun qui puisse venir en surcouche sur les bases de données existantes. Ce système commun consiste à utiliser l’ontologie du CIDOC-CRM (norme ISO 21127:2006) qui permet de modéliser précisément tout objet ou concept patrimonial. Le principe est donc d’établir des ponts entre la structure d’une base de données existante et cette ontologie. Cette phase de mise en correspondance, appelée « mapping », est primordiale et nécessite d’être effectuée avec soin. Le prérequis est bien sûr que la base puisse être interrogée de l’extérieur (c’est le cas des bases construites avec Access, 4D, mySQL, Oracle ou Filemaker, pour ne citer que les outils les plus utilisés en archéologie).

D’une base de données à l’autre, le mapping sera bien sûr différent mais le fait de rattacher chaque champ de la structure d’une base à une entité ou une propriété de l’ontologie permet de se référer à une structure commune avec un vocabulaire unique (en anglais donc indépendant de la langue d’origine).

L’intérêt est de permettre à un utilisateur d’interroger n’importe quelle base de données sans se soucier du logiciel ni de la structure qui accueillent ces données : l’interrogation se fait via l’ontologie, puis un moteur retranscrit la requête pour la base de données cible en utilisant le fichier de mapping, enfin les résultats sont renvoyés à l’utilisateur en respectant la structure de l’ontologie. Avec ce procédé, il est donc techniquement possible d’interroger plusieurs bases en même temps, même si leur format natif diffère complètement. C’est l’interopérabilité attendue.

Principe de fonctionnement d’ArSol avec sa version Web et l’interrogation via le CIDOC CRM.

Les ontologies sont déjà beaucoup utilisées en médecine. Des développements sont en cours au Laboratoire Archéologie et Territoire de l’UMR CITERES à la MSH Val-de-Loire à Tours pour mettre en place la suite logicielle qui permettra d’interroger la base ArSol (Archives du Sol, développée sous 4D) à partir de l’ontologie du CIDOC-CRM.

Une communication a été présentée sur ce sujet au CAA 2014 par Emeline Le Goff et Olivier Marlet (https://fr.slideshare.net/UMR7324/caa2014-s7-arsolcidoc), au sein de la session sur les Ontologies organisée par Anne-Violaine Szabados, Katell Briatte, Maria Emilia Masci et Christophe Tufféry.

Pour en savoir plus sur le CIDOC CRM : http://www.cidoc-crm.org/

Consulter également la page de la BNF sur les ontologies et en particulier sur le CIDOC : http://www.bnf.fr/fr/professionnels/modelisation_ontologies.html

Les enjeux du consortium MASA

Le consortium Mémoires des archéologues et des sites archéologiques (MASA) est né à la fin de l’année 2012 de l’expérience acquise par et au sein de plusieurs Maisons des Sciences de l’Homme dans le domaine de l’archéologie et du traitement de la documentation produite par les archéologues. Plusieurs équipes avaient des compétences spécifiques, qu’il était temps de partager dans le cadre d’un consortium de façon à travailler ensemble de façon inter institutionnalisée.
Les enjeux sont évidents. Le premier est lié à la nature même de cette discipline scientifique : en fouillant, l’archéologue détruit irrémédiablement le contexte archéologique, sans retour en arrière possible, et pas seulement l’archéologie préventive. Il n’a pas toujours une conscience immédiate de l’importance de telle ou telle découverte. Le retour vers les données de terrain est souvent nécessaire, dans des objectifs ré-interprétatifs et comparatifs, souvent à la lumière des progrès technologiques et scientifiques, d’où l’enjeu fondamental que constitue le traitement des données.
Le second enjeu est lié à la nature même de la documentation et de son support, très diversifié et parfois très fragile (cahiers de terrain, relevés, plans, photographies, (diapositives, négatifs, relevés au crayon sur calques,…). Il faut profiter de la révolution numérique pour faciliter la consultation de cette documentation et la rendre pérenne.
Le troisième enjeu découle de l’habitude des archéologues de travailler avec des bases de données hétérogènes, conçues bien souvent sans protocole de choix méthodologique et technique. Un travail a posteriori est donc nécessaire afin de rendre ces bases de données normalisées et interopérables (RDF, SKOS, DC), d’utiliser des référentiels communs qui permettent d’envisager la mise en lien de ces données dans le cadre de la mise en place du web de données liées, de les redocumentariser en intégrant de nouvelles métadonnées pour les compléter, les enrichir ou en faciliter d’accès, tout en assurant la pérennité des données et leur évolutivité. Ce travail s’avère particulièrement lourd puisqu’il faut traiter les masses de données léguées par de nombreux archéologues partant à la retraite.
Les objectifs de MASA répondent à de tels enjeux en intégrant une dimension porteuse dans le contexte où il est nécessaire de mettre en réseaux autant d’acteurs scientifiques nationaux de l’archéologie. Il était donc utile d’institutionnaliser de telles relations de manière à ce que chacun d’entre eux fasse connaître et diffuse ses bonnes pratiques, ses méthodes …