OpenArchaeo : A semantic web portal applied to archeological datasets

Saved in:
Bibliographic Details
Title: OpenArchaeo : A semantic web portal applied to archeological datasets
Authors: Hivert, Florian
Contributors: HIVERT, Florian
Publisher Information: 2025.
Publication Year: 2025
Subject Terms: Reusability, Knowledge graph, [SHS.ARCHEO] Humanities and Social Sciences/Archaeology and Prehistory, FAIR principles, [INFO.INFO-WB] Computer Science [cs]/Web, Ontology, CIDOC CRM archaeo, Dataset Analysis, [INFO.INFO-DS] Computer Science [cs]/Data Structures and Algorithms [cs.DS], [INFO] Computer Science [cs], Interoperability, CIDOC CRM, Open Science, Linked Open Data LOD, Archaeological Data, Controlled vocabularies, Heterogeneity, Data Transformation and Representation, Knowledge graph KG, Archaeological Data Representation, Semantic web, Linked Open Data
Description: Avec l'essor des pratiques de la Science Ouverte, de nombreux jeux de données hétérogènes ont été publiés par des chercheurs pour soutenir ces initiatives. En Europe, de tels jeux de données peuvent désormais être trouvés sur des plateformes comme Nakala en France, e-Archeo en Italie et ADS au Royaume-Uni. L'objectif de la Science Ouverte est de rendre ces jeux de données disponibles pour d'autres chercheurs afin qu'ils puissent les réutiliser dans des entreprises scientifiques, et accessibles au public en tant que données trouvables reflétant les connaissances récentes.Bien que de nombreuses plateformes de Science Ouverte publient des données de manière standardisée, les jeux de données publiés peuvent encore varier en termes de structures, de formats et d'expressions scientifiques du producteur de données. Ces implications rendent toujours les données hétérogènes et difficiles à référencer croisées. Ces variations contribuent à l'hétérogénéité des données, rendant le référencement croisé et l'intégration difficiles. Bien que les métadonnées obligatoires requises par les éditeurs fournissent un certain niveau de référencement croisé, elles restent génériques et liées à des jeux de données entiers plutôt qu'à des données spécifiques.Sur la base de cette observation, le Consortium Huma-Num MASAplus, dédié aux données de la communauté archéologique française, a développé une solution basée sur la technologie du web sémantique et les éléments de données ouvertes liées : le portail OpenArchaeo.
With the rise of Open Science practices, numerous heterogeneous datasets have beenpublished by researchers to support these initiatives. In Europe, such datasets can now befound on platforms like Nakala in France, e-Archeo in Italy, and ADS in the UnitedKingdom. The aim of Open Science is to make these datasets available to other researchersfor reuse in scientific endeavours, and accessible to the public as findable data reflectingrecent knowledge.While many Open Science platforms publish data in standardised ways, the publisheddatasets can still still vary in terms of structures, formats, and scientific expressions of thedata producer. These involvements still make the data heterogeneous and difficult tocross-referenced. These variations contribute to the heterogeneity of the data, makingcross-referencing and integration difficult. Although mandatory metadata required bypublishers provides some level of cross-referencing, it remains generic and linked to entiredatasets rather than specific data.Based on this observation, the Huma-Num Consortium MASAplus, dedicated to the Frencharcheological community’s data, developed a solution based on semantic web technology,and linked open data elements: the OpenArchaeo portal.
Document Type: Conference object
Language: English
Access URL: https://hal.science/hal-05075148v1
Rights: CC BY NC ND
Accession Number: edsair.dedup.wf.002..c5be453fea65a4f2ead3bbbdec8f8201
Database: OpenAIRE
Description
Abstract:Avec l'essor des pratiques de la Science Ouverte, de nombreux jeux de données hétérogènes ont été publiés par des chercheurs pour soutenir ces initiatives. En Europe, de tels jeux de données peuvent désormais être trouvés sur des plateformes comme Nakala en France, e-Archeo en Italie et ADS au Royaume-Uni. L'objectif de la Science Ouverte est de rendre ces jeux de données disponibles pour d'autres chercheurs afin qu'ils puissent les réutiliser dans des entreprises scientifiques, et accessibles au public en tant que données trouvables reflétant les connaissances récentes.Bien que de nombreuses plateformes de Science Ouverte publient des données de manière standardisée, les jeux de données publiés peuvent encore varier en termes de structures, de formats et d'expressions scientifiques du producteur de données. Ces implications rendent toujours les données hétérogènes et difficiles à référencer croisées. Ces variations contribuent à l'hétérogénéité des données, rendant le référencement croisé et l'intégration difficiles. Bien que les métadonnées obligatoires requises par les éditeurs fournissent un certain niveau de référencement croisé, elles restent génériques et liées à des jeux de données entiers plutôt qu'à des données spécifiques.Sur la base de cette observation, le Consortium Huma-Num MASAplus, dédié aux données de la communauté archéologique française, a développé une solution basée sur la technologie du web sémantique et les éléments de données ouvertes liées : le portail OpenArchaeo.<br />With the rise of Open Science practices, numerous heterogeneous datasets have beenpublished by researchers to support these initiatives. In Europe, such datasets can now befound on platforms like Nakala in France, e-Archeo in Italy, and ADS in the UnitedKingdom. The aim of Open Science is to make these datasets available to other researchersfor reuse in scientific endeavours, and accessible to the public as findable data reflectingrecent knowledge.While many Open Science platforms publish data in standardised ways, the publisheddatasets can still still vary in terms of structures, formats, and scientific expressions of thedata producer. These involvements still make the data heterogeneous and difficult tocross-referenced. These variations contribute to the heterogeneity of the data, makingcross-referencing and integration difficult. Although mandatory metadata required bypublishers provides some level of cross-referencing, it remains generic and linked to entiredatasets rather than specific data.Based on this observation, the Huma-Num Consortium MASAplus, dedicated to the Frencharcheological community’s data, developed a solution based on semantic web technology,and linked open data elements: the OpenArchaeo portal.