Pandore: automating text-processing workflows for humanities researchers

Gespeichert in:
Bibliographische Detailangaben
Titel: Pandore: automating text-processing workflows for humanities researchers
Autoren: Chiffoleau, Floriane, Biriuchinskii, Mikhail, Alrahabi, Motasem, Roe, Glenn
Weitere Verfasser: Chiffoleau, Floriane
Verlagsinformationen: Zenodo, 2025.
Publikationsjahr: 2025
Schlagwörter: Data processing, Digital Humanities, NLP toolkit, Data Processing, GUI, [SHS] Humanities and Social Sciences, [INFO] Computer Science [cs], Python scripts
Beschreibung: Pandore est une boîte à outils conçue pour les chercheurs, les enseignants et les étudiants en sciences humaines et sociales, en particulier ceux qui n'ont pas de compétences techniques avancées en programmation. Elle permet aux utilisateurs de gérer efficacement leurs données grâce à des interfaces graphiques intuitives, leur permettant de collecter, préparer, convertir et analyser leurs données, d'extraire des informations pertinentes et de créer des visualisations interprétatives.En s'appuyant sur les nombreux retours de la version bêta précédente, plusieurs améliorations ont été mises en œuvre. Cette communication décrit ces mises à jour, notamment la résolution de bugs identifiés et les améliorations de l'interface graphique pour améliorer l'expérience utilisateur. Nous étudions actuellement la faisabilité de connecter la plateforme à la base de données Gallica de la Bibliothèque nationale de France, avec un prototype en cours de développement pour faciliter l'accès aux ressources enrichies. Des scripts Python interopérables et modulaires ont également été intégrés pour étendre les fonctionnalités de la plateforme. Des tutoriels ont été finalisés pour guider les utilisateurs dans la maîtrise des outils, et l'application est en cours de déploiement sur un serveur équipé d'un GPU pour optimiser les performances des tâches à forte intensité de calcul.Ces avancées positionnent Pandore comme un outil polyvalent et efficace pour les chercheurs dans un large éventail de disciplines des sciences humaines et sociales.
Pandore is a toolkit designed for researchers, teachers, and students in the humanities and social sciences, in particular those without advanced technical coding skills. It enables users to efficiently manage their data through intuitive graphical interfaces, allowing them to collect, prepare, convert, and analyze their data, extract relevant insights, and create interpretive visualizations. Building on extensive feedback from the previous beta version, several improvements have been implemented. This communication outlines these updates, including the resolution of identified bugs and enhancements to the graphical interface to improve user experience. We are currently exploring the feasibility of connecting the platform to the Gallica database at the French national library, with a prototype under development to facilitate enriched resource access. Interoperable and modular Python scripts have also been integrated to extend the platform's functionalities. Tutorials have been finalized to guide users in mastering the tools, and the application is being deployed on a GPU-equipped server to optimize performance for computationally intensive tasks. These advancements position Pandore as a versatile and effective tool for researchers across a diverse range of humanities and social science disciplines.
Publikationsart: Presentation
Conference object
Dateibeschreibung: application/pdf
Sprache: English
DOI: 10.5281/zenodo.16258816
DOI: 10.5281/zenodo.16258817
Zugangs-URL: https://hal.science/hal-04986730v1
Rights: CC BY
Dokumentencode: edsair.doi.dedup.....ade8c39f93f7a74f18e35f40b39d93a2
Datenbank: OpenAIRE
Beschreibung
Abstract:Pandore est une boîte à outils conçue pour les chercheurs, les enseignants et les étudiants en sciences humaines et sociales, en particulier ceux qui n'ont pas de compétences techniques avancées en programmation. Elle permet aux utilisateurs de gérer efficacement leurs données grâce à des interfaces graphiques intuitives, leur permettant de collecter, préparer, convertir et analyser leurs données, d'extraire des informations pertinentes et de créer des visualisations interprétatives.En s'appuyant sur les nombreux retours de la version bêta précédente, plusieurs améliorations ont été mises en œuvre. Cette communication décrit ces mises à jour, notamment la résolution de bugs identifiés et les améliorations de l'interface graphique pour améliorer l'expérience utilisateur. Nous étudions actuellement la faisabilité de connecter la plateforme à la base de données Gallica de la Bibliothèque nationale de France, avec un prototype en cours de développement pour faciliter l'accès aux ressources enrichies. Des scripts Python interopérables et modulaires ont également été intégrés pour étendre les fonctionnalités de la plateforme. Des tutoriels ont été finalisés pour guider les utilisateurs dans la maîtrise des outils, et l'application est en cours de déploiement sur un serveur équipé d'un GPU pour optimiser les performances des tâches à forte intensité de calcul.Ces avancées positionnent Pandore comme un outil polyvalent et efficace pour les chercheurs dans un large éventail de disciplines des sciences humaines et sociales.<br />Pandore is a toolkit designed for researchers, teachers, and students in the humanities and social sciences, in particular those without advanced technical coding skills. It enables users to efficiently manage their data through intuitive graphical interfaces, allowing them to collect, prepare, convert, and analyze their data, extract relevant insights, and create interpretive visualizations. Building on extensive feedback from the previous beta version, several improvements have been implemented. This communication outlines these updates, including the resolution of identified bugs and enhancements to the graphical interface to improve user experience. We are currently exploring the feasibility of connecting the platform to the Gallica database at the French national library, with a prototype under development to facilitate enriched resource access. Interoperable and modular Python scripts have also been integrated to extend the platform's functionalities. Tutorials have been finalized to guide users in mastering the tools, and the application is being deployed on a GPU-equipped server to optimize performance for computationally intensive tasks. These advancements position Pandore as a versatile and effective tool for researchers across a diverse range of humanities and social science disciplines.
DOI:10.5281/zenodo.16258816