Le terme d'Humanités Numériques caractérise une communauté et un ensemble de pratiques relatives aux usages numériques pour les Sciences Humaines et Sociales. Ce mouvement traduit une volonté de considérer les nouveaux contenus et médias numériques. Il s'accompagne de nombreuses collaborations entre des chercheuses et chercheurs issus de disciplines variées dont l'un des objectifs est de s'intéresser aux évolutions des pratiques de recherche induites par les possibilités des outils numériques. Dans ce contexte, les technologies du Web sémantique fournissent un cadre pour structurer, lier, explorer et raisonner avec des ensembles de données.
Lors de ces journées, des chercheurs en SHS et des chercheurs menant des travaux autour du Web sémantique discuteront ensemble de ces problématiques. Les interventions mêleront des retours d'expérience, l'introduction de problématiques de recherche ainsi que la présentation d'outils et techniques utilisés par la communauté du Web sémantique.
Les enregistrements des interventions sont accessibles en ligne.
lundi 21 juin
9h - Introduction de Philippe Nabonnand, directeur des Archives Henri-Poincaré (AHP-PReST), et de Jean-Yves Marion, directeur du Loria.
9h15 - Laurent Rollet - Du mode d’existence numérique des individus en histoire des sciences
Critiquée pour sa trop grande proximité avec le genre de la vulgarisation, accusée d’entretenir une proximité trop grande avec les codes littéraires de la fiction et du roman, la biographie a souvent été accusée d’aller à contresens d’une méthode historique bien pensée. Ces critiques, nombreuses, n’ont pas épargné le champ de l’histoire des sciences : la sédimentation du genre dans la forme historique des éloges, l’insistance mise sur les grands noms de la science ont suscité des doutes récurrents sur la pertinence d’une telle approche chez les historiens des sciences professionnels. Cependant l’histoire des sciences a largement renouvelé ses méthodes depuis 20 ans et elle a largement réinvesti le genre biographique : histoire sociale et sociohistoire, micro-histoire, histoire globale, histoire populaire, histoire par en bas, prosopographie sont maintenant des approches largement mobilisées par les historiens des sciences. Elles permettent de penser les individus dans leur complexité sociale, non plus isolément, mais en relation entre eux, attachés à des institutions, à des réseaux formels ou informels. Ces approches offrent également la possibilité de prendre en compte des populations d’acteurs qui ont pendant longtemps été considérées comme secondaires. A l’histoire des grands noms se sont donc ajoutées des histoires de communautés savantes, fortes parfois de milliers d’individus, qui rendent compte du régime habituel de fonctionnement des sciences dans la sphère sociale. Ces évolutions historiographiques ont été largement facilitées par l’essor des bases de données et des humanités numériques. Dans cette intervention j’aimerais proposer un parcours de réflexion qui, partant de ces évolutions méthodologiques, ouvre des perspectives sur différents modes d’existence des individus traités dans des corpus numériques. Je m’appuierai sur l’expérience de trois projets de recherche récents : la prosopographie des communautés mathématiques aux 19e-20e siècles, l’étude de l’histoire du Bureau des longitudes et l’édition de la correspondance du mathématicien Henri Poincaré.
10h15 - Sylvain Laubé - Paysage Industriel Culturel et web sémantique : l’apport du méta-modèle Any-Artefact
Les recherches en humanités numériques menées par le CFV et le CERV concernant l’histoire et le patrimoine des paysages industriels culturels (PIC) [1], en incluant les activités humaines associées, se traduisent par leur restitution par des EVI (Environnements Virtuels Intelligents) impliquant l’élaboration d’ontologies spécialisées à partir de l’ontologie générique (i.e. du méta-modèle d’activité humaine) Any-Artefact alignée avec le méta-modèle UML MASCARET [2]. Dans un premier temps, la méthodologie d’élaboration d’une ontologie de PIC sera explicitée à partir d’un exemple issu du paysage culturel portuaire brestois (les manœuvres d’ouverture du pont tournant de Recouvrance). Dans un deuxième temps, le modèle de connaissances de l’ontologie Any-Artefact sera discuté au regard des concepts de lieux de savoirs [3] et d’écoumène [4]. En terme de conclusion et perspective à ces travaux sera introduit leur intérêt pour développer une prosopographie des artefacts composant le paysage industriel culturel sur la longue durée.
[1] QUERREC, Ronan, LAUBÉ, Sylvain et al (2018). Lab in Virtuo : un Environnement Virtuel Intelligent pour l’histoire et le patrimoine des paysages culturels industriels. Dans S. Eusèbe, T. Nicolas, V. Gouranton, R. Gaugne (dir.),
Archéologie : imagerie numérique et 3D : actes du 3e séminaire scientifique et technique de l’Inrap, 26-27 juin 2018, Rennes. Disponible en ligne sur <https://sstinrap.hypotheses.org/487>.
Sylvain Laubé, Ronan Querrec, Marie-Morgane Abiven et al. Lab In Virtuo : Un environnement Virtuel
Intelligent (EVI) participatif dédié à l'histoire et aux patrimoines des paysages culturels industriels.. #dhnord2018: Matérialités de la recherche en sciences humaines et sociales, Oct 2018, Lille, France. 〈hal-01950624〉. Disponible en ligne sur <https://publi.me shs.fr/ressources/collaborations_patrimoine/@@video>.
[2] Abiven, M.M., Humanités Numériques et méthodes de conservation et de valorisation du patrimoine maritime
: L’exemple des arsenaux de Brest et Venise, Thèse, soutenance à Brest le 16 décembre 2019
[3] au sens de C. Jacob. JACOB, Christian. Qu’est-ce qu’un lieu de savoir?. OpenEdition Press, 2014.
[4] BERQUE, Augustin. Écoumène. Introduction à l'étude des milieux humains. Belin, 2014.
11h30 - Olivier Marlet - Les publications scientifiques en archéologie au format électronique : du CDrom au Web sémantique.
A travers l'expérience du Laboratoire Archéologie et Territoire de Tours, sont présentés trois exemples de publications électroniques de résultats de fouilles archéologiques. Seront présentées la publication mixte papier/numérique des fouilles du château de Tours, la publication des fouilles de l'Hôtellerie de l'abbaye de Marmoutier à Tours et enfin la publication logiciste des fouilles du centre paroissial de Rigny, en Indre-et-Loire. Chacune de ces publications tentera de tirer parti des technologies du numérique pour proposer à la communauté scientifique d'autres façons d'exploiter l'information et de la structurer. A l'heure du web sémantique, comment ces projets de publication s'inscrivent dans le processus de FAIRisation des données pour la Science Ouverte ?
14h - Olivier Corby - Transformation et présentation de graphes RDF
Le Web sémantique permet de représenter et échanger des données et des connaissances sur le Web, permet le raisonnement et l'interrogation de base de connaissances, le tout grâce à des langages standardisés interopérables : RDF, RDFS, OWL, SKOS, SHACL et SPARQL.Nous présentons le langage STTL, SPARQL Template Transformation Language, pour la transformation et la présentation de graphes RDF, conçu dans le même esprit que XSLT pour XML.Ce langage permet d'écrire des transformations de RDF vers des formats textuels : Turtle, RDF/XML, SPIN vers SPARQL, OWL vers Functional Syntax, RDF vers HTML, etc.Il permet de réaliser un serveur Web sémantique où les pages HTML sont engendrées dynamiquement à partir de graphes RDF, avec des liens hypertextes qui permettent la navigation interactive dans les graphes du Web sémantique de données liées. En effet, le langage est une extension de SPARQL et il dispose donc de la clause service qui permet d'interroger des serveurs distants.
Serveur de démonstration : http://corese.inria.fr. Le langage STTL est disponible avec la plate-forme Web sémantique Corese : http://project.inria.fr/corese. Documentation du langage STTL : https://files.inria.fr/corese/doc/sttl.html
15h - Francesco Beretta - Données de la recherche et ontologies fondationnelles : un écosystème d'extensions du CIDOC CRM pour les sciences historiques
Cette intervention est consacrée à la question de l'interopérabilité des données générées par la recherche historique afin de les rendre réutilisables pour de nouveaux programmes de recherche (comme condition de réalisation des principes FAIR). Les raisons de l'adoption du CIDOC CRM comme ontologie de base pour ce domaine seront exposées mais aussi la nécessité d'intégrer ce modèle en l'étendant grâce à un certain nombre de classes de haut niveau indispensables pour le traitement de la réalité sociale. L'outillage conceptuel des ontologies fondationnelles DOLCE et DnS permet ainsi de concevoir une architecture ontologique générale adaptée à fournir un cadre conceptuel dans lequel pourra s'inscrire toute une série d'extensions proches des sous-domaines de la recherche historique, et plus généralement des sciences humaines et sociales, qui seront ainsi intégrées dans un écosystème favorisant l'interopérabilité sémantique des données. L'exposé montrera comment la modélisation collaborative effectuée dans l'environnement de gestion d'ontologie OntoME (ontome.net) permet d'élaborer une ontologie communautaire modulaire et adaptée aux différents sous-domaines de la recherche.
Références :
- Semantic Data for Humanities and Social Sciences (SDHSS) CIDOC CRM Top-Level Extension (https://ontome.net/namespace/11)
- Beretta F., « A Challenge for Historical Research: Making Data FAIR Using a Collaborative Ontology Management Environment (OntoME) », Semantic Web 12, no 2 (1 janvier 2021): 279‑94, https://doi.org/10.3233/SW-200416.
16h15 - Mathieu d'Aquin - Graphes de connaissances pour les humanités numériques : besoins spécifiques et problèmes généraux
Les technologies et méthodes utilisées pour créer des graphes de connaissances, les données liées et les ontologies, sont particulièrement bien adaptées à la représentation de données et de connaissances pour les humanités numériques. Elles permettent en effet la représentation d'informations riches, variées et complexes, qui forment des réseaux d'entités explorables en partant de différents points d'entrées et suivant différents chemins. Dans cette présentation, je décris plusieurs exemples d'utilisations de ces technologies et méthodes, pour tenter d'extraire de situations spécifiques, dépendantes du domaine d'application, des problèmes généraux auxquels peuvent répondre les approches fondées sur les graphes de connaissances.
mardi 22 juin
9h - Nicolas Lasolle - Enrichir et explorer le corpus de la correspondance d’Henri Poincaré grâce à un mécanisme de recherche flexible
L’étude de la vie et l’œuvre d’Henri Poincaré (1854-1912) a entraîné la constitution d’un corpus composé de documents de natures diverses (e.g. articles scientifiques, lettres, ouvrages, rapports) qui constituent une source d’informations importante pour les historiens. Récemment, des technologies du Web sémantique ont été mises en œuvre pour représenter et exploiter les données du corpus de sa correspondance. Ces travaux soulèvent des problématiques relatives à l’exploitation d’un corpus historique. Un intérêt est porté aux choix relatifs à la création d’un modèle de représentation des connaissances. Comment représenter le plus fidèlement possible les données du corpus ? Comment prendre en compte des connaissances temporelles dans le modèle ? Des travaux s’intéressent également à la problématique de l’édition (i.e. la saisie des données dans le système). Quelles méthodes peuvent assister l’édition manuelle de ces données ? Dans le contexte de ces travaux, un système s’appuyant sur des règles de transformation a été développé pour enrichir et explorer ce corpus. Celui-ci propose notamment un mécanisme de recherche approchée qui outrepasse les limites de la plupart des systèmes actuels qui se cantonnent aux recherches exactes. Cette communication vise à présenter ce mécanisme et comment son intégration au travers de différents outils apporte une réponse à certaines des problématiques liées à l’exploitation de corpus historiques.
10h - Marie Puren et Pierre Vernus - Le projet SILKNOW : Web sémantique et valorisation du patrimoine de la soie en Europe
Le projet H2020 SILKNOW (Silk heritage in the Knowledge Society: from punched card to Big Data, Deep Learning and visual/tangible simulations) a pour but d’utiliser les technologies numériques pour faire connaître et valoriser le patrimoine de la soie en Europe (XVème-XIXème siècle). Ce patrimoine fragile et menacé peut en effet grandement bénéficier des apports du Web sémantique en matière de valorisation et de diffusion des données patrimoniales. Celui-ci permet d'une part d’apporter une réponse aux difficultés rencontrées par des institutions patrimoniales souvent de petite taille et manquant de moyens financiers, humains et techniques pour valoriser des collections riches mais mal connues du grand public. D’autre part, les grandes institutions patrimoniales généralistes, disposant de moyens plus conséquents, ne mettent pas toujours l’accent sur leurs collections textiles qui restent alors méconnues.
SILKNOW a ainsi créé un moteur de recherche exploratoire reposant sur un graphe de connaissance (“knowledge graph”) agrégeant les données provenant des catalogues d'institutions patrimoniales de différents pays. Pour son modèle de données SILKNOW a utilisé le CIDOC Conceptual Reference Model ou CIDOC-CRM. Dans cette intervention, nous proposons de présenter les différentes étapes du travail qui ont permis d’aboutir à la mise en place de ce moteur de recherche et notamment l'agrégation des données.
11h - Table ronde sur le thème des grands défis des Humanités Numériques pour l'Histoire
Manifestation organisée par Nicolas Lasolle, Olivier Bruneau et Jean Lieber avec le soutien des laboratoires AHP-PReST et Loria.
Ce travail a bénéficié d’une aide de l’État, gérée par l’Agence Nationale de la Recherche, au titre du projet Investissements d’Avenir Lorraine Université d’Excellence, portant la référence ANR-15-IDEX-04-LUE.
La participation à cette manifestation est libre. Merci de nous envoyer un message afin de vous inscrire. Les informations d'accès et/ou de connexion vous seront ensuite communiquées.