Icone social AHP

Nicolas LASOLLE


Page personnelle : https://members.loria.fr/NLasolle/

Titre de la thèse / PhD

Un système de recherche flexible pour le Web sémantique : application au corpus de la correspondance d'Henri Poincaré.

Résumé

Ma thèse, « Indexer et explorer un corpus d’humanités numériques par des représentations élastiques », a débuté en septembre 2020. Ce travail a lieu dans le cadre d’une collaboration entre le Loria et les Archives Henri-Poincaré, et s’inscrit dans le projet OLKi.

Au cours de sa vie, Henri Poincaré a tenu une correspondance active, aussi bien privée, administrative que scientifique. Composé d'environ 2100 lettres (envoyées et reçues), ce corpus se présente comme une source d'informations majeure pour les historiens des sciences. Les lettres sont accessibles sur le site http://henripoincare.fr. Elles sont associées à une transcription, un apparat critique ainsi qu'à un ensemble de méta-données descriptives. Deux problématiques liées au Web sémantique sont abordées au travers de ce corpus.

La première concerne l’annotation humaine pour l’édition de données qui est une tâche parfois longue et fastidieuse pour les utilisateurs concernés. L’objectif est de proposer un nouvel éditeur, qui, par un mécanisme d’autocomplétion, assiste efficacement l’utilisateur lors de son travail d’édition. Différentes méthodes et combinaisons de méthodes sont explorées pour proposer des suggestions pertinentes en fonction du problème d’édition courant. Des premiers travaux ont conduit à la réalisation d’un éditeur Web. Cet outil sera prochainement soumis à une évaluation humaine, qui permettra d’éditer de nouvelles lettres de la correspondance.

La deuxième problématique concerne la recherche de données au sein de cette correspondance. Plus particulièrement, mes travaux visent à proposer un mécanisme de recherche élastique. Imaginons un historien des sciences à la recherche d'informations concernant les fonctions Fuchsiennes dans la correspondance d'Henri Poincaré. Cette théorie a été développée à la fin du 19e siècle et a intéressé un grand nombre de mathématiciens de l'époque. Soit Q la requête informelle initiale formulée par l'historien :

Q = « Donne-moi les lettres envoyées par Henri Poincaré à des mathématiciens entre 1880 et 1890 »

L'ensemble des résultats peut être incomplet ou ne pas correspondre aux attentes de l'historien. L'idée est de proposer un mécanisme de transformations de requête afin de proposer de nouveaux résultats. Par exemple, voici trois nouvelles requêtes qui pourraient résulter de la transformation de Q :

Q’1 = « Donne-moi les lettres envoyées par des mathématiciens à Henri Poincaré entre 1880 et 1890 »

Q’2 = « Donne-moi les lettres envoyées par Henri Poincaré à des scientifiques entre 1880 et 1890 »

Q’3 = « Donne-moi les lettres envoyées par Henri Poincaré à des mathématiciens entre 1875 et 1895 »

L'objectif de ce mécanisme est double. Tout d'abord, il permet de présenter des résultats sémantiquement proches de ceux correspondant aux critères de recherche et qui peuvent apporter une réponse au problème de recherche pour lequel la requête initiale a été formulée. Mais ce mécanisme peut aussi faire émerger de nouvelles connaissances pour le domaine. En effet, dans le contexte de la correspondance d'Henri Poincaré, il facilite le travail des historiens et permet de dégager de nouveaux liens ou d’affiner des liens existants entre des personnes, institutions, etc.

Ces travaux de recherche dépassent le cadre de ce corpus et permettent d'introduire des réflexions autour de la conception de systèmes pérennes pour les sciences humaines. En effet, les outils et techniques explorées ici permettent de répondre à des problématiques communes à différents contextes (indexation de contenu, recherche approchée, définition et utilisation d’ontologies, etc.). L’objectif n’est pas uniquement de constituer une version « numérique » du corpus mais aussi d’introduire de nouvelles méthodes et pratiques aidant à mener des travaux de recherche. Pour cela, il est nécessaire de développer des systèmes qui soient capables de s’adapter aux besoins des utilisateurs, sans forcément restreindre l’usage à certaines applications.

Enseignement

TP d’algorithmique et programmation à la FST de Nancy