Work packages

Date de mise à jour : 30 juin 2023

Le projet Issa se décline en 4 work packages

WP1 – Extraction de connaissances dans une archive ouverte

De nombreuses approches permettent l’extraction de connaissances mais elles sont souvent peu accessibles à des personnes peu techniques et sans connaissances particulières en sciences des données. Ainsi, il faut employer ou concevoir une méthode qui puisse être comprise intuitivement par les néophytes. L’annotation sémantique massive du contenu des publications par le liage d’entités vers un référentiel, telle que réalisée dans le projet ISSA, constitue un bon point d'ancrage pour des techniques plus sophistiquées d’extraction de connaissances, notamment permettant l’identification de relations complexes entre les entités. Méthodologiquement, l’extraction de règles d’association est une approche prometteuse pour l’extraction de telles relations complexes et a fait l'objet de travaux dans le consortium ISSA. Ces règles définissent des patrons de cooccurrence de mots-clefs qui permettent de déterminer pour chaque règle sa pertinence, la confiance associée, et son éventuelle symétrie. Dans ce workpackage, nous proposons de reprendre ces travaux pour : d’une part rendre l’approche portant sur les associations thématiques plus robuste et proposer une implémentation pérenne, générique et réutilisable s’intégrant dans le workflow ISSA (T1.1) ; d’autre part de démontrer cette robustesse et cette généricité en étendant l’approche sur les réseaux de chercheurs (graphes de co-auteurs, T1.2).

WP2 – L’intelligence artificielle au service de la bibliométrie

Dans ce workpackage, nous nous concentrerons sur le rôle que peut jouer l’intelligence artificielle dans la proposition de nouveaux services aux chercheurs, aux documentalistes ou encore dans un objectif d’aide au pilotage à différentes échelles en lien avec la bibliométrie. Une définition intéressante de la bibliométrie est proposée dans le Biblioguides « Infométrie, bibliométrie : Pourquoi ? Comment ? » de la Bibliothèque de Sorbonne Université : « La bibliométrie s'appuie sur l'analyse statistique des données et des réseaux pour mesurer et qualifier l'activité de recherche à partir des productions scientifiques d'un collectif. » Nous voyons bien au travers de cette définition qu’au-delà de l’évaluation de la recherche, très questionnée par ailleurs aujourd’hui, les possibilités offertes par la bibliométrie sont très larges et recouvrent des concepts parfois très différents. Nous essaierons d’abord de démêler ces différents concepts en dressant des états de l’art dans ces domaines (T2.1) avant de nous intéresser au cas concret de deux archives ouvertes, HAL EuroMov et Agritrop (T2.2).

WP3 – Services aux chercheurs et aux documentalistes

L'objectif de ce WP est d'exploiter les résultats obtenus des WP1 et WP2 pour proposer aux utilisateurs finaux des services de recherche, visualisation et exploration des archives scientifiques. Deux axes sont considérés : (T3.1) les services permettant de chercher et découvrir des publications par les thématiques qu'elles abordent ou via des réseaux de copublication ; (T3.2) les services permettant d'explorer les publications sous un angle bibliométrique. Afin de valider les concepts et tester les services développés dans un contexte réaliste, ceux-ci seront appliqués aux archives ouvertes Agritrop et Hal EuroMov.

WP4 – Dissémination

Un effort important du projet porte sur l'aspect pédagogie/retour vers les communautés pour une montée en compétence des jeunes et le transfert de la méthodologie vers d’autres établissements.

Au cours du projet, 2 stages seront proposés à des étudiants de Master 2 en informatique (WP1 et WP3) et un stage pour un étudiant de profil IST Master 2 dans le WP2. Un atelier, à destination de professionnels de l’information, se déroulera sur une journée. Il est prévu d’accueillir une cinquantaine de personnes. L’objectif de cette journée est de proposer une restitution des réalisations du projet ISSA 2 avec une démonstration des services développés. Une large part sera laissée à la discussion autour des thématiques principales du projet : le développement de services, la bibliométrie, les initiatives autour de ces questions.

Toutes les briques logicielles et les documents produits dans le cadre du projet seront rendus librement accessibles.

Enfin, nous nous appuierons sur les réseaux CollEx-Persée pour faire connaître nos propositions et nous impliquer dans des actions communes de diffusion.

Date de mise à jour : 30 juin 2023