Créé en 2012, l’établissement public Campus Condorcet (EPCC), constructeur et gestionnaire du Campus Condorcet (www.campus-condorcet.fr), développe ses activités de coordination scientifique, en application de son nouveau décret statutaire du 8 octobre 2021. Il est notamment coordonnateur de l’ÉquipEx+ Biblissima+ (biblissima.fr).

Biblissima+ (Observatoire des cultures écrites, de l’argile à l’imprimé) fait partie des équipements structurants pour la recherche ÉquipEx+ sélectionnés en 2020 dans le cadre des Investissements d’avenir. Il prend le relais de l’ÉquipEx Biblissima (Bibliotheca bibliothecarum novissima : observatoire du patrimoine écrit du Moyen Âge et de la Renaissance, 2012-2021). Biblissima+ est porté par le Campus Condorcet, piloté par Anne-Marie Turcan-Verkerk (AOROC, EPHE-PSL) avec François Bougard (IRHT, CNRS), Marie-Agnès Lucas-Avenel (CRAHAM, Université de Caen) et Emmanuelle Morlock (HiSoMa, CNRS). Le programme bénéficie d’une aide de l’État gérée par l’Agence nationale de la Recherche. Il s’achèvera le 30 juin 2029.

Biblissima+ fédère 16 établissements et une entreprise privée, réunis en un consortium et agissant par l’intermédiaire de leurs services ou d’unités de recherche ou de service placées sous leur tutelle. Avec leurs équipes, Biblissima+ crée une infrastructure numérique multipolaire de recherche fondamentale et de service consacrée à l’histoire de la transmission des textes anciens, des premières tablettes d’argile mésopotamiennes aux premiers livres imprimés, sur tous les supports et dans toutes les langues.

Missions

Sous la responsabilité hiérarchique de la responsable scientifique et technique de Biblissima+ et sous l’autorité fonctionnelle directe du responsable de l’équipe portail Biblissima+, l’ingénieur.e en traitement de données bibliographiques aura pour mission d’enrichir le portail en y intégrant les ressources bibliographiques, à la fois celles transmises via les bases partenaires de Biblissima+ et celles ajoutées au fil du traitement des données, afin de proposer sur les différentes pages du portail des rebonds vers des sources secondaires pertinentes pour l’étude de tel manuscrit, de telle personne, de telle oeuvre etc.

Pour mener à bien la première phase de ce chantier, l’ingénieur.e se verra confier les tâches suivantes :

  • un travail préalable de traitement massif des références bibliographiques existantes : nettoyage et dédoublonnage, extraction des entités auteur et titre ;
  • un alignement des entités auteur avec des référentiels externes tels que BnF, IDRef, Persée, Wikidata, HAL etc.

Les données bibliographiques ainsi traitées et, autant que possible, alignées seront ensuite intégrées dans une plateforme de gestion et de publication basée sur le logiciel Wikibase et créée au préalable par l’équipe portail.

La seconde phase de ce chantier consiste à enrichir ces données bibliographiques avec des liens vers des numérisations et publications en ligne (ouvrages, articles de revue, comptes rendus, catalogues imprimés etc.) disponibles sur diverses plateformes telles que HAL, Open Edition, Persée, Gallica ou Internet Archive. Ce travail impliquera d’exploiter différentes API et de mettre en place des procédures d’interrogation, d’extraction et de matching de données à partir de celles-ci.

Sur l’ensemble de ces tâches, l’ingénieur.e bénéficiera de l’appui de l’équipe portail Biblissima+, tant sur le plan de la méthodologie que sur les aspects techniques (prise en main de Wikibase, usages avancés d’OpenRefine, développement de scripts…).

Dans le cadre de la réalisation de ces missions, la personne recrutée aura également à fournir un travail de gestion, de documentation et de mise à disposition des livrables associés, respectant les préconisations du plan de gestion des données de Biblissima (cf. https://zenodo.org/record/7081674) qui traduit la manière dont le projet s’inscrit dans une dynamique de Science ouverte et de gestion des données conformes aux principes de qualité FAIR.

Compétences

CONNAISSANCES GÉNÉRALES

  • Connaissance de la bibliographie pour les études médiévales ;
  • Connaissance des instruments bibliographiques et des règles de description bibliographique ;
  • Connaissance pratique des principaux référentiels d’autorités nationaux et internationaux ;
  • Connaissance des principes, formats et technologies de données liées (XML, RDF, JSON) ;
  • Maîtrise d’au moins un logiciel de traitement de données (Excel, OpenRefine) ;
  • Compétences informatiques appréciées : maîtrise des expressions régulières, maîtrise d’au moins un langage de requête tel que SPARQL, expérience dans l’interrogation et l’exploitation d’API de réservoirs de données.

SAVOIR-FAIRE PROFESSIONNEL

  • Sens du travail en équipe ;
  • Aisance rédactionnelle en français : rédaction de documentation et de procédures.

QUALITÉS REQUISES

  • Rigueur et sens logique ;
  • Réactivité et capacité d’adaptation ;
  • Grande capacité d’organisation et d'autonomie ;
  • Être force de proposition.

Profil

Le profil recherché se situe dans le domaine de l’ingénierie documentaire, avec une connaissance souhaitée de la bibliographie pour les études médiévales et des compétences en analyse et traitement de données. Un profil de type Master en humanités numériques conviendrait à ce poste.
Nom de l'organisme :
Etablissement public Campus Condorcet
Adresse :
8 cours des Humanités
93300 - AUBERVILLIERS
Mél :
recrutement(at)campus-condorcet.fr
Durée(s) :
CDD 12 mois
Début :
Février
Date limite de candidature :
20 février 2024

Informations complémentaires

La personne recrutée sera amenée à travailler étroitement avec l’équipe portail Biblissima+ hébergée dans l’Hôtel à projets du Campus Condorcet à Aubervilliers. A ce jour l’équipe est composée de trois ingénieurs en charge de l'infrastructure technique de Biblissima+, d’une chargée du pilotage opérationnel de l’ÉquipEx+, et d’une ingénieure dédiée au déploiement de IIIF dans les archives de France.