Alban Cerisier

Cairn a un rôle décisif à jouer pour préserver le territoire de l'originalité et de la responsabilité des contenus intellectuels dans tous les domaines disciplinaires, en prenant en compte les opportunités nouvelles de l'intelligence artificielle pour la découverte des textes originaux.

Alban Cerisier
Président de Cairn.info

Introduction

Consciente de ces enjeux, Cairn.info travaille depuis plusieurs années avec des partenaires de confiance spécialisés dans le traitement automatique du texte et de l’image (notamment Pythagoria, Kairntech et Isako). Le développement des réseaux neuronaux et l’apparition des modèles « à transformeurs » sont venus récemment accroître les possibilités offertes par les solutions algorithmiques déjà exploitées sur nos portails grâce à ces partenariats.

Réalisations et projets

En termes de services, notre utilisation de l’intelligence artificielle porte principalement sur :

  • l’extraction de métadonnées : structuration des références bibliographiques et des affiliations d’auteurs, extraction de mots-clés et d’entités nommées ;
  • la classification : groupement des publications par proximité sémantique, attribution disciplinaire, partitionnement des illustrations par types.

Des expérimentations d’intelligence artificielle générative ont d’autre part été initiées en 2024. Elles concernent :

  • La génération de textes alternatifs aux images, dans le cadre de l’accessibilité des publications aux publics empêchés
  • Le développement d’un modèle de questions/réponses sourcées (RAG - Retrieval augmented generation).
     

Règles déontologiques

Ces projets sont menés en respectant les règles que Cairn.info s’est données pour son utilisation de l’intelligence artificielle :

  • Ne pas transmettre les contenus de ses partenaires aux LLM exploités par les grands acteurs de l’IA
  • Protéger ces contenus technologiquement (Datadome) et juridiquement (TDMRep).
  • Utiliser l’IA générative pour faciliter l’accès au corpus scientifique plutôt que comme alternative à la lecture des textes originaux.
  • Associer ses partenaires (auteurs, éditeurs, bibliothécaires) à la mise en œuvre des projets d’IA, dans une approche transparente et collaborative.
  • Privilégier la sobriété numérique en choisissant pour chaque problème le plus petit modèle de langage en mesure de le résoudre.

Liens utiles

Pages associées