Intelligence artificielle
Depuis sa création, Cairn.info a constitué un vaste corpus numérique de contributions scientifiques finement structurées. A l’heure de l’explosion des technologies d’intelligence artificielle, une double responsabilité lui incombe : maîtriser ces technologies pour favoriser la découvrabilité de ces publications et protéger chercheurs, éditeurs et lecteurs contre toute mainmise des GAFAMs sur cette richesse commune.
Une infrastructure souveraine
Dans un contexte d’évolution constante des technologies et des usages en matière d’IA, Cairn.info a choisi de se doter d’une architecture matérielle et logicielle autonome et modulaire, entièrement hébergée localement. Le but : pouvoir travailler sur les LLMs les plus récents, tout en préservant les publications qui lui sont confiées de tout risque de prédation externe.
Cette architecture consiste d’une part en un réseau dédié de serveurs et cartes GPU, et d’autre part en une suite d’outils logiciels permettant de tester et déployer une grande variété de modèles de langage open source, petits et grands.
Partenaires
Kairntech, Isako et Pythagoria

SophIA, un RAG pour répondre aux besoins des étudiants et chercheurs
Projet soutenu par le Centre national du livre, SophIA est une alternative au moteur de recherche classique, permettant de formuler des questions en langage naturel. Par rapport aux autres outils existants, sa différence est double : d’une part il se base uniquement sur les contenus scientifiques validés diffusés sur Cairn.info, d’autre part, il propose d’accéder directement aux extraits de ces publications en mettant en avant les chercheurs et leurs réponses diverses aux questions posées. Plutôt qu’une tentative de synthèse hasardeuse et proposant des paraphrases approximatives, l’utilisateur peut donc découvrir en contexte (chronologique, géographique, disciplinaire, etc.) les échanges scientifiques autour de la problématique abordée.
-
Le RAG (Retrieval-Augmented Generation) associe deux fonctions : la recherche d’informations dans un corpus fiable et la génération de texte. L’IA commence par interroger une base de données ou une bibliothèque de contenus, puis formule une réponse claire et contextualisée. Cette approche garantit des réponses sourcées, précises et plus fiables que celles produites par un modèle « pur ».
SophIA sera disponible à la fin 2025 aux abonnés Cairn Pro (psychologie, travail social, sciences de l’éducation), puis son corpus sera étendu à l’ensemble des disciplines diffusées sur la plateforme.



L’IA au service de l’accessibilité
Au même titre que ses partenaires éditeurs, Cairn.info est concerné par la Loi sur l’accessibilité numérique issue du EAA (European Accessibility Act).
Le nouveau portail Cairn.info a été audité en ce sens, et des correctifs vont être appliqués à la rentrée universitaire 2025 pour garantir une conformité du site aux recommandations du RGAA (Référentiel Général d’Amélioration de l’Accessibilité). Pour ce qui concerne l’accessibilité des publications, des textes alternatifs aux images sont d’ores et déjà générés pour toute nouvelle publication mise en ligne. Un pipeline distingue automatiquement les types d’images et choisit pour chacune d’entre elles le modèle de langage ou l’outil algorithmique optimal pour générer une version textuelle alternative.

-
Référentiel général d’amélioration de l’accessibilité (RGAA)
Cadre réglementaire français définissant les critères techniques pour rendre un site web accessible aux personnes en situation de handicap. Il repose sur les WCAG tout en les adaptant au contexte français. Obligation légale pour les sites publics en France.
https://accessibilite.numerique.gouv.fr
Règles déontologiques
Ces projets sont menés en respectant les règles que Cairn.info s’est données pour son utilisation de l’intelligence artificielle :
- Ne pas transmettre les contenus de ses partenaires aux LLM exploités par les grands acteurs de l’IA
- Protéger ces contenus technologiquement (Datadome) et juridiquement (TDMRep).
- Utiliser l’IA générative pour faciliter l’accès au corpus scientifique plutôt que comme alternative à la lecture des textes originaux.
- Associer ses partenaires (auteurs, éditeurs, bibliothécaires) à la mise en œuvre des projets d’IA, dans une approche transparente et collaborative.
- Privilégier la sobriété numérique en choisissant pour chaque problème le plus petit modèle de langage en mesure de le résoudre.

