Inteligencia artificial
Desde su creación, Cairn.info ha constituido un vasto corpus digital de contribuciones científicas minuciosamente estructuradas. En un contexto de expansión de las tecnologías de inteligencia artificial, Cairn.info se enfrenta a una doble responsabilidad: dominar estas tecnologías para favorecer la rastreabilidad de las publicaciones y proteger a los investigadores, editores y lectores contra cualquier apropiación de esta riqueza en común por parte de las GAFAM.
Una infraestructura soberana
En un contexto de constante evolución de las tecnologías y los usos en materia de IA, Cairn.info ha optado por dotarse de una arquitectura de hardware y software autónoma y modular, alojada íntegramente a nivel local. El objetivo: poder trabajar con los LLM más recientes, al tiempo que se protegen las publicaciones que se le confían de cualquier riesgo de apropiación externa.
Esta arquitectura consiste, por un lado, en una red dedicada de servidores y tarjetas GPU y, por otro, en un conjunto de herramientas de software que permiten probar y desplegar una gran variedad de modelos de lenguaje de código abierto, tanto pequeños como grandes.
Socios
Kairntech, Isako y Pythagoria

SophIA, un RAG para responder a las necesidades de los estudiantes e investigadores
SophIA, un proyecto respaldado por el Centre National du Livre, es una alternativa al motor de búsqueda clásico que permite formular preguntas en lenguaje natural. En comparación con otras herramientas existentes, presenta una doble diferencia: por un lado, se basa únicamente en contenidos científicos validados difundidos en Cairn.info y, por otro, ofrece acceso directo a extractos de estas publicaciones, destacando a los investigadores y sus diversas respuestas a las preguntas planteadas. En lugar de un intento de síntesis aleatorio que ofrece paráfrasis aproximadas, el usuario puede descubrir en contexto (cronológico, geográfico, disciplinario, etc.) los intercambios científicos en torno a la problemática abordada.
-
El RAG (Retrieval-Augmented Generation) combina dos funciones: la búsqueda de información en un corpus fiable y la generación de texto. La IA comienza consultando una base de datos o una biblioteca de contenidos y, a continuación, formula una respuesta clara y contextualizada. Este enfoque garantiza respuestas documentadas, precisas y más fiables que las producidas por un modelo «puro».
SophIA estará disponible a finales de 2025 para los suscriptores de Cairn Pro (psicología, trabajo social, ciencias de la educación) y, posteriormente, su corpus se ampliará a todas las disciplinas difundidas en la plataforma.



La IA al servicio de la accesibilidad
Al igual que sus socios editores, Cairn.info está sujeto a la Ley de Accesibilidad Digital derivada de la EAA (Ley Europea de Accesibilidad).
El nuevo portal Cairn.info ha sido auditado en este sentido y se aplicarán correcciones al inicio del curso universitario 2025 para garantizar que el sitio web cumpla con las recomendaciones del RGAA (Referencial General de Mejora de la Accesibilidad). En lo que respecta a la accesibilidad de las publicaciones, ya se generan textos alternativos a las imágenes para todas las nuevas publicaciones que se publican en línea. Un proceso distingue automáticamente los tipos de imágenes y elige para cada una de ellas el modelo de lenguaje o la herramienta algorítmica óptima para generar una versión textual alternativa.

-
Referencial general para la mejora de la accesibilidad (RGAA)
Marco normativo francés que define los criterios técnicos para que un sitio web sea accesible a las personas con discapacidad. Se basa en las WCAG, adaptándolas al contexto francés. Obligación legal para los sitios web públicos en Francia.
https://accessibilite.numerique.gouv.fr
Normas deontológicas
Estos proyectos se desarrollan respetando las reglas que hemos establecido en Cairn.info para la utilización de la inteligencia artificial:
- No transmitir el contenido de nuestros socios a los modelos de lenguaje de gran tamaño (o LLM, por sus siglas en inglés) de los principales actores de la IA.
- Proteger este contenido a nivel tecnológico (Datadome) y jurídico (TDMRep).
- Utilizar la IA generativa como un medio para facilitar el acceso al corpus científico y no como una alternativa a la lectura de los textos originales.
- Implicar a nuestros socios (autores, editores, bibliotecarios) en la realización de proyectos de IA, siguiendo un enfoque transparente y colaborativo.
- Optar por la sobriedad digital eligiendo el modelo de lenguaje más pequeño posible para la resolución de cada problema.

