Alban Cerisier

Cairn.info desempeña un papel decisivo en la preservación de la originalidad y la responsabilidad de los contenidos intelectuales en todas las áreas temáticas, teniendo en cuenta las nuevas oportunidades que ofrece la inteligencia artificial para descubrir textos originales.

Alban Cerisier
Presidente de Cairn.info

Introducción

Consciente de estos retos, Cairn.info colabora desde hace varios años con socios de confianza especializados en el tratamiento automático de textos e imágenes (en particular, Pythagoria, Kairntech e Isako). Gracias a estas colaboraciones, el desarrollo de redes neuronales y la aparición de modelos de aprendizaje automático «transformadores» vienen a ampliar las posibilidades que ofrecen las soluciones algorítmicas utilizadas actualmente en nuestros portales.

Logros y proyectos

En términos de servicios, nuestro uso de la inteligencia artificial se centra en:

  • extracción de metadatos: estructuración de las referencias bibliográficas y las afiliaciones de autores, extracción de palabras clave y entidades citadas;
  • clasificación: agrupación de publicaciones según su proximidad semántica, atribución a una disciplina, ordenamiento de ilustraciones por tipos.

Por otra parte, en 2024 se iniciaron experimentos de inteligencia artificial generativa centrados en:

  • La generación de textos como alternativa a las imágenes, en el marco de la accesibilidad de las publicaciones para las personas con alguna discapacidad.
  • El desarrollo de un modelo de preguntas y respuestas basadas en fuentes (generación mejorada por recuperación, RAG por sus siglas en inglés).
     

Normas deontológicas

Estos proyectos se desarrollan respetando las reglas que hemos establecido en Cairn.info para la utilización de la inteligencia artificial:

  • No transmitir el contenido de nuestros socios a los modelos de lenguaje de gran tamaño (o LLM, por sus siglas en inglés) de los principales actores de la IA.
  • Proteger este contenido a nivel tecnológico (Datadome) y jurídico (TDMRep).
  • Utilizar la IA generativa como un medio para facilitar el acceso al corpus científico y no como una alternativa a la lectura de los textos originales.
  • Implicar a nuestros socios (autores, editores, bibliotecarios) en la realización de proyectos de IA, siguiendo un enfoque transparente y colaborativo.
  • Optar por la sobriedad digital eligiendo el modelo de lenguaje más pequeño posible para la resolución de cada problema.

Enlaces útiles

Pages associées