Enjeux et limites des IA pour le traitement des données SHS : LLM, RAG et développement d’applications pour la recherche
Stéphane Pouyllau
Résumé
Stéphane Pouyllau, CNRS, IR* Huma-Num
Les IA et plus récemment les IA génératives et leurs applications transforment le traitement des données en SHS. L’infrastructure Huma-Num IR* qui investit ces domaines depuis la création d’ISIDORE en 2010, déploie depuis 2022 de nouveaux outils d’exploration et d’analyse sur la base d’une infrastructure de calcul pour l’IA. Dans ce contexte, leur adaption et adoption soulève des enjeux majeurs. Les chercheurs doivent s’approprier ces technologies pour en maîtriser les implications épistémologiques et éthiques tout en restant vigilants face aux risques d’hallucinations ou de biais liés à la qualité des corpus. Les méthodes comme la retrieval-augmented generation (ou RAG), qui sont au coeur de très nombreux outils de recherche, améliorent l’accès à l’information via le langage naturel, mais ne se substituent pas à des bases de données structurées et restent limitées par la pertinence et la taille des données disponibles. L’infrastructure Huma-Num, avec ses ressources mutualisées (GPU, plateformes collaboratives), soutient ces innovations, mais son accès et ses capacités sont contraints par certaines limites qu’il s’agit d’explorer. Enfin, l’intégration de ces outils doit concilier interopérabilité, science ouverte et préservation des données, dans un écosystème où la ré-utilisabilité reste encore à construire et sollicite fortement le concours des chercheur·e·s, des documentalistes, archivistes et professionnels des données numériques.
Partager cette ressource
Intégrer cette vidéo
Générique
Organisation
ARDoISE, Université de Rennes, Université Rennes 2, MSHB, Inserm, INRAE, Inria, CNRS, URFIST, Eskemm numérique, OSERen, CHU Rennes
Réalisation
CREA – Université Rennes 2
ARDoISE est un projet financé avec le soutien du Fonds National pour la Science Ouverte, labellisé Atelier de la donnée – recherche.data.gouv.fr
Conditions d'utilisation
Cette ressource constitue une oeuvre protégée par les lois en vigueur sur la propriété intellectuelle, dont les producteurs sont titulaires.Les dénominations ou appellations, les logos, sont, sauf indications particulières, des marques déposées.
Aucune exploitation commerciale, reproduction, représentation, utilisation, adaptation, modification, incorporation, traduction, commercialisation, partielle ou intégrale des éléments de cette ressource ne pourra en être faite sans l’accord préalable et écrit des ayants droit, à l’exception de l’utilisation pour un usage privé sous réserve des dispositions différentes voire plus restrictives du Code de la propriété intellectuelle.
La violation de l’un de ces droits de propriété industrielle et/ou intellectuelle est un délit de contrefaçon passible d’emprisonnement et d’une amende.
Les enseignants ont le droit d’utiliser librement et gratuitement cette ressource pour leurs cours.
Pour plus de renseignements contactez : lairedu@univ-rennes2.fr
