L’IA en Médecine : Perspectives et défis dans l’extraction des données médicales
Tatiana LECOT-CONNAN, Paris
Atelier SFE 07 : IA et extraction données CR médicaux. Intérêts et limites.
Marie DE TAYRAC, Rennes, Bastien RANCE, Paris
Cette troisième matinée du congrès de la SFE était placée sous le thème de l’intelligence artificielle avec un atelier sur l’IA et l’extraction de données de comptes rendus médicaux où nous avons pu nous familiariser avec certains outils.
Différentes utilisations de l’IA peuvent être envisagés dans la pratique clinique : personnalisation du traitement et du suivi des patients, recherche d’informations et de cas cliniques spécifiques dans la littérature…
Une IA, pour fonctionner, nécessite un entraînement pour pouvoir répondre à une question spécifique. Dans le cadre des modèles de langues, il est fourni un grand nombre de textes à l’IA et cette dernière est entraînée à prédire le prochain mot d’une phrase par association statistique. Tous les grands modèles de langues datent de moins de 10 ans, on est rapidement passé du domaine de l’informatique au grand public, le plus connu étant ChatGPT. Différentes méthodes d’extraction de texte existent :
- Méthodes basées sur des règles ou sur l’apprentissage automatique
- Reconnaissance d’entités nommées
- Méthodes basées sur des modèles de langage préentraînés
Pendant l’atelier, nous avons aborder l’extraction de données de comptes rendus médicaux sous le prisme de la génétique. Dans les comptes rendus médicaux de consultation de génétique, l’ontologie des phénotypes humains (HPO), essentielle pour les généticiens, prend du temps à écrire. De ce fait, des outils spécifiques ont été développés afin d’identifier dans un compte-rendu des mots-clés et faire ressortir les différents termes HPO du compte-rendu. Nous avons ainsi pu tester différents outils comme Acuitee (texte en français, https://acuitee.labs.b-com.com/) ou Doc2hpo (texte en anglais, https://doc2hpo.wglab.org/) à partir d’un compte-rendu fictif. Nous avons également utilisé ChatGPT mais cette fois-ci avec un prompt bien clair lui spécifiant ce qu’il pouvait faire et ne pas faire car, contrairement aux deux précédents, ChatGPT n’a pas été entraîné pour répondre à ce genre de questions. Il faut donc lui donner des instructions très claires.
Ainsi, les perspectives attendues dans la génétique concernant l’utilisation de modèle de langue sont l’automation du phénotypage profond et l’amélioration de l’identification de gènes causaux, l’identification de patients similaires ainsi que l’amélioration des connaissances de l’histoire naturelle des maladies.
Il ne faut pas cependant oublier l’envers du décor de l’IA :
- Son coût financier : les cartes graphiques pour faire fonctionner les modèles coûtent chères
- Son coût environnemental : on l’oublie souvent mais le numérique pollue énormément
- La question des données personnelles : il nous est rappelé que, même si l’on enlève les données identifiantes des patients (nom, prénom, date de naissance…), les outils en ligne peuvent identifier les patients par l’ensemble des données qu’on lui met à disposition. Il est donc nécessaire d’utiliser des outils sécurisés.
Au total, l’IA est un excellent outil pour mieux suivre, mieux prévenir, mieux traiter, mieux prendre en charge mais il faut que son utilisation se fasse dans des cadres précis et structurés.