Intelligence artificielle, radiologie standard et urgences : miracle ou mirage ?

L’intelligence artificielle (IA) a fait naitre beaucoup d’espoirs et de craintes dans le milieu de la radiologie. Force est de constater que l’utilisation en routine de la plupart ces outils tarde à se répandre. La détection des fractures sur les radiographies standard fait partie des domaines où l’IA a pris sa place en pratique clinique.

IA urgence.png
Texte

Les logiciels d’aide au diagnostic des fractures par IA ont comme points forts de pouvoir être intégrés dans le workflow et le PACS et de traiter la quasi-totalité des radiographies osseuses faites aux urgences et selon les cas d’analyser également les radiographies du thorax avec une analyse quasi-instantanée. Ils équipent la quasi-totalité des CHU et plus de 2/3 de CH. 

La pertinence de la lecture par IA est moins élevée pour les radiographies des petits enfants et de façon générale va baisser en cas de défaut technique (mauvaises incidences, superposition de matériel ou de vêtement) mais la sensibilité de ces logiciels reste très élevée (supérieure à 95% pour les meilleurs logiciels) au détriment d’une spécificité un peu plus faible et donc de faux positifs (1,2). Ça reste très utile en complément de l’interprétation du radiologue comme un « compagnon » toujours en alerte, jamais fatigué. Depuis l’apparition des premières versions, la progression a été constante avec la détection des épanchements et des luxations qui faisaient défaut au début. Les fractures ratées aux urgences sont la première cause de contentieux et leur nombre augmente après 16h avec un pic à 3h du matin.
 

Texte

Ces logiciels influent peu sur les performances des radiologues seniors mais améliore nettement la sensibilité des radiologues juniors (au détriment de plus de faux positifs) et très nettement la sensibilité de urgentistes qui combinent le résultat de l’IA avec leur examen clinique. Il est important de diffuser régulièrement une formation aux jeunes radiologues et aux cliniciens sur le fonctionnement de ces logiciels, leurs points forts mais aussi leurs défauts.

Tout n’est pas idyllique car le déploiement de ces solutions est parfois réalisé dans des structures en manque criant de radiologues avec une utilisation directe par les urgentistes sans avoir l’expertise (même en décalé) d’un radiologue compétent. Le risque est de donner l’impression que l’interprétation est simple alors que ces logiciels sont entrainés uniquement à détecter des fractures (avec un rendu de type « fracture », « pas de fracture », « doute sur une fracture ») et n’auront pas la finesse du radiologue pour dépister d’autres anomalies ou reconnaitre des variantes de la normale (pas d’analyse « globale »).
Il y a donc un vrai risque de « remplacement » sur cette activité accéléré par la charge toujours lourde des examens d’imagerie faits en urgence.

La responsabilité finale du diagnostic est toujours médicale et l’IA n’est qu’une aide. Il ne faut pas éliminer le radiologue de l’équation.

L’autre risque est la perte de compétence des jeunes radiologues qui vont commencer leur formation avec ces outils à disposition sans devoir apprendre par eux-mêmes, avec une fâcheuse tendance à croire tout ce que dit l’IA et donc de plonger tête baissée dans les pièges des faux positifs. Cela se potentialise avec la baisse d’attractivité de l’interprétation des radiographies standard pour les jeunes au détriment de l’imagerie en coupe.
Il est fondamental que les radiologues gardent la main sur l’utilisation et le déploiement de ces logiciels et qu’ils continuent à s’impliquer dans la formation des internes. 

Il faut également évaluer le bénéfice de ces solutions sur la prise en charge clinique, savoir diffuser ces solutions auprès de nos manipulateurs pour qu’ils puissent réaliser des incidences complémentaires pertinentes en cas de doute.

Le choix des logiciels peut s’appuyer sur l’analyse de Drim France IA (3). Le marquage CE n’est pas suffisant, il faut si possible choisir un logiciel de classe IIA minimum (la catégorie I est une auto certification).

Au total, la performance de ces logiciels est réelle et un retour en arrière est peu probable. A nous d’en garder le contrôle comme recommandé par le comité national d’éthique en mettant la priorité sur les considérations sanitaires avant les considérations économiques.

 

1-    Artificial Intelligence in Fracture Detection: A Systematic Review and Meta-Analysis. Kuo RYL, Harrison C, Curran TA, Jones B, Freethy A, Cussons D, Stewart M, Collins GS, Furniss D. Radiology 2022 Jul;304(1):50-62.
2-    Assessment of performances of a deep learning algorithm for the detection of limbs and pelvic fractures, dislocations, focal bone lesions, and elbow effusions on trauma X-rays. Regnard NE, Lanseur B, Ventre J, Ducarouge A, Clovis L, Lassalle L, Lacave E, Grandjean A, Lambert A, Dallaudière B, Feydy A. Eur J Radiol 2022 Sep;154:110447.
3-    https://www.drim-ia.com

 

 


Pr K Chaumoitre (Hôpital Nord, CHU Marseille)
Pr C Cyteval (Hôpital Lapeyronie, CHU Montpellier)