ESR meets France session: Problem-solving with AI in emergencies — the French Experience

Auteur(s)

La session “ESR meets France” a réuni des experts français et européens pour un bilan clinique et scientifique de l’intelligence artificielle (IA) en radiologie d’urgence, avec un accent sur l’impact médical, les métriques de performance et l’intégration opérationnelle du triage IA dans les filières thoracique, abdominale et neuro. Les résultats présentés indiquent des gains tangibles sur la sécurité des patients et les délais de prise en charge, tout en rappelant les exigences de robustesse, de supervision humaine et de validation multicentrique.

Principaux enseignements transversaux

Sécurité et délais: réduction de 15–30% des temps de lecture prioritaire et accélération moyenne des alertes critiques de 5 à 12 minutes selon les cas d’usage (hémorragie intracrânienne, embolie pulmonaire, pneumothorax, occlusion intestinale).

Performance des algorithmes: AUROC de 0,87 à 0,96 selon modalités et pathologies; sensibilités > 90% pour les détecteurs d’hémorragie intracrânienne et d’embolie pulmonaire validés en multicentrique.

Intégration clinique: adoption durable lorsque l’IA sert au triage, à la priorisation de la Worklist et au signalement des événements critiques; réduction des faux positifs après calibration locale et QA.

Qualité et robustesse: suivi longitudinal, audits de drift, traçabilité, conformité RGPD, explicabilité et documentation des incidents.

Lecture 1 — AI and thoracic emergencies (Mathieu Lederlin, MD, PhD, Rennes)

Cas d’usage et performances

Pneumothorax (radiographie au lit): sensibilité 94% et spécificité 88% après calibration locale; les outils commerciaux rapportent parfois des sensibilités jusqu’à 100%, avec bénéfice marqué pour les lecteurs juniors et non-radiologues.

Embolie pulmonaire (angio-TDM): sensibilité/spécificité “bonnes”, comparables aux radiologues; utilité en triage et en “filet de sécurité”. Quantification automatique de la charge thrombotique corrélée à des scores établis (type Mastora).

Aortopathies aiguës (CTA): bonne détection de la dissection et classification A/B; limites pour hématomes intramuraux et ulcères pénétrants, et risque de faux positifs sans ECG-gating. En non-contraste, une étude (Nature Medicine) a rapporté un VPN quasi parfait chez des patients à bas risque, à confirmer en vraie vie.

Impact opérationnel

Réduction de 22% du temps jusqu’à la première lecture pour les radiographies thoraciques urgentes.

Triage automatisé de la Worklist et notifications critiques intégrées au RIS/PACS; adoption des équipes en 6–8 semaines.

Points de vigilance

Dépendance aux protocoles d’acquisition et à la distribution du contraste; manqués possibles pour EP distales et chroniques.

Artefacts (respiration, flux) et pièges (shunts mimant une EP); besoin d’algorithmes dédiés aigu/chronique et d’entraînement multicentrique.

Lecture 2 — AI and abdominal emergencies (Ingrid Millet, MD, PhD, Montpellier)

État de l’art et exemples

Occlusion intestinale: AUROC 0,90–0,93 pour la détection “high-grade”; la localisation de la zone de transition reste < 60% dans une étude, limitant l’aide décisionnelle.

Appendicite: NPV > 95% pour l’exclusion rapide en flux tendu; valeur ajoutée variable des modèles de localisation/classification selon les workflows.

Pneumopéritoine: performance plus faible pour volumes d’air minimes; utile conceptuellement pour éviter les manqués, mais nécessite des protocoles d’acquisition standardisés et des validations en vraie pratique.

Impact opérationnel

Baisse de 18% du temps de compte rendu préliminaire en période de garde.

Schéma d’intégration souhaitable: assistants de workflow (analyse de demande, protocole TDM, flags vitaux, quantifications, pré-rapports, alertes SMS), avec supervision experte.

Limites et recommandations

Faux positifs liés aux artefacts de mouvement et au contraste; nécessité d’une QA post-déploiement et d’entraînements multi-sites.

L’IA réduit le temps au diagnostic via triage, rapports structurés et quantifications, mais ne remplace pas la décision chirurgicale.

Lecture 3 — AI and neuroradiology emergencies (Joseph Benzakoun, MD, PhD, Paris)

Principes et vitesse

“Time is brain”: les algorithmes doivent délivrer en 30–60 secondes pour être utiles en routine AVC; des algorithmes à 5 minutes sont trop lents pour les workflows de thrombectomie/thrombolyse.

Sensibilité pour l’hémorragie intracrânienne: 92–96%; réduction du délai acquisition → alerte neuro de 7 à 10 minutes; augmentation des taux de thrombectomie dans les fenêtres thérapeutiques via triage IA.

Spécificité française

En France, l’IRM est réalisée chez ≈ deux tiers des suspicions d’AVC, orientant l’IA vers l’optimisation des séquences (FLAIR, T2*, perfusion), la segmentation/quantification du core et de la pénombre, et l’assistance aux non-spécialistes.

Génératif en IRM: substitutions FLAIR/T2* basées sur diffusion pour patients agités, avec visualisation de transformations hémorragiques.

Intégration et explicabilité

Heatmaps explicatives, robustesse multicentrique et coordination avec équipes neurovasculaires pour des pathways fluides.

Protocoles “human-first”: lecture humaine primaire avant exposition aux sorties IA; validation senior pour cas critiques/hors domaine.

Lecture 4 — Implementing AI in routine emergency radiology: from proof of concept to real life (Guillaume Herpe, MD, PhD, Poitiers)

Méthodologie et indicateurs

Évaluation clinique réelle: KPIs de processus (temps de lecture, temps d’alerte), de résultats (mortalité, complications), et d’acceptabilité (feedback radiologues).

Chiffres: baisse de 12–20% des temps de lecture en heures de pointe; diminution des comptes rendus incomplets; stabilité des performances sur 12 mois avec audits trimestriels de drift et recalibrage.

Gouvernance et intégration

Comité IA, cartographie des use-cases, contrats et responsabilité, conformité, maintenance, formation continue; intégration RIS/PACS, messagerie d’alerte, SSO.

Surveillance continue: écarts de performance liés aux constructeurs (jusqu’à 16% d’écart observé; odds ratio ≈7 pour la détection d’HIC entre scanners Philips vs GE dans une étude externe), dérives temporelles sur 2 ans.

Cas d’usage et adoption

IPE: sur >1000 TDM, 9 embolies pulmonaires incidentes manquées initialement détectées par IA; prévalence passant de 0,8% à 1,3%.

Modèle “radiologue augmenté”: IA pré-filtre et quantifie; le radiologue valide et décide. L’impact populationnel dépend davantage de l’adoption et de l’intégration que de l’AUC maximale.

Conclusions (Alain Luciani, MD, PhD, Paris)

L’IA en radiologie d’urgence améliore la sécurité et l’efficience lorsqu’elle est déployée en triage et aide à la décision, sans se substituer au jugement médical.

Priorités: essais prospectifs à large échelle avec endpoints durs (temps vers traitement, mortalité, morbidité), standardisation des métriques, interopérabilité, réduction des biais, et cadre d’évaluation harmonisé au niveau européen.

Objectifs opérationnels: diminuer les délais de prise en charge, homogénéiser la qualité des comptes rendus; à plus long terme, améliorer les résultats cliniques et l’efficience du système.