Microsoft ha presentato un importante progresso nel campo dell'intelligenza artificiale applicata alla sanità. Il nuovo sistema MAI-DxO (Medical AI Diagnostic Orchestrator) si è dimostrato capace di diagnosticare casi clinici complessi con una precisione del 85,5%, superando di oltre quattro volte la media ottenuta da un gruppo di medici esperti.

Lo studio, ancora in fase preliminare e pubblicato in forma di pre-print, ha utilizzato 304 casi clinici reali tratti dal New England Journal of Medicine (NEJM), selezionati per la loro complessità diagnostica. Sia l'AI che 21 medici provenienti da Stati Uniti e Regno Unito, con esperienza tra 5 e 20 anni, hanno affrontato ogni caso seguendo un approccio sequenziale: raccogliere informazioni, ordinare test diagnostici e formulare una diagnosi finale.

Il risultato più impressionante è stato ottenuto accoppiando MAI-DxO con il modello linguistico di OpenAI o3: l'AI ha correttamente diagnosticato l'85,5% dei casi, mentre i medici umani si sono fermati a una media del 20%.

Oltre alla maggiore accuratezza, MAI-DxO ha anche ottenuto diagnosi più efficienti dal punto di vista economico, evitando l'accumulo di test inutili. Questo è un tema particolarmente rilevante per ogni economia: negli Stati Uniti si stima che fino al 25% della spesa sanitaria (che rappresenta ormai il 20% del PIL) sia sprecata in esami non necessari.

Il sistema non è un semplice chatbot: MAI-DxO funziona come un "orchestratore", ovvero un meta-agente che coordina più modelli linguistici generativi (tra cui GPT, Claude, Gemini, LLaMA, Grok e altri) e li guida lungo un percorso diagnostico. Può porre domande, ordinare test, analizzare costi virtuali e autoverificare le proprie ipotesi prima di procedere. Questo approccio consente di simulare un vero team di specialisti, bilanciando ampiezza e profondità della conoscenza.

Secondo Microsoft, un tale sistema non mira a sostituire i medici, ma piuttosto a integrarli. Il ruolo dei professionisti della sanità resta fondamentale, soprattutto per l'empatia verso i pazienti e la comunicazione efficace, aspetti che l'AI attuale non è in grado di replicare.

Mustafa Suleyman, CEO della divisione AI di Microsoft e cofondatore di DeepMind, ha dichiarato che "stiamo compiendo un grande passo verso la superintelligenza medica". Il progetto si inserisce in un più ampio impegno del colosso di Redmond nel settore sanitario, già visibile in strumenti come Dragon Copilot per la dettatura clinica e RAD-DINO per l'automazione nei flussi radiologici.

MAI-DxO in action, tackling one of those complex cases: pic.twitter.com/ALpaBOomzO — Mustafa Suleyman (@mustafasuleyman) June 30, 2025

Tuttavia, lo stesso team riconosce i limiti attuali del sistema: MAI-DxO ha brillato su casi complessi e rari, ma dovrà essere ulteriormente validato su sintomi comuni e in contesti clinici reali. Inoltre, i medici coinvolti nello studio non avevano accesso a colleghi, testi o strumenti digitali, condizioni che ne hanno forse penalizzato le prestazioni rispetto alla pratica quotidiana.

Microsoft ha sottolineato l'importanza di stabilire framework normativi e collaborazioni con enti sanitari per garantire sicurezza, trasparenza ed efficacia prima di ogni implementazione reale. Attualmente, MAI-DxO e il benchmark SD Bench sono solo dimostrazioni di ricerca e non sono disponibili al pubblico.

Si aprono prospettive interessanti: un'AI che supporti sia i medici nei casi più difficili, sia i pazienti nella gestione autonoma dei disturbi più comuni, oltre a contribuire a una sanità più efficiente, accessibile e sostenibile.