GPT-4 quasi come un oculista: in un test l'IA ottiene risultati simili agli specialisti

L'IA di OpenAI ha mostrato, in un test, una capacità simile a quella di specialisti oftalmologi, superando anche specializzandi e giovani medici

di Andrea Bai pubblicata il 18 Aprile 2024, alle 18:08 nel canale Scienza e tecnologia
OpenAI

La School of Clinical Medicine dell'Università di Cambridge ha recentemente condotto uno studio sull'uso dei modelli LLM nel campo della medicina, dal quale è emerso come GPT-4 di OpenAI sia stato capace di ottenere risultati quasi comparabili a quelli di specialisti nel campo della valutazione oftalmologica.

Lo studio, condotto a metà dello scorso anno, è stato pubblicato su PLOS Digital Health e mette a confronto tra loro diversi LLM: oltre al già citato GPT-4 c'è anche il diretto predecessore GPT-3.5, assieme a PaLM 2 di Google e LLaMA di Meta. Alle diverse IA sono state sottoposte 87 domande a scelta multipla, e gli stessi quesiti sono stati presentati a cinque oftalmologi esperti, a tre tirocinanti e a due medici junior non specializzati.

Le domande vertevano su vari aspetti dell'oculistica, come lesioni oculari e sensibilità alla luce. I contenuti del test non erano pubblicamente disponibili, e per questo motivo i ricercatori ritengono che gli LLM non fossero stati specificatamente addestrati in precedenza su tali argomenti.

Come dicevamo, GPT-4 è l'LLM che ha ottenuto i migliori risultati tra le IA: con 60 risposte corrette su 87 ha inoltre superato anche i tirocinanti (media di 59,7/87) e i medici junior (37/87). Solo gli oftalmologi hanno superato GPT-4 con un punteggio medio di 66,4 risposte esatte.

PaLM 2 di Google ha segnato un punteggio di 49, GPT-3 ha invece risposto correttamente a 42 domande. Risultato da punizione dietro la lavagna per LLaMa di Meta, con 28 risposte esatte su 87.

I risultati dello studio, più che suggerire la possibilità di utilizzare l'IA come ausilio nella pratica medica (cosa che, presto o tardi, avverrà comunque), evidenziano in realtà come l'evoluzione delle capacità degli LLM proceda a ritmi veramente sostenuti e gli stessi autori evidenziano come l'impostazione del test incoraggi ad approfondire ulteriormente le loro capacità.

Ovviamente la cautela è d'obbligo, specie in un contesto come questo: se da un lato gli LLM possono avere la capacità di cogliere elementi che potrebbero passare inosservati, è anche vero che essi mostrano spesso la tendenza ad inventare informazioni quando non le conoscono o non sono facilmente inferibili, oltre a mancare della capacità "sfumatura" propria dell'essere umano. Quest'ultima è una capacità fondamentale nella pratica medica, che permette di discernere elementi che considerati in maniera asettica potrebbero portare a decisioni del tutto errate.

I migliori sconti su Amazon oggi

-20%

Apple iPhone 16 Pro Max 256 GB: Telefono 5G con Controllo fotocamera, Dolby Vision 4K a 120 fps e un’autonomia senza precedenti. Compatibile con AirPods; Titanio bianco

1489.00 1195.00€ Compra ora

-27%

Ring Videocitofono Plus a batteria (Ultimo modello) | Battery Video Doorbell Plus | Videocitofono wireless, videocamera con video in HD a 1536p, batteria ricaricabile | Facile da installare (5 min)

149.99 109.99€ Compra ora

-40%

Ring videocitofono a batteria (Battery Video Doorbell) (2024) | Visuale a figura intera | Installazione semplice fai-da-te (5 min.) | con batteria integrata I Ring Home: 30 gg. prova gratuita

99.99 59.99€ Compra ora

Prezzi super per gli Apple Watch SE di seconda generazione: eccoli a partire da 239€

Cina: aumenta del 40% la produzione di chip, le sanzioni statunitensi stanno diventando controproducenti

silvanotrevi18 Aprile 2024, 19:46 #1

perfetto. Licenziamo anche gli oculisti, tanto non servono. C'è l'IA

AlPaBo18 Aprile 2024, 20:25 #2

All'inizio degli anni '70 (ovvero cinquant'anni fa) fu sviluppato il sistema esperto MYCIN, in grado di diagnosticare alcuni tipi di infezioni batteriche che richiedevano diagnosi rapide.

Il tasso di successo era leggermente superiore a quello di clinici esperti. Utilizzi dopo la fase sperimentale: nessuno, per vari motivi in particolare etici e legali.

Significato di quanto scritto nell'articolo: può funzionare solo su un mercato simile a quello americano (ma non credo neppure lì ), assai peggiorato in questi decenni, in cui il costo economico prevale sulla salute delle persone. Mi aspetterei che aumentino le diagnosi fai da te a casa, molto meno costose per il privato cittadino, con i danni per la salute che ne seguirebbero a causa della mancata cultura degli effetti collaterali. Dove il sistema sanitario funziona (da noi è ancora vero, anche se la privatizzazione voluta dalla destra lo sta distruggendo) nessuna struttura sanitaria seria applicherebbe questo sistema.

zappy18 Aprile 2024, 21:08 #3

Qualcuno ha già detto che a furia di usare l'IA si diventa ciechi?

UtenteHD19 Aprile 2024, 08:54 #4

Originariamente inviato da: silvanotrevi

perfetto. Licenziamo anche gli oculisti, tanto non servono. C'è l'IA

Beh tra 10 o 20 anni sara' infinitamente migliroe di quella attuale in tutto, probabilmente fara' tutto e mi chiedo Noi che faremo per avere uno stipendio..
Detto questo, mi sbagliero', ma vedo gente povera o ceto medio per curarsi chiedere all'AI (non perche' meno brava, ma perche' economica), mentre i "ricconi" permettersi un dottore in carne ed ossa (che usa l'AI come assistente che probabilmente sara' piu' brava di Lui)

danylo19 Aprile 2024, 12:09 #5

Per vederla da un'altro punto di vista, i professionisti umani hanno risposto correttamente SOLO a 66 domande su 87, poco piu' di ChatGPT.
Quindi sono i professionisti ad essere scarsi, non ChatGpt ad essere bravo.

.

filippo198019 Aprile 2024, 15:27 #6

Sarò cattivo ma spero che il test sia stato ripetuto in diverse sessioni delle AI perché il dubbio che abbiano sparato a caso, visto che le informazioni richieste NON erano disponibili al pubblico, non è poi così assurdo IMHO

zappy19 Aprile 2024, 18:31 #7

Originariamente inviato da: danylo

in effetti "professionisti" è spesso una dicitura meramente fiscale, ma di professionalità ce n'è molto ma molto poca...

Unax19 Aprile 2024, 18:43 #8

però bisogna fare attenzione a non chiedere alla IA quante dita sono queste

https://cosemoltostrane.com/wp-cont...ita-740x416.jpg

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

MSI Prestige 13 AI e i portatili business al Computex

NVIDIA GeForce RTX 5060: le schede video di ogni partner dal Computex

MSI Maestro 9000 al Computex 2025: un case che stupisce

Phanteks al Computex 2025

Corsair al Computex 2025

Fujifilm GFX100RF: la 'compatta' medio formato

Meglio un MacBook o un PC portatile con Windows, oggi? Scenari, dubbi e qualche certezza Passano gli anni, anzi i decenni, ma la domanda puntualmente riemerge fra le mail degli utenti meno esperti, alla ricerca di consigli e mossi dai più svariati motivi....

realme GT7: un "flaghsip killer" concreto! La recensione Abbiamo provato l'ultimo smartphone di realme, il nuovo GT7. Si tratta di un device che si colloca in una fascia di mercato delicata, ovvero quella che possiamo...

Recensione DOOM: The Dark Ages, proiettili e heavy metal nel Medioevo Abbiamo indossato la corazza dello Slayer per tornare nell'universo di DOOM ed esplorare un'ambientazione inedita per l'FPS di id Software. Questa volta veniamo...

DJI Osmo Mobile 7P: ti segue anche con la fotocamera nativa dello smartphone! Grande novità per il nuovo gimbal DJI Osmo Mobile 7P: grazie al modulo multifunzione incluso, dotato di telecamera, ora l'inseguimento del soggetto è possibile anche...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

La rivoluzione dei dati in tempo reale è in arrivo. Un assaggio a Confluent Current 2025 Siamo andati a Londra per partecipare a Current 2025, la conferenza annuale di Confluent. Il tema al centro dell'evento era l'elaborazione dei dati in tempo reale...

Tutto sulla nuova Tesla Model Y: autonomia in autostrada, prova bagagliaio e dettagli Abbiamo guidato per diversi giorni la nuova Tesla Model Y, in versione di lancio dual motor e con batteria long range. Ecco tutto quello che c'è da sapere sull'erede...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

GPT-4 quasi come un oculista: in un test l'IA ottiene risultati simili agli specialisti

Apple iPhone 16 Pro Max 256 GB: Telefono 5G con Controllo fotocamera, Dolby Vision 4K a 120 fps e un’autonomia senza precedenti. Compatibile con AirPods; Titanio bianco

Ring Videocitofono Plus a batteria (Ultimo modello) | Battery Video Doorbell Plus | Videocitofono wireless, videocamera con video in HD a 1536p, batteria ricaricabile | Facile da installare (5 min)

Ring videocitofono a batteria (Battery Video Doorbell) (2024) | Visuale a figura intera | Installazione semplice fai-da-te (5 min.) | con batteria integrata I Ring Home: 30 gg. prova gratuita

8 Commenti