OpenAI, l'IA conquista l'oro all'Olimpiade Internazionale della Matematica 2025

OpenAI ha annunciato che il suo più recente modello sperimentale di intelligenza artificiale ha vinto la medaglia d’oro all’International Math Olympiad 2025. È la prima volta che un’IA riesce ad avvicinarsi alle prestazioni dei migliori studenti internazionali

di Andrea Bai pubblicata il 21 Luglio 2025, alle 10:41 nel canale Scienza e tecnologia
OpenAI

Un risultato storico ha segnato l’edizione 2025 dell’International Math Olympiad (IMO): OpenAI ha annunciato che il proprio modello linguistico sperimentale ha ottenuto una prestazione da medaglia d’oro in quella che è considerata la più prestigiosa e difficile competizione matematica mondiale per studenti delle scuole superiori. Alexander Wei, ricercatore OpenAI specializzato in ragionamento e modelli di linguaggio, ha rivelato in un post su X che l’IA della società è riuscita nella cosiddetta "grand challenge" dell’intelligenza artificiale: competere e primeggiare nei problemi dell’IMO con abilità paragonabili a quelle dei migliori matematici umani.

Secondo Wei, il modello (che non è ancora disponibile al pubblico) è stato sottoposto alle stesse condizioni degli studenti: due sessioni di 4 ore e mezza senza strumenti esterni né accesso a Internet, lavorando esclusivamente sulle tracce ufficiali e scrivendo le proprie dimostrazioni in linguaggio naturale. Il risultato è stato strabiliante: cinque problemi risolti su sei, per un totale di 35 punti su 42, un punteggio che nella classifica reale garantiva la medaglia d’oro, assegnata quest’anno solo a 67 partecipanti sui 630 complessivi.

1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO). pic.twitter.com/SG3k6EknaC
— Alexander Wei (@alexwei_) July 19, 2025

I problemi dell’IMO sono noti per il loro livello di difficoltà e creatività richiesta: si tratta di esercizi apparentemente semplici, ma che esigono ragionamenti molto sofisticati, deduzioni originali e capacità di formalizzazione. L’IA di OpenAI non solo ha risolto la maggioranza delle prove, ma ha anche prodotto argomentazioni dettagliate e verificate da un collegio di tre ex-medagliati della gara. Solo su uno dei sei problemi, il più complesso del test (il cosiddetto “P6”), il modello non è riuscito a proporre una soluzione valida.

Wei ha sottolineato il valore del traguardo raggiunto: “Abbiamo ottenuto un modello in grado di produrre argomentazioni intricate e inoppugnabili, a livello dei matematici umani”. Sam Altman, CEO di OpenAI, ha rimarcato come questa dimostrazione apra nuovi orizzonti: l’IA ha ora la capacità di affrontare compiti creativi e complessi, superando la tradizionale specializzazione nei soli dati strutturati o le operazioni ripetitive. Tuttavia, sia Wei che Altman hanno chiarito che questa versione non verrà resa pubblica nel breve termine: la futura versione di GPT-5, in arrivo nei prossimi mesi, rappresenterà certamente un passo avanti rispetto ai modelli disponibili attualmente, ma non includerà ancora la capacità di competere a livello IMO, che resta appannaggio dell’attuale prototipo di ricerca.

L’evento segna un’evoluzione rapidissima nel campo dell’IA applicata al ragionamento matematico. Fino a pochi anni fa, secondo molti esperti, una simile performance era considerata fantascienza: la previsione di Wei stesso, fatta solo nel 2021, era che entro il 2025 un’IA avrebbe superato il 30% nel benchmark MATH, ben al di sotto del risultato realmente raggiunto. Questo successo, secondo OpenAI, è stato possibile non grazie a metodologie specializzate su singole tipologie di problemi, bensì tramite nuove tecniche di reinforcement learning generalizzato e l’impiego di maggiore potenza computazionale in fase di inferenza.

La notizia sottolinea il ritmo incessante dell’innovazione nell’IA e lascia intravedere scenari futuribili non più tanto lontani: dai progressi in matematica pura e crittografia fino all’applicazione nelle discipline scientifiche e ingegneristiche avanzate. GPT-5 sarà presto lanciato, ma le capacità dimostrate all’IMO 2025 saranno probabilmente ancora esclusiva del modello sperimentale.

I migliori sconti su Amazon oggi

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

ECOVACS DEEBOT T50 PRO OMNI Gen2 Robot Aspirapolvere Lavapavimenti, (Migliorato da T30 PRO), 21000 Pa, Spazzola Laterale Estensibile e Lavapavimenti, Aggiunta Automatica Soluzione Detergente

499.00€ Compra ora

-21%

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

329.00 259.00€ Compra ora

FBC: Firebreak è un flop? I giocatori scappano dopo un'ora. Remedy pronta alla rivoluzione

Sedie gaming con LED, massaggio e poggiapiedi a partire da 75€: offerte assurde su Amazon per costruire la postazione da sogno

TorettoMilano21 Luglio 2025, 10:43 #1

impressionante, nemmeno io (e di solito elogio le IA) ipotizzavo già oggi l'IA potesse raggiungere questi risultati

hackaro7521 Luglio 2025, 11:13 #2

la fine del genere umano si avvicina!

Unrue21 Luglio 2025, 11:23 #3

Alla faccia di chi dice che l'AI non sa fare matematica.

TorettoMilano21 Luglio 2025, 11:27 #4

Originariamente inviato da: Unrue

Alla faccia di chi dice che l'AI non sa fare matematica.

"non sa disegnare un triangolo rettangolo"... uno dei tanti commenti dei giorni scorsi

biometallo21 Luglio 2025, 11:59 #5

Originariamente inviato da: TorettoMilano

"non sa disegnare un triangolo rettangolo"... uno dei tanti commenti dei giorni scorsi

Dimentichi che è partito con "e dire che qualche giorno fa c'ero riuscito a farglielo fare" e che ha documentato con screen shot ogni tentativo in cui poi si possono leggere anche le scuse di con chatGBT ha risposto:

"hai perfettamente ragione"
"hai ragione di nuovo e grazie per la pazienza"

E dal mio punto di vista tutto ciò ha ben più volere delle solite promesse dell'oste che ci fa sapere che il suo vino che sta ancora producendo è più migliore del grog di Muschio...

per chi si fosse perso la discussione lascio il link

https://www.hwupgrade.it/forum/showthread.php?t=3032556

pachainti21 Luglio 2025, 12:33 #6

Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad
Our results reveal that all tested models struggled significantly: only Gemini-2.5-Pro achieves a non-trivial score of 25%, while all other models achieve less than 5%. Through detailed analysis of reasoning traces, we identify the most common failure modes and find several unwanted artifacts arising from the optimization strategies employed during model training. Overall, our results suggest that current LLMs are inadequate for rigorous mathematical reasoning tasks, highlighting the need for substantial improvements in reasoning and proof generation capabilities.

L'articolo sopra di marzo 2025, sostiene un'altra tesi e l'evidenza parla da sola.

Confermato anche da questo di aprile 2025 Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Formula E Gen4 - La monoposto

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

OpenAI, l'IA conquista l'oro all'Olimpiade Internazionale della Matematica 2025

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

ECOVACS DEEBOT T50 PRO OMNI Gen2 Robot Aspirapolvere Lavapavimenti, (Migliorato da T30 PRO), 21000 Pa, Spazzola Laterale Estensibile e Lavapavimenti, Aggiunta Automatica Soluzione Detergente

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

6 Commenti