|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/scienz...25_141347.html
OpenAI ha annunciato che il suo più recente modello sperimentale di intelligenza artificiale ha vinto la medaglia d’oro all’International Math Olympiad 2025. È la prima volta che un’IA riesce ad avvicinarsi alle prestazioni dei migliori studenti internazionali Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Dec 2008
Messaggi: 16927
|
impressionante, nemmeno io (e di solito elogio le IA) ipotizzavo già oggi l'IA potesse raggiungere questi risultati
|
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Jul 2006
Messaggi: 827
|
la fine del genere umano si avvicina!
|
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 5786
|
Alla faccia di chi dice che l'AI non sa fare matematica.
![]() |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Dec 2008
Messaggi: 16927
|
|
![]() |
![]() |
![]() |
#6 | |
Senior Member
Iscritto dal: May 2006
Città: :
Messaggi: 7264
|
Quote:
"hai perfettamente ragione" "hai ragione di nuovo e grazie per la pazienza" E dal mio punto di vista tutto ciò ha ben più volere delle solite promesse dell'oste che ci fa sapere che il suo vino che sta ancora producendo è più migliore del grog di Muschio... per chi si fosse perso la discussione lascio il link https://www.hwupgrade.it/forum/showthread.php?t=3032556 |
|
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: May 2020
Messaggi: 835
|
Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad
Our results reveal that all tested models struggled significantly: only Gemini-2.5-Pro achieves a non-trivial score of 25%, while all other models achieve less than 5%. Through detailed analysis of reasoning traces, we identify the most common failure modes and find several unwanted artifacts arising from the optimization strategies employed during model training. Overall, our results suggest that current LLMs are inadequate for rigorous mathematical reasoning tasks, highlighting the need for substantial improvements in reasoning and proof generation capabilities. L'articolo sopra di marzo 2025, sostiene un'altra tesi e l'evidenza parla da sola. Confermato anche da questo di aprile 2025 Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics
__________________
Nel tempo dell'inganno universale, dire la verità è un atto rivoluzionario. George Orwell Il vero valore di una persona non si misura dai valori in cui sostiene di credere, ma da che cosa è disposto a fare per proteggerli. Se non pratichi i valori in cui credi, probabilmente non ci credi fino in fondo. Edward Snowden Coloro che rinuncerebbero alla libertà essenziale, per acquistare un po' di sicurezza temporanea, non meritano né libertà né sicurezza. Benjamin Franklin Ultima modifica di pachainti : Ieri alle 11:36. |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 14:34.