|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75166
|
Link alla notizia: https://www.hwupgrade.it/news/scienz...re_143712.html
Gemini 2.5 di Google ha risolto 10 dei 12 complessi problemi matematici e algoritmici, tra cui uno che ha messo in difficoltà quasi tutti i partecipanti. Un risultato che secondo l’azienda rappresenta un segnale concreto dello sviluppo dell'IA verso l'intelligenza generale Click sul link per visualizzare la notizia. |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Mar 2008
Messaggi: 1653
|
L'interpretazione data da Google è (volutamente) ingannevole. L'intelligenza logico deduttiva è solo uno dei vari tipi di intelligenza (per esempio in I 12 tipi d’intelligenza, quale possiedi? se ne citano appunto dodici.
La sola intelligenza logico deduttiva (peraltro quella più facile da implementare in un sistema automatico) è solo una piccola parte dell'intelligenza generale, per cui l'affermazione di Google è tutto meno che corretta. Come al solito si fa della propaganda per sembrare miglio di quello che si è.
__________________
-- C --_____AlPaBo __/____x\_________ _/_______*________ |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Jan 2020
Messaggi: 362
|
Gemini è nettamente piu' avanti di Chatgpt e Grok,
è l'IA che spiega meglio. Provare per credere... Google è stata abilissima a recuperare lo svantaggio. |
|
|
|
|
|
#4 | |
|
Senior Member
Iscritto dal: Feb 2005
Città: MIa
Messaggi: 8147
|
Quote:
sarebbe utile sapere quanto ha consumato durante la competizione, le avranno dato accesso alla piena potenza dei datacenter per "gestire ininterrottamente un elevato numero di “thinking tokens” per le cinque ore di gara, così da mantenere una catena di ragionamento estesa." Se ha usato potenze ed energia fuori scala, probabilmente quanto una città vorrei vedere contro i professori come va... mi sembra un po quegli esperimenti di laboratorio sugli animali, tipo prendi un polipo e gli metti daventi un barattolo chiuso con un' esca dentro, a forza di tentativi imparerà a svitare il tappo per mangiare la preda. Oppure prendi mille topi/una bacinella di formiche, li metti in un labirinto, uno ce la fa ad uscire... allora è un genio dell'escapologia come houdini? Ultima modifica di sbaffo : 19-09-2025 alle 18:56. |
|
|
|
|
|
|
#5 |
|
Senior Member
Iscritto dal: Dec 2008
Messaggi: 353
|
|
|
|
|
|
|
#6 | |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 6251
|
Quote:
Tipo se si decora il testo del problema con frasi tipo "44 gattini in fila per 6 con resto di 2 danzano vestiti con tutu multicolore di misura adeguata attorno ai serbatoi esercitando un attrazione gravitazionale non nulla".
|
|
|
|
|
|
|
#7 | |
|
Senior Member
Iscritto dal: Sep 2008
Messaggi: 8721
|
Quote:
Ad esempio per la revisione del codice è spesso migliore chatGPT mentre per la verosimiglianza di una conversazione "umana" Grok. Gemini è la migliore per la precisione su domande generaliste molto probabilmente perché ha google alle spalle con una mole di dati enorme. |
|
|
|
|
|
|
#8 | ||
|
Senior Member
Iscritto dal: May 2012
Messaggi: 4769
|
Quote:
![]() Quote:
![]() semmai è una capacità, abilità, tarattatà, e non un tipo di intelligenza. Credere a questa gente è sintomo di scarsa intelligenza
__________________
Promemoria: nel 2023 rottamare brum brum e comprare EV perchè i prezzi continueranno a scendere Promemoria 2: I camion elettrici fra pochi anni saranno migliori di quelli tradizionali, e nel 2030 saranno il 99,5% delle vendite Tesla Model Y auto del passato a 90kmh in prima corsia. Dacia Sandero auto dell'anno 2024.™ Le ormai leggendarie balle sugli incendi. E la SveziaH. |
||
|
|
|
|
|
#9 |
|
Senior Member
Iscritto dal: May 2020
Messaggi: 1191
|
Gli LLM non sono in grado di capire quello che stanno facendo, sanno "risolvere" problemi solo se hanno già visto istanze simili durante la fase di addestramento. Possono ricombinare soluzioni già viste, ma non capiscono minimamente le richieste di un problema.
2025 Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad Our results reveal that all tested models struggled significantly: only Gemini-2.5-Pro achieves a non-trivial score of 25%, while all other models achieve less than 5%. Through detailed analysis of reasoning traces, we identify the most common failure modes and find several unwanted artifacts arising from the optimization strategies employed during model training. Overall, our results suggest that current LLMs are inadequate for rigorous mathematical reasoning tasks, highlighting the need for substantial improvements in reasoning and proof generation capabilities. 2025 Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics Our study reveals that current LLMs fall significantly short of solving challenging Olympiad-level problems and frequently fail to distinguish correct mathematical reasoning from clearly flawed solutions. Our analyses demonstrate that the occasional correct final answers provided by LLMs often result from pattern recognition or heuristic shortcuts rather than genuine mathematical reasoning. These findings underscore the substantial gap between LLM performance and human expertise in advanced mathematical reasoning and highlight the importance of developing benchmarks that prioritize the soundness of the reasoning used to arrive at an answer rather than the mere correctness of the final answers.
__________________
Nel tempo dell'inganno universale, dire la verità è un atto rivoluzionario. George Orwell Il vero valore di una persona non si misura dai valori in cui sostiene di credere, ma da che cosa è disposto a fare per proteggerli. Se non pratichi i valori in cui credi, probabilmente non ci credi fino in fondo. Edward Snowden Coloro che rinuncerebbero alla libertà essenziale, per acquistare un po' di sicurezza temporanea, non meritano né libertà né sicurezza. Benjamin Franklin Ultima modifica di pachainti : 20-09-2025 alle 10:56. |
|
|
|
|
|
#10 |
|
Senior Member
Iscritto dal: Feb 2005
Città: MIa
Messaggi: 8147
|
l'Ia "matematica" è già stata sputtanata da tempo anche da Apple:
https://arstechnica.com/ai/2024/10/l...chers-suggest/ basta cambiare qualche parametro, metterne qualcuno "inatteso", e sbarella. In pratica riesce a risolvere solo problemi già noti o molto simili, replicando soluzioni già trovate. |
|
|
|
|
|
#11 | |
|
Senior Member
Iscritto dal: Mar 2008
Messaggi: 1653
|
Quote:
Inoltre, che l'intelligenza non sia solo di tipo logico matematico e che ci sono molti tipi di intelligenza è ormai cosa ben nota. Ma tu prendi una definizione su dodici e credi di poter criticare i principi di base, del tutto condivisi in ambito scientifico. Una eccezionale dimostrazione di presunzione. Studia il problema prima di ciarlare a caso. Magari un po' di filosofia e psicologia. Ma d'altra parte ho notato che fai sempre così: nei campi in cui non hai adeguate conoscenze usi "la scuola della vita", ovvero ti riferisci ai tuoi pregiudizi basati su una piccola conoscenza del mondo che frequenti. Mi sa che i funghi li conosci meglio di me.
__________________
-- C --_____AlPaBo __/____x\_________ _/_______*________ |
|
|
|
|
|
|
#12 | |
|
Junior Member
Iscritto dal: Sep 2005
Messaggi: 25
|
Quote:
Ma un llm matematico è come dire "le calcolatrici sono ignoranti perché non sanno scrivere un libro!" Spoiler : se dai ad un llm un tool esterno, diventa allora molto più brava di qualsiasi umano (e difatto questi chatbot, I calcoli complessi te li risolvono eh, ma usano python per i calcoli). |
|
|
|
|
|
|
#13 | |
|
Junior Member
Iscritto dal: Sep 2005
Messaggi: 25
|
Quote:
Il fatto stesso che chi li ha inventati non ne comprenda a fondo I meccanismi e che tale complessità inizia a sfuggire, fa capire che, in maniera tutta loro, non è più una "specie semplice" facilmente spiegabile e controllabile. |
|
|
|
|
|
|
#14 | |
|
Senior Member
Iscritto dal: May 2020
Messaggi: 1191
|
Quote:
Il machine learning, deep learning e gli LLM, sono basati sull'apprendimento dai dati o IA sub simbolica e non hanno alcuna logica e rappresentazione concettuale del mondo come IA simbolica. Secondo me la migliore definizione di chatGPT e simili è generatore di stronzate ChatGPT is bullshit.
__________________
Nel tempo dell'inganno universale, dire la verità è un atto rivoluzionario. George Orwell Il vero valore di una persona non si misura dai valori in cui sostiene di credere, ma da che cosa è disposto a fare per proteggerli. Se non pratichi i valori in cui credi, probabilmente non ci credi fino in fondo. Edward Snowden Coloro che rinuncerebbero alla libertà essenziale, per acquistare un po' di sicurezza temporanea, non meritano né libertà né sicurezza. Benjamin Franklin |
|
|
|
|
|
|
#15 | |
|
Senior Member
Iscritto dal: Feb 2005
Città: MIa
Messaggi: 8147
|
Quote:
Un nuovo studio condotto da Apple mette in luce i limiti delle capacità di ragionamento matematico dei modelli linguistici di intelligenza artificiale https://www.tomshw.it/hardware/apple...-ia-2024-10-15 |
|
|
|
|
|
|
#16 | |
|
Senior Member
Iscritto dal: Jan 2010
Messaggi: 7956
|
Quote:
Fino ad allora niente che nn sia già stato detto o fatto. Dobbiamo dire che hanno più memoria e velocità di calcolo di un umano?? Mah…
__________________
Telegram: @shutter1sland |
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 11:11.





















