|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#21 |
|
Senior Member
Iscritto dal: May 2020
Messaggi: 1243
|
Non tutta l'IA, quella sub simbolica come il machine learning e di conseguenza gli LLM ovvero apprendimento induttivo da esempi. L'IA simbolica, come i sistemi esperti, i dimostratori di teoremi, etc. ovvero la parte apprendimento deduttivo basato su logica e ragionamento, si, ma non è IA, il nome è forviante.
Gli LLM, come tutte le reti neurali e il machine learning, sono dei modelli probabilistici che generano i contenuti più probabili in base a quanto visto durante la fase di addestramento, nessuna consapevolezza, nessun senso di realtà, nessun ragionamento. Gli LLM "riescono" a risolvere problemi matematici-algoritmici, copiando le soluzioni di problemi simili risolti da umani, niente di nuovo, per questo sono un vicolo cieco. Per esempio LeCun l'ha capito e ha cambiato idea sugli LLM. OpenAI Researcher Forced to Delete "Embarrassing" Tweet Claiming Huge Breakthrough Alcuni esempi di articoli scientifici: Marzo 2025 Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad Our results reveal that all tested models struggled significantly: only Gemini-2.5-Pro achieves a non-trivial score of 25%, while all other models achieve less than 5%. Through detailed analysis of reasoning traces, we identify the most common failure modes and find several unwanted artifacts arising from the optimization strategies employed during model training. Overall, our results suggest that current LLMs are inadequate for rigorous mathematical reasoning tasks, highlighting the need for substantial improvements in reasoning and proof generation capabilities. Giugno 2025 LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? We introduce LiveCodeBench Pro, a benchmark composed of problems from Codeforces, ICPC, and IOI that are continuously updated to reduce the likelihood of data contamination. A team of Olympiad medalists annotates every problem for algorithmic categories and conducts a line-by-line analysis of failed model-generated submissions. Using this new data and benchmark, we find that frontier models still have significant limitations: without external tools, the best model achieves only 53% pass@1 on medium-difficulty problems and 0% on hard problems, domains where expert humans still excel. We also find that LLMs succeed at implementation-heavy problems but struggle with nuanced algorithmic reasoning and complex case analysis, often generating confidently incorrect justifications. High performance appears largely driven by implementation precision and tool augmentation, not superior reasoning. Settembre 2025 Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics Our study reveals that current LLMs fall significantly short of solving challenging Olympiad-level problems and frequently fail to distinguish correct mathematical reasoning from clearly flawed solutions. Our analyses demonstrate that the occasional correct final answers provided by LLMs often result from pattern recognition or heuristic shortcuts rather than genuine mathematical reasoning. These findings underscore the substantial gap between LLM performance and human expertise in advanced mathematical reasoning and highlight the importance of developing benchmarks that prioritize the soundness of the reasoning used to arrive at an answer rather than the mere correctness of the final answers.
__________________
Nel tempo dell'inganno universale, dire la verità è un atto rivoluzionario. George Orwell Il vero valore di una persona non si misura dai valori in cui sostiene di credere, ma da che cosa è disposto a fare per proteggerli. Se non pratichi i valori in cui credi, probabilmente non ci credi fino in fondo. Edward Snowden Coloro che rinuncerebbero alla libertà essenziale, per acquistare un po' di sicurezza temporanea, non meritano né libertà né sicurezza. Benjamin Franklin Ultima modifica di pachainti : Ieri alle 13:02. |
|
|
|
|
|
#22 |
|
Senior Member
Iscritto dal: Feb 2005
Città: MIa
Messaggi: 8338
|
inutile rispondergli, il bimbominkia è lui che non sa nemmeno di cosa parla.
Anche Apple aveva messo alla prova una IA e aveva visto che appena si usciva dai soliti pattern sbarellava, ovviamente i pattern erano quelli tipici dell addestramento o dei comuni test ormai noti (e inseriti negli addestramenti). https://arstechnica.com/ai/2024/10/l...chers-suggest/ Ultima modifica di sbaffo : Ieri alle 15:58. |
|
|
|
|
|
#23 | |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 6345
|
Quote:
Quelli che non lo capiscono sono quelli che applicano al calabrone il modello di funzionamento SEMPLIFICATO di aerei ed elicotteri invece di ragionare in termini di fluidodinamica applicata al modello del calabrone. A suo tempo avevo fatto la mia tesi magistrale su un argomento di visione computazionale (Computer Vision, uno dei problemi che in forma generale sono AI completi) e mi sono imbattuto in una situazione analoga. C'erano vari algoritmi di feature matching che sembravano "piovuto dal cielo", così mi son messo a cercare da dove spuntassero fuori (eccetto alcune che indicavano la fonte d'ispirazione biologica), le pubblicazioni originali ed altre successive non erano di aiuto, così mi sono messo a cercare anche in pubblicazioni di biologia relative ad occhio e sistema nervoso centrale. Per farla breve, un sacco di quegli algoritmi si basavano su VECCHI modelli biologici senza dirlo esplicitamente ed algoritmi successivi in larga parte hanno solo cercato di migliorare quelli esistenti invece di "ritornare alle origini" e prendere in considerazione cosa avevano scoperto i biologi ed i neurobiologi nel frattempo. Il motivo principale era che i "veccchi" modelli si applicano facilmente all'hardware esistente mentre quelli nuovi danno il meglio di se con event camera oppure richiedono risorse computazionali molto più potenti (per "simulare in software" una event camera e parte del lobo frontale). Questo é anche uno dei motivi per cui trovo ridicola la fissa di Elon Musk di usare solo telecamere convenzionali sulle Tesla. Con i LLM si sta verificando una situazione analoga: é tutta una corsa allo scaling, a crescere la potenza computazionale usando algoritmi "vecchi", i soldi spesi per vera ricerca di base sono briciole ed i risultati vengono ignorati se rischiano di compromettere i giochi di soldi che sostengono la bolla speculativa dei LLM. |
|
|
|
|
|
|
#24 | |
|
Senior Member
Iscritto dal: Jan 2020
Messaggi: 389
|
Quote:
Dammi una metrica per capire chi ha piu' consapevolezza, chi ha piu' senso di realta', chi ragiona e chi no. Tu dici di avere piu' consapevolezza di Gemini? E come si misura questa cosa? Hai piu' senso di realta'? E come si fa a dirlo? Tu ragioni e l'IA no? E come conti il numero di ragionamenti? Ci vogliono *** METRICHE ***, se non le hai sono parole a caso, pura spazzatura. Ultima modifica di Fantapollo : Oggi alle 00:34. |
|
|
|
|
|
|
#25 |
|
Senior Member
Iscritto dal: Jan 2020
Messaggi: 389
|
E perche', il tuo cervello no?
Solo perche' non ti accorgi di star calcolando delle probabilita', non significa che il cervello non lo stia facendo. Ma quando ascolti un suono e identifichi una parola, cosa credi che faccia il tuo cervello? Credi che non lavori con le probabilita'? |
|
|
|
|
|
#26 | |
|
Senior Member
Iscritto dal: Aug 2008
Città: Firenze
Messaggi: 12859
|
Quote:
Il cervello umano lavora per istinto e per astrazione in stretta correlazione con la memoria, la quale fisiologicamente non è assolutamente assimilabile a quella di un computer anche complesso.
__________________
Mac Mini M2 Pro; Apple Studio Display; Logitech MX Keys for Mac; MBA 13" M3; iPod Touch 1st Gen. 8 Gb; iPhone 14 Pro; iPad Air 2020 WiFi 64 Gb, Apple Watch 8... |
|
|
|
|
|
|
#27 |
|
Senior Member
Iscritto dal: Jan 2020
Messaggi: 389
|
Ed ecco qua, ancora parole completamente A CASO.
Come *** SEMPRE *** fanno i detrattori dell'IA. Cosa sarebbe questo "istinto" ? Come si riconosce una risposta "per istinto" da una "per ragionamento"? Io dico che quello che tu chiami "istinto" altro non e' che non un calcolo delle probabilita'... Credete che il cervello funzioni per magia, In realta' funziona per impulsi elettrici *** ESATTAMENTE *** come un computer. |
|
|
|
|
|
#28 | ||
|
Senior Member
Iscritto dal: May 2020
Messaggi: 1243
|
Quote:
Se studi come funziona il machine learning, non c'è alcuna consapevolezza in nessun modello che gli appartiene proprio perché per definizione si basa sull'apprendimento induttivo da esempi che è agli antipodi rispetto all'apprendimento deduttivo basato su logica e ragionamento. Gli LLM sono formidabili nei test con risposta chiusa poiché rispetto a un essere umano hanno un database immenso di risposte e soprattutto possono cercare su Internet. Viceversa, nelle risposte dove occorre consapevolezza, ragionamento, senso di realtà sono dei generatori di supercazzole. "Non tutto ciò che può essere contato conta e non tutto ciò che conta può essere contato." Albert Einstein L'unica spazzatura che vedo è quella di chi scrive senza sapere cosa sta dicendo. Quote:
Nella teoria della calcolabilità le funzioni calcolabili sono quelle calcolabili dalla macchina di Turing o dal calcolo lambda di Church. Tuttavia, esistono problemi non calcolabili come quello dell'arresto, halting problem. Non sappiamo nemmeno definire cosa sia l'intelligenza e vorremmo addirittura calcolarla? Inoltre, l'esperimento mentale della stanza cinese di Searle mostra come non sia possibile realizzare alcuna intelligenza artificiale forte o AGI, solo "intelligenza" artificiale debole in contesti limitati.
__________________
Nel tempo dell'inganno universale, dire la verità è un atto rivoluzionario. George Orwell Il vero valore di una persona non si misura dai valori in cui sostiene di credere, ma da che cosa è disposto a fare per proteggerli. Se non pratichi i valori in cui credi, probabilmente non ci credi fino in fondo. Edward Snowden Coloro che rinuncerebbero alla libertà essenziale, per acquistare un po' di sicurezza temporanea, non meritano né libertà né sicurezza. Benjamin Franklin Ultima modifica di pachainti : Oggi alle 06:59. |
||
|
|
|
|
|
#29 | |
|
Senior Member
Iscritto dal: May 2012
Messaggi: 5114
|
Quote:
![]() Il cervello umano genera nuovi contenuti con il calcolo delle probabilità ? ]...] Il cervello non genera “testo probabile” Quando tu crei un’idea nuova: non stai scegliendo la parola più probabile stai combinando: memoria concetti astratti emozioni scopi immaginazione simulazione del futuro Gli LLM fanno: “Qual è la prossima parola statisticamente plausibile?” Gli esseri umani fanno: “Che cosa voglio dire? Che effetto voglio ottenere? Che idea sto costruendo?” Una metafora utile LLM: un autocompletatore statistico estremamente sofisticato Cervello umano: un organismo che costruisce modelli del mondo per sopravvivere, desiderare, pianificare, creare significato La risposta onesta scientificamente Il cervello probabilmente usa meccanismi simili al ragionamento probabilistico, ma non esegue calcoli espliciti di probabilità come un LLM. Se vuoi, possiamo spingerci ancora più in profondità su una domanda affascinante: 👉 Gli LLM capiscono davvero qualcosa o stanno solo imitando l’intelligenza?
__________________
Promemoria: nel 2023 rottamare brum brum e comprare EV perchè i prezzi continueranno a scendere Promemoria 2: I camion elettrici fra pochi anni saranno migliori di quelli tradizionali, e nel 2030 saranno il 99,5% delle vendite Tesla Model Y auto del passato a 90kmh in prima corsia. Dacia Sandero auto dell'anno 2024.™ Le ormai leggendarie balle sugli incendi. E la SveziaH. |
|
|
|
|
|
|
#30 | |
|
Senior Member
Iscritto dal: Aug 2008
Città: Firenze
Messaggi: 12859
|
Quote:
Un esempio, banale, dell'istinto? La paura! Un altro? La coscienza di se! Altro esempio? La curiosità! Il cervello funziona si grazie ad impulsi elettrici ma questi vengono prodotti e " gestiti " dalla rete di neuroni in maniera completamente differente di un mero circuito integrato che può assumere solamente due valori logici di stato! Anche qui di calcolo statistico/probabilistico non c'è proprio una beata fava, visto che il motore di tutto sono delle reazioni biochimiche a livello cellulare. Inoltre la statistica ed il calcolo probabilistico sono prodotti dell'intelletto umano affinati in migliaia di anni di esperienza di osservazione e di istinto! Hai visto troppe puntate di Star Trek
__________________
Mac Mini M2 Pro; Apple Studio Display; Logitech MX Keys for Mac; MBA 13" M3; iPod Touch 1st Gen. 8 Gb; iPhone 14 Pro; iPad Air 2020 WiFi 64 Gb, Apple Watch 8... |
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 10:13.





















