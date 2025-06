Negli ultimi giorni, Apple ha scosso il mondo della tecnologia con la pubblicazione di un whitepaper che mette in discussione le fondamenta stesse dell’intelligenza artificiale moderna. Il documento, dal titolo provocatorio “The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity” ossia ''L’illusione del pensiero: comprendere i punti di forza e i limiti dei modelli di ragionamento attraverso la lente della complessità dei problemi'', rappresenta una vera e propria bomba sganciata sul settore AI.

Dietro la facciata: l’AI non ragiona, imita

Il cuore della ricerca è semplice ma devastante: i Large Language Model (LLM), quei sistemi che oggi chiamiamo “AI” e che aziende come OpenAI, Google e Meta sbandierano come capaci di “pensare”, in realtà non ragionano affatto. Sono semplicemente eccezionali nel riconoscere pattern e riprodurre risposte plausibili, ma quando si tratta di affrontare problemi complessi, la loro presunta intelligenza si sbriciola.

Il team di ricercatori Apple – tra cui spiccano nomi come Samy Bengio, direttore della ricerca AI dell’azienda – ha messo alla prova questi modelli in ambienti controllati, utilizzando puzzle logici come la Torre di Hanoi. Il risultato? I modelli di AI, inclusi i più avanzati Large Reasoning Models (LRM) come GPT-4, Claude 3.7 e Gemini, crollano completamente quando la complessità dei problemi supera una certa soglia. Non solo: spesso “overthinkano”, ovvero si perdono in ragionamenti inutili e inefficaci, abbandonando il problema prima di arrivare a una soluzione.

Il paradigma sbagliato: misurare l’AI solo sulla risposta finale

Uno degli aspetti più critici messi in luce dal whitepaper riguarda il modo in cui il settore valuta le AI. Fino ad oggi, le performance sono state misurate quasi esclusivamente sulla base della correttezza della risposta finale, utilizzando benchmark matematici e di programmazione consolidati. Ma, secondo Apple, questo approccio è miope: spesso i dati di test sono contaminati e non dicono nulla sulla qualità e sulla struttura del ragionamento che porta alla risposta.

Il documento sottolinea come il vero valore di un sistema intelligente non sia solo l’arrivo alla soluzione, ma la coerenza e la logica del percorso seguito per raggiungerla. Ed è proprio qui che gli LLM e i più recenti LRM mostrano la corda: quando la difficoltà sale, smettono di ragionare in modo lineare e logico, e iniziano a produrre risposte sempre più inconsistenti e casuali.

Tre regimi di fallimento: dove l’AI si arena

Attraverso una serie di esperimenti su puzzle di difficoltà crescente, i ricercatori Apple hanno identificato tre scenari distinti:

Nei compiti semplici, sorprendentemente, i modelli standard (LLM) superano i più sofisticati LRM.

Nei compiti di media complessità, gli LRM mostrano un vantaggio grazie alla loro capacità di “pensare” più a lungo.

Nei compiti complessi, entrambi i modelli collassano: la precisione crolla e le AI sembrano incapaci di trovare una soluzione coerente.

Un dato particolarmente inquietante è che, anche quando le AI hanno a disposizione risorse computazionali più che sufficienti (token budget), la loro capacità di ragionamento non solo non migliora, ma addirittura peggiora. Questo fenomeno, definito “scaling limit”, suggerisce che l’AI non sta semplicemente sbattendo contro un limite tecnico, ma contro un vero e proprio muro concettuale.

Apple: sincera autocritica o strategia difensiva?

Non è un mistero che Apple sia stata più lenta rispetto ai concorrenti nell’integrare l’intelligenza artificiale nei propri prodotti. Mentre Google e Samsung hanno già portato funzioni AI avanzate su smartphone e computer, Apple si è mossa con molta più cautela, introducendo solo recentemente “Apple Intelligence” – una suite di strumenti che, secondo molti, appare ancora acerba rispetto alla concorrenza. Questo whitepaper, quindi, può essere letto in due modi: da un lato come un’onesta e rigorosa autocritica scientifica, dall’altro come una mossa strategica per giustificare il ritardo accumulato.

Forse il messaggio più forte che emerge dallo studio Apple è che la tanto decantata AGI (Artificial General Intelligence), una macchina davvero capace di ragionare come un essere umano, è tutt’altro che dietro l’angolo. Nonostante gli investimenti miliardari di OpenAI, Google e Meta, la realtà è che le AI di oggi sono ancora lontane dal comprendere e risolvere problemi in modo logico e generalizzato. I ricercatori Apple concludono che “gli attuali approcci potrebbero aver raggiunto barriere fondamentali al ragionamento generalizzabile”, sollevando interrogativi cruciali sulla direzione futura della ricerca AI.