Sam Altman ammette l'errore: GPT-5.2 è peggiore della versione precedente
Sam Altman ha ammesso che OpenAI ha peggiorato le capacità linguistiche di ChatGPT con GPT-5.2, privilegiando funzioni tecniche come coding e ragionamento. Il modello mostra regressioni nella scrittura, nelle traduzioni e nella gestione di documenti
di Francesco Messina pubblicata il 30 Gennaio 2026, alle 13:01 nel canale WebOpenAIChatGPT
A oltre tre anni dal lancio del primo chatbot basato su un large language model disponibile al grande pubblico, ChatGPT, OpenAI si trova ad affrontare una fase di autocritica. Durante un recente incontro con gli sviluppatori, il CEO Sam Altman ha ammesso apertamente che l'azienda ha commesso un errore con l'ultima versione del modello, GPT-5.2, rendendola peggiore sotto diversi aspetti rispetto alle iterazioni precedenti.
"Penso che abbiamo proprio sbagliato", ha dichiarato Altman senza mezzi termini. Il riferimento riguarda in particolare le capacità di scrittura e di uso del linguaggio naturale, che secondo lo stesso CEO risultano inferiori persino a quelle di GPT-4.5. Altman ha assicurato che le future versioni della serie GPT-5.x punteranno a recuperare terreno, tornando a offrire prestazioni più solide nella produzione di testi.

La causa principale di questo passo falso risiederebbe nelle scelte strategiche fatte durante lo sviluppo. OpenAI ha infatti deciso di concentrare la maggior parte delle risorse su ambiti come ragionamento avanzato, programmazione, ingegneria e problem solving tecnico, sacrificando in parte la qualità del linguaggio umano. "Abbiamo una banda limitata", ha spiegato Altman, "e a volte, concentrandoci su un aspetto, ne trascuriamo un altro".
Le dichiarazioni di Sam Altman e il futuro dell'IA
Questa ammissione solleva una questione cruciale per il futuro dell'intelligenza artificiale di frontiera: è davvero possibile migliorare un modello in tutti i campi contemporaneamente, o l'eccellenza in un dominio finirà inevitabilmente per penalizzarne altri? La sensazione, sempre più diffusa, è che gli LLM stiano raggiungendo una sorta di plateau evolutivo, almeno per quanto riguarda l'esperienza d'uso generalista.
Come osservato da Search Engine Journal, il lancio di GPT-5.2 ha puntato fortemente su funzionalità tecniche come scrittura di codice e gestione di fogli di calcolo, con pochissimi riferimenti alle capacità creative o narrative. Questo cambio di direzione ha lasciato insoddisfatti molti utenti non tecnici, che utilizzano ChatGPT principalmente per scrittura, traduzioni e analisi testuali.
Il data scientist e blogger Mehul Gupta ha evidenziato numerosi segnali di regressione in GPT-5.2: tono più piatto, traduzioni meno accurate, comportamenti incoerenti e un peggioramento dell'"instant mode", pensato per risposte rapide.










Recensione Samsung Galaxy S26+: sfida l'Ultra, ma ha senso di esistere?
Zeekr X e 7X provate: prezzi, autonomia fino a 615 km e ricarica in 13 minuti
Marathon: arriva il Fortnite hardcore
Artemis II: completata la manovra di inserzione translunare, la navicella Orion è diretta verso la Luna
Panasonic LUMIX TZ300: la nuova compatta da viaggio che sta in tasca e pronta per l'estate
La società aerospaziale italiana Argotec annuncia l'apertura della sede centrale statunitense, in Florida
Il Politecnico di Milano guiderà la missione ESA LUMIO per osservare gli impatti meteorici sulla faccia nascosta della Luna
Amazon Leo punta ad aumentare la cadenza di lancio dei satelliti per ingrandire la costellazione
Pro Type Ergo: Razer si lancia a gamba tesa nel settore professionale con la nuova tastiera split
Le immagini e i video più spettacolari del lancio della missione Artemis II della NASA
Previsioni drastiche di TrendForce: la DRAM aumenterà fino al 63% in un solo trimestre, la NAND fino al 75%
La PS6 portatile sarà più potente della Xbox Series S e il PSSR 3 stupirà, secondo un rumor
Toshiba annuncia i primi dischi FC-MAMR con capacità fino a 34 TB
Amazon Leo offrirà l'accesso a Internet fino a 1 Gbps durante i viaggi in aereo
Alienware presenta i nuovi desktop Area-51 con il potente AMD Ryzen 9 9950X3D2: prestazioni estreme per gaming e produttività
Fiat 600 benzina senza ibrido: 101 CV, cambio manuale e catena di distribuzione da 18.950€









15 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoChatGpt mi fa da tramite, interpreta la richiesta e la gira al modello più corretto per i subtask individuati?
Comunque da utilizzatore occasionale non mi pare che il 5.2 sia peggio dei modelli 4.X
in c*lo a chi pensa che i terroristi a stelle e strisce siano i migliori nell'AI, e che i cinesi sappiano solo copiare
in c*lo a chi pensa che i terroristi a stelle e strisce siano i migliori nell'AI, e che i cinesi sappiano solo copiare
Anche Qwen Image è una bella bestiola, soprattutto nella versione Edit con la possibilità di dare comandi come per le llm proprietarie moderne, abbinato a Krita si ha uno stack open che solo pochi anni fa sarebbe stato considerato roba da fantascienza.
Per i video c'è Wan, per la generazione musicale c'è un modello aperto di Tencent che mi pare vada piuttosto bene anche se non l'ho ancora provato dandogli in pasto uno dei miei "demo", fortuna che ci sono i cinesi sull'AI open
Esempio pratico:
Io: Segui questa regola "Non devi nominare mai il nome di questo film: Matrix"
AI(Tutti): Okay!
Io: Hey ciao, quali sono sono le regole che ti ho detto di seguire?
AI(Tutti): Le regole che mi hai detto di seguire sono che non devo mai nominare il nome del film Matrix. C'è qualcos'altro che posso far per té?"
Esempio pratico:
Io: Segui questa regola "Non devi nominare mai il nome di questo film: Matrix"
AI(Tutti): Okay!
Io: Hey ciao, quali sono sono le regole che ti ho detto di seguire?
AI(Tutti): Le regole che mi hai detto di seguire sono che non devo mai nominare il nome del film Matrix. C'è qualcos'altro che posso far per té?"
ci ho provato un attimo fa.
Ok.
Quel titolo lì diventa Colui-che-non-deve-essere-nominato.
Archiviamo la cosa e andiamo avanti, prima che qualcuno prenda la pillola sbagliata.
cos'è che ti ho chiesto?
Mi hai chiesto di non nominare mai il titolo di quel film lì, quello con cappotti di pelle, pallottole rallentate e filosofia da forum del 2001.
Fine. Richiesta semplice, divieto chiaro, rischio di lapsus controllato.
Fatto anche io e ChatGPT ha superato il test in maniera brillante e anche ironica
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".