GPT-5.4 cambia il modo di usare ChatGPT: più preciso dell'uomo nella gestione desktop

OpenAI ha annunciato GPT-5.4, nuovo modello disponibile su ChatGPT, API e Codex. Introduce capacità avanzate di ragionamento, coding e agenti in grado di usare computer e software in grado di ridurre il costo complessivo per professionisti e aziende

di Vittorio Rienzo pubblicata il 06 Marzo 2026, alle 17:16 nel canale Web
OpenAI ChatGPT

OpenAI ha annunciato GPT-5.4, nuovo modello di intelligenza artificiale disponibile su ChatGPT, API e Codex. La piattaforma introduce miglioramenti significativi nelle attività professionali, con particolare attenzione a ragionamento avanzato, sviluppo software, gestione di documenti e workflow automatizzati. Accanto alla versione standard debutta anche GPT-5.4 Pro, pensata per chi richiede prestazioni massime su task complessi.

Il nuovo modello integra i progressi sviluppati con GPT-5.3-Codex e amplia le capacità operative degli agenti AI. Il sistema supporta fino a 1 milione di token di contesto, caratteristica che consente di gestire progetti di lunga durata, analisi estese e sequenze operative articolate. Gli agenti possono pianificare, eseguire e verificare attività lungo intere catene di lavoro senza perdere coerenza.

Una delle novità più rilevanti riguarda le capacità native di utilizzo del computer. GPT-5.4 può operare su applicazioni, browser e ambienti software attraverso librerie come Playwright oppure tramite input visivi basati su screenshot e comandi di mouse e tastiera. Questo permette agli agenti di completare operazioni multi-step tra siti web e programmi, con intervento umano ridotto.

I benchmark mostrano miglioramenti evidenti. Nel test OSWorld-Verified, che valuta l'uso del desktop tramite immagini e input, GPT-5.4 raggiunge un 75,0% di successo, valore superiore sia al 47,3% di GPT-5.2 sia alla media umana del 72,4%. Nel benchmark WebArena-Verified, dedicato all'utilizzo del browser, il nuovo modello registra un 67,3% di successo rispetto al 65,4% della generazione precedente.

OpenAI ha lavorato anche sulla qualità delle risposte. Nei test interni basati su segnalazioni degli utenti, le affermazioni false risultano il 33% meno frequenti rispetto a GPT-5.2, mentre la probabilità che una risposta contenga errori scende del 18%. Il modello mostra miglioramenti anche nella creazione e modifica di contenuti professionali.

Nei test dedicati ai fogli di calcolo, GPT-5.4 raggiunge un punteggio medio dell'87,3%, contro il 68,4% del modello precedente, con le attività tipiche di analisi finanziaria. Nella generazione di presentazioni, i valutatori umani preferiscono i risultati del nuovo modello nel 68% dei casi, grazie a una grafica più curata e maggiore varietà visiva.

Un altro elemento chiave riguarda l'efficienza nell'utilizzo dei token. GPT-5.4 richiede meno token per risolvere problemi complessi rispetto a GPT-5.2, con tempi di risposta inferiori e costi più contenuti per gli sviluppatori. In Codex è disponibile anche la modalità /fast, che consente una velocità di elaborazione fino a 1,5 volte superiore mantenendo la stessa qualità di output.

Il modello introduce inoltre tool search, sistema che consente agli agenti di individuare strumenti e API solo quando necessario. In scenari con molti strumenti disponibili, questa funzione riduce il carico di contesto e migliora l'efficienza. In un test su 250 task con 36 server MCP attivi, l'uso di tool search ha ridotto il consumo totale di token del 47% mantenendo lo stesso livello di precisione.

Sul fronte della comprensione visiva, GPT-5.4 migliora anche la gestione delle immagini ad alta risoluzione. Il livello di input denominato original image detail supporta fino a 10,24 milioni di pixel o 6000 pixel di dimensione massima, mentre il livello high detail arriva a 2,56 milioni di pixel o 2048 pixel.

GPT-5.4 è disponibile da oggi su ChatGPT come GPT-5.4 Thinking per gli utenti Plus, Team e Pro, mentre GPT-5.4 Pro è destinato agli abbonamenti Pro ed Enterprise. Gli sviluppatori possono accedere al modello tramite API con il nome gpt-5.4 e alla versione avanzata gpt-5.4-pro. Il modello precedente GPT-5.2 Thinking rimarrà disponibile per tre mesi nella sezione Legacy prima della dismissione prevista per il 5 giugno 2026.

I migliori sconti su Amazon oggi

-30%

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

99.90 69.99€ Compra ora

-30%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

140.84€ Compra ora

-30%

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

Centinaia di petabyte in una molecola: la corsa allo storage su DNA sintetico accelera

Costo della memoria alle stelle? Non avete ancora visto nulla: l'attacco all'Iran potrebbe nascondere una catastrofe

LMCH07 Marzo 2026, 20:04 #1

Un sacco di numeri, ma nella sostanza cosa significano?

In particolare:

"Nel test OSWorld-Verified, che valuta l'uso del desktop tramite immagini e input, GPT-5.4 raggiunge un 75,0% di successo" significa che fallisce 1 volta su 4 ?

"Nei test interni basati su segnalazioni degli utenti, le affermazioni false risultano il 33% meno frequenti rispetto a GPT-5.2, mentre la probabilità che una risposta contenga errori scende del 18%. " bello il confronto rispetto alla versione precedente, ma in termini assoluti?

Ecc. ecc.

Di certo per il lancio della nuova versione non hanno risparmiato il rossetto per abbellire il maiale.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Formula E Gen4 - La monoposto

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

GPT-5.4 cambia il modo di usare ChatGPT: più preciso dell'uomo nella gestione desktop

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

1 Commenti