Ufficiale GPT-5.2-Codex, il nuovo modello OpenAI per sviluppatori software e cybersecurity

Ufficiale GPT-5.2-Codex, il nuovo modello OpenAI per sviluppatori software e cybersecurity

GPT-5.2-Codex è un nuovo modello di OpenAI pensato per affiancare team di sviluppo e professionisti della sicurezza in attività complesse, dalla manutenzione del codice alla scoperta di vulnerabilità in sistemi reali, con attenzione alla gestione responsabile delle sue capacità

di pubblicata il , alle 11:11 nel canale Web
OpenAIChatGPT
 

GPT-5.2-Codex si presenta come un modello specializzato nella codifica agentica, progettato per affrontare scenari di ingegneria del software complessi e attività di cybersecurity difensiva su larga scala. Punto centrale del progetto è la capacità di lavorare in contesti estesi, seguire flussi di lavoro articolati e supportare sviluppatori e ricercatori nel trattamento di codice reale per periodi prolungati, mantenendo al contempo un uso efficiente del contesto e dei token.

Secondo quanto illustrato da OpenAI, GPT-5.2-Codex deriva da GPT-5.2, ma introduce ulteriori ottimizzazioni per attività come refactoring su larga scala, migrazioni di codice e gestione di ambienti complessi, con un supporto più solido per Windows e una serie di miglioramenti nelle capacità legate alla sicurezza informatica. Il modello è già disponibile nel Codex CLI, nelle estensioni per IDE, nel cloud e nei flussi di revisione del codice per gli utenti ChatGPT a pagamento, mentre l'accesso tramite API per terze parti è previsto in una fase successiva.

Architettura e training di GPT-5.2-Codex sono stati orientati al lavoro "agentico": il modello può orchestrare strumenti, interagire con il terminale, interpretare repository complessi e seguire step multipli senza perdere coerenza tra una richiesta e l'altra. In quest'ottica, la comprensione di contesti estesi e la compattazione nativa del contesto puntano a rendere più affidabili attività che richiedono numerosi passaggi, come la navigazione tra moduli, l'analisi di dipendenze articolate o la preparazione di patch strutturate.

Nei benchmark pubblici, GPT-5.2-Codex ottiene risultati di rilievo su SWE-Bench Pro e Terminal-Bench 2.0, due suite pensate per misurare la capacità di affrontare compiti realistici in ambienti di sviluppo e terminale. In SWE-Bench Pro il modello riceve un repository completo e deve produrre una patch funzionante per risolvere un task di sviluppo, mentre Terminal-Bench 2.0 valuta la gestione di operazioni come compilazione, addestramento di modelli e configurazione di server in ambienti terminali autentici, con prestazioni che superano quelle di GPT-5.2 e GPT-5.1-Codex-Max riportate dalla stessa OpenAI nel materiale ufficiale.

Un altro aspetto evidenziato riguarda la componente visiva, con GPT-5.2-Codex in grado di interpretare con maggiore accuratezza screenshot, diagrammi tecnici, grafici e interfacce utente condivise durante le sessioni di lavoro. Tale capacità consente, ad esempio, di analizzare pannelli di configurazione, output grafici o schermate di errore, affinando il supporto nei casi in cui il contesto non è solo testuale ma include elementi grafici rilevanti per la diagnosi o per la comprensione del flusso applicativo.

Parallelamente ai miglioramenti per sviluppatori, OpenAI attribuisce particolare importanza alla dimensione cybersecurity, indicando GPT-5.2-Codex come il modello più avanzato distribuito finora in questo ambito, sebbene non sia ancora classificato a livello "Alto" nel proprio Framework di preparazione. L'azienda sottolinea come ogni incremento di capacità richieda un investimento corrispondente in salvaguardie, controlli di accesso e valutazioni sistematiche, con l'obiettivo di massimizzare l'impatto difensivo riducendo i rischi di uso improprio nel medio periodo.

Il caso citato riguarda il lavoro del ricercatore di sicurezza Andrew MacPherson, in forza a Privy (società di Stripe), che ha utilizzato GPT-5.1-Codex-Max con Codex CLI per analizzare una vulnerabilità critica nota come React2Shell nell'ecosistema React Server Components. Successivamente, sottolinea l'azienda, il lavoro con il modello ha portato all'individuazione di tre vulnerabilità aggiuntive, poi comunicate al team di React secondo pratiche di divulgazione responsabile.

Nelle intenzioni dell'azienda, GPT-5.2-Codex è progettato quindi come alleato per sviluppatori, che possono affrontare con maggiore rapidità compiti di manutenzione e sviluppo su progetti complessi, e come strumento per rafforzare la ricerca sulla sicurezza, purché inserito in un quadro di controlli e responsabilità chiari. Gli esiti di questa fase di distribuzione progressiva, con feedback raccolti da team tecnici e di sicurezza, costituiranno la base per definire l'accesso futuro e l'adozione dei modelli successivi.

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^