OpenAI Codex scrive codice e lo testa da solo: addio ai bug?

OpenAI ha annunciato il lancio di Codex, un nuovo agente AI ottimizzato per il software engineering e integrato in ChatGPT. Alimentato da codex-1 e progettato per lavorare in cloud, Codex può scrivere codice, correggere bug e proporre pull request. È già in uso in aziende come Cisco.

di Manolo De Agostini pubblicata il 17 Maggio 2025, alle 07:01 nel canale Web
ChatGPT OpenAI

OpenAI ha annunciato l'anteprima di ricerca di Codex, un nuovo agente AI per la programmazione progettato per automatizzare e semplificare le attività di sviluppo software. L'agente è già disponibile per gli abbonati a ChatGPT Pro, Team ed Enterprise, e sarà esteso prossimamente ai piani Plus ed Edu.

Codex consente agli sviluppatori di delegare attività ripetitive e semplici, come scrivere funzionalità base, correggere bug, generare test o proporre pull request. Opera all'interno di container isolati nel cloud, caricati con il codice dell'utente e configurati per rispecchiare accuratamente l'ambiente di sviluppo. Gli utenti possono assegnare task tramite prompt testuali direttamente dalla barra laterale dell'app web di ChatGPT, scegliendo tra i pulsanti "Code" (per generare codice) o "Ask" (per ricevere risposte e consigli tecnici).

Codex si basa su codex-1, una versione del modello o3 ottimizzata tramite reinforcement learning su compiti di programmazione reali. Rispetto ai predecessori, produce codice più pulito, segue istruzioni in modo più preciso e itera sui test automaticamente fino a ottenere risultati positivi. A differenza del tool open source Codex CLI, Codex offre un'interfaccia interattiva e orientata a casi d'uso professionali.

Per migliorare l'efficacia del sistema, OpenAI consiglia agli sviluppatori di includere nel repository un file AGENTS.md, simile a un README ma pensato per l'AI: può contenere linee guida stilistiche, standard del progetto o spiegazioni architetturali, aiutando l'agente a operare in modo più contestualizzato e coerente con le pratiche del team.

Clicca per ingrandire

OpenAI ha già testato Codex con aziende come Cisco, Temporal, Superhuman e Kodiak, che lo utilizzano per velocizzare i rilasci e migliorare la qualità del software. I risultati sembrano promettenti, soprattutto in termini di automazione delle attività a basso valore aggiunto.

Secondo Josh Tobin, Agents Research Lead di OpenAI, l'obiettivo è arrivare a una collaborazione uomo-macchina in cui Codex agisca come un "collega virtuale" capace di portare a termine compiti che normalmente richiederebbero ore o giorni di lavoro.

Codex funziona in un ambiente air-gapped, senza accesso a Internet o ad API esterne, ed è programmato per rifiutare la creazione di software dannoso. Tuttavia, OpenAI ribadisce che è fondamentale una revisione umana del codice generato, che non deve essere eseguito senza verifica.

Clicca per ingrandire

L'interesse per questo tipo di strumenti è in forte crescita. Google e Microsoft hanno affermato che circa il 30% del codice aziendale è già scritto da AI (e, nel caso di Microsoft, questo starebbe già incidendo sui posti di lavoro). OpenAI intende consolidare la propria posizione in questo mercato anche attraverso l'acquisizione della startup Windsurf, valutata 3 miliardi di dollari.

OpenAI prevede di introdurre limiti di utilizzo e un modello a crediti per l'accesso a Codex. Parallelamente, Codex CLI è stato aggiornato con il modello o4-mini, disponibile anche via API a pagamento.

Questo lancio si inserisce in una strategia più ampia di OpenAI per trasformare ChatGPT in una piattaforma agent-native, che includa strumenti autonomi come Operator (per la navigazione web automatica) e Deep Research (per la sintesi e l'analisi di informazioni complesse).

I migliori sconti su Amazon oggi

-23%

Samsung Galaxy S25 Smartphone AI, 3 anni di Garanzia del produttore, Display 6.2'' FHD+ Dynamic AMOLED 2X, Fotocamera 50MP, RAM 12GB, 512GB, 4.000 mAh, Icyblue [Versione italiana]

1109.00 849.55€ Compra ora

-20%

Apple Portatile MacBook Air 13'' con chip M4 (2025): progettato per Apple Intelligence, display Liquid Retina da 13,6'', 16GB di memoria unificata, 512GB di archiviazione SSD, Touch ID; Mezzanotte

1499.00 1199.00€ Compra ora

-20%

Samsung Galaxy S25 Edge, Smartphone AI, 3 anni di Garanzia del produttore, Display 6.7'' QHD+ Dynamic AMOLED 2X, Fotocamera 200MP, RAM 12GB, 512GB, 3.900 mAh, Titanium Jetblack [Versione italiana]

1419.00€ Compra ora

La capsula W-3 di Varda Space è rientrata correttamente dopo il lancio avvenuto a marzo

Dreame L40S Pro Ultra vs Dreame X40 Ultra Complete: guida alla scelta tra due top di gamma in sconto

pachainti17 Maggio 2025, 11:59 #1

Attenzione alle "allucinazioni", non sono eliminabili.

Hallucination is Inevitable: An Innate Limitation of Large Language Models
[I]Hallucination has been widely recognized to be a significant drawback for large language models (LLMs). In this paper, we formalize the problem and show that it is impossible to eliminate hallucination in LLMs. Specifically, we define a formal world where hallucination is defined as inconsistencies between a computable LLM and a computable ground truth function. By employing results from learning theory, we show that LLMs cannot learn all the computable functions and will therefore inevitably hallucinate if used as general problem solvers. Since the formal world is a part of the real world which is much more complicated, hallucinations are also inevitable for real world LLMs.[/I]

djfix1317 Maggio 2025, 16:22 #2

ma infatti chatGPT ti da una mano ma fa di quelle cappellate ogni tanto che sono da panico: riscrive il suo listato e oltre alle varianti richieste aggiunge altro o si dimentica righe di codice che era chiaro che andavano messe ed erano consigliate da lui stesso... e da qui che si capisce che LUI non capisce niente di quello che dice o propone, solo una serie di algoritmi che portano alla più probabile delle risposte

aqua8417 Maggio 2025, 16:49 #3

mah...
a me pare 'na strunzata...

mi aspetto da una MACCHINA che faccia il lavoro PERFETTO
già il fatto che si deve correggere significa che fa il lavoro con degli errori

e allora me lo faccio da solo

JackZR17 Maggio 2025, 19:21 #4

Originariamente inviato da: aqua84

Diciamo che tu a scrivere un programmino ci metti 2 ore, l'IA ci mette 2 minuti, anche se il codice è più buggato al programmatore comunque conviene perché il debugging è problema d'altri! 😂

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nintendo Switch 2

Fujifilm X-E5 con Fujinon XF23mm F2.8: una X100VI ma con ottica intercambiabile

2025 Nikon Comedy Wildlife Awards: i primi scatti del concorso

Nintendo Switch 2

MSI Prestige 13 AI e i portatili business al Computex

NVIDIA GeForce RTX 5060: le schede video di ogni partner dal Computex

Gigabyte Aero X16 Copilot+ PC: tanta potenza non solo per l'IA Un notebook che punta sull'abbinamento tra potenza di calcolo, schermo ampio e dimensioni nel complesso compatte. Gigabyte Aero X16 Copilot+ PC si trasporta facilmente,...

Recensione REDMAGIC Astra Gaming Tablet: che spettacolo di tablet! Il REDMAGIC Astra Gaming Tablet rappresenta una rivoluzione nel gaming portatile, combinando un display OLED da 9,06 pollici a 165Hz con il potente Snapdragon 8...

Dopo un mese, e 50 foto, cosa abbiamo capito della nuova Nintendo Switch 2 Dopo un mese di utilizzo intensivo e l'analisi di oltre 50 scatti, l'articolo offre una panoramica approfondita di Nintendo Switch 2. Vengono esaminate le caratteristiche...

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

OpenAI Codex scrive codice e lo testa da solo: addio ai bug?

Samsung Galaxy S25 Smartphone AI, 3 anni di Garanzia del produttore, Display 6.2'' FHD+ Dynamic AMOLED 2X, Fotocamera 50MP, RAM 12GB, 512GB, 4.000 mAh, Icyblue [Versione italiana]

Apple Portatile MacBook Air 13'' con chip M4 (2025): progettato per Apple Intelligence, display Liquid Retina da 13,6'', 16GB di memoria unificata, 512GB di archiviazione SSD, Touch ID; Mezzanotte

Samsung Galaxy S25 Edge, Smartphone AI, 3 anni di Garanzia del produttore, Display 6.7'' QHD+ Dynamic AMOLED 2X, Fotocamera 200MP, RAM 12GB, 512GB, 3.900 mAh, Titanium Jetblack [Versione italiana]

4 Commenti