ChatGPT Images: GPT Image 1.5 migliora qualità, velocità e coerenza delle immagini generate

ChatGPT Images: GPT Image 1.5 migliora qualità, velocità e coerenza delle immagini generate

OpenAI ha aggiornato ChatGPT Images con il nuovo modello GPT Image 1.5: editing più preciso, generazione fino a 4 volte più veloce e migliore fedeltà al prompt fornito. Debutta anche uno spazio dedicato alle immagini in ChatGPT, pensato come studio creativo per ispirazione, modifiche avanzate e uso professionale.

di pubblicata il , alle 08:27 nel canale Web
ChatGPTOpenAI
 

OpenAI ha annunciato il rilascio di una nuova versione di ChatGPT Images, basata su quello che l'azienda definisce il proprio modello di generazione di immagini di punta. L'aggiornamento introduce miglioramenti rilevanti sia sul fronte della qualità visiva sia su quello dell'esperienza d'uso, con una maggiore precisione nell'esecuzione delle richieste, tempi di generazione fino a quattro volte più rapidi e un nuovo spazio dedicato alla creazione visiva all'interno di ChatGPT.

Il nuovo modello è disponibile da oggi in ChatGPT per tutti gli utenti e nelle API con il nome di GPT Image 1.5, mentre la nuova esperienza "Images" integrata nell'interfaccia di ChatGPT è in fase di distribuzione per la maggior parte degli account, con l'accesso Business ed Enterprise previsto in un secondo momento.

Uno degli obiettivi principali di GPT Image 1.5 è migliorare l'affidabilità nell'editing delle immagini caricate dagli utenti. Il modello è progettato per modificare esclusivamente gli elementi richiesti, preservando aspetti chiave come illuminazione, composizione e somiglianza dei soggetti. Questo approccio consente interventi più credibili, ad esempio nelle prove virtuali di abbigliamento e acconciature, così come nell'applicazione di filtri stilistici o trasformazioni concettuali che mantengono l'essenza dell'immagine originale.

Dal punto di vista tecnico, il sistema supporta diverse modalità di editing - dall'aggiunta e rimozione di elementi alla fusione e trasposizione - riducendo il rischio di alterazioni indesiderate. OpenAI descrive il risultato come una sorta di "studio creativo tascabile", capace di coprire sia esigenze pratiche sia sperimentazioni più espressive.

Il modello mostra progressi anche nella generazione di immagini completamente nuove, soprattutto quando sono richieste trasformazioni complesse che coinvolgono layout, testo e relazioni spaziali tra più elementi. La capacità di seguire istruzioni articolate risulta più affidabile rispetto alla precedente generazione, consentendo composizioni strutturate e coerenti anche in scenari dettagliati, come griglie multi-oggetto o poster grafici complessi.

Un altro ambito di miglioramento riguarda il text rendering: GPT Image 1.5 è in grado di gestire testi più densi e di dimensioni ridotte, un aspetto rilevante per infografiche, materiali informativi e contenuti con elementi tipografici integrati nell'immagine.

Accanto al nuovo modello, OpenAI ha introdotto una sezione dedicata alle immagini all'interno di ChatGPT, accessibile dalla sidebar su web e mobile. Questo spazio è pensato per facilitare l'esplorazione creativa grazie a filtri predefiniti, prompt di tendenza e stili pronti all'uso, riducendo la necessità di formulare istruzioni testuali dettagliate. Le immagini possono inoltre essere generate in parallelo, migliorando la fluidità del processo creativo.

In merito a questa scelta, Fidji Simo, CEO of Applications di OpenAI, ha dichiarato: "Per molte persone, la prima esperienza con ChatGPT consiste nel trasformare un prompt testuale in un'immagine. È un modo magico per vedere quello che questa tecnologia può fare, ma l'interfaccia di dialogo non era stata originariamente progettata per questo. Creare e modificare immagini è un tipo di attività differente e merita uno spazio pensato proprio per i contenuti visivi".

"Oggi abbiamo lanciato un nuovo modello di generazione di immagini e un punto di accesso dedicato in ChatGPT, che funziona più come uno studio creativo. Le nuove schermate per visualizzare e modificare immagini rendono più semplice creare contenuti che corrispondano all'idea dell'utente o trovare ispirazione a partire da prompt di tendenza o filtri predefiniti".

"Inoltre, il nostro nuovo modello è più veloce e migliore nel seguire istruzioni dettagliate, così che l'utente possa ottenere modifiche e trasformazioni creative più accurate. Mantiene coerenti tra input e output elementi chiave come luce, composizione e somiglianza, così che i risultati siano più fedeli a quello che l'utente ha immaginato".

OpenAI segnala ulteriori progressi nella resa di scene affollate, volti di piccole dimensioni e nell'aspetto complessivo delle immagini, pur riconoscendo che permangono limiti in alcuni contesti, come la gestione di stili molto specifici, scene con molti volti o contenuti multilingua. L'azienda sottolinea che si tratta di un passo avanti significativo, ma non definitivo.

Sul fronte API, GPT Image 1.5 offre le stesse funzionalità della versione integrata in ChatGPT, con una maggiore coerenza nella preservazione di loghi e identità visive. Questo lo rende adatto a scenari professionali come marketing ed e-commerce, dove è possibile generare interi cataloghi di prodotto a partire da una singola immagine. OpenAI evidenzia anche una riduzione dei costi del 20% per input e output rispetto alla generazione precedente.

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^