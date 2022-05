Google ha presentato un sistema di intelligenza artificiale capace di creare immagini partendo da una descrizione testuale: Imagen, questo il nome dell'AI, sarebbe capace, secondo il Brain Team di Google Research, di offrire "un grado di fotorealismo senza precedenti e un profondo livello di comprensione del linguaggio".

I ricercatori di Google hanno voluto valutare Imagen rispetto ad altri modelli AI text-to-image (come ad esempio DALL-E 2, VQ-GAN+CLIP e Latent Diffusion Models) creando un benchmark chiamato DrawBench che fornisce a ciascun modello 200 messaggi di testo da cui trarre un'immagine che sarà valutata ciascuna da operatori umani. Questo processo ha stabilito che Imagen risulta migliore sia nei confronti affiancati, sia nella qualità del singolo campione quanto ad accuratezza tra testo e immagine.

Imagen non è disponibile al pubblico poiché Google non ritiene sia ancora adatto per l'uso generale per una serie di motivi. I modelli text-to-image vengono generalmente allenati su grandi set di dati prelevati direttamente dal Web, il che può introdurre svariati problemi.

"Sebbene questo approccio abbia consentito rapidi progressi algoritmici negli ultimi anni, set di dati di questa natura spesso riflettono stereotipi sociali, punti di vista oppressivi e associazioni dispregiative, o comunque dannose, a gruppi di identità emarginati. Mentre un sottoinsieme dei nostri dati di allenamento è stato filtrato per rimuovere il rumore e i contenuti indesiderati, come immagini pornografiche e linguaggio tossico, abbiamo anche utilizzato il set di dati LAION-400M, che è noto per contenere un'ampia gamma di contenuti inappropriati tra cui immagini pornografiche, insulti razzisti e stereotipi sociali dannosi" spiegano i ricercatori.

Il Brain Team di Google Research sottolinea inoltre che Imagen ha ereditato i "pregiudizi sociali e i limiti dei modelli linguistici di grandi dimensioni e potrebbe presentare stereotipi e rappresentazioni dannose". E, oltre alla rappresentazione di stereotipi di genere, uno strumento del genere nelle mani del pubblico più ampio, senza alcun tipo di controllo, potrebbe essere utilizzato in maniera impropria.

Attualmente, però, si può provare Imagen in forma limitata, scegliendo da un insieme di frasi che possono essere combinate insieme. Sul sito di Imagen è inoltre possibile visualizzare vari esempi di quanto l'IA sia stata in grado di produrre. E' opportuno osservare che i risultati mostrati sul sito ufficiale di Imagen sono selezionati, e potrebbero essere il meglio tra le migliori immagini generate dal modello.