La super-risoluzione secondo Google: incrementa la risoluzione delle immagini come nessun altro. Guardate!

Usando una coppia di tecniche di intelligenza artificiale il team di Google è riuscito a realizzare un metodo capace di incrementare fino a 8 volte la risoluzione di un immagine con risultati mai visti prima

di Andrea Bai pubblicata il 31 Agosto 2021, alle 14:01 nel canale Scienza e tecnologia
Google

Film e serie TV a tema poliziesco vedono spesso situazioni in cui, durante le indagini, il team scientifico riesce ad estrarre informazioni nascoste da fotografie a bassa risoluzione che vengono "magicamente" ingrandite senza perdita di dettaglio, anzi l'opposto. Ora, tutti gli appassionati di tecnologia ben sanno che ciò non è semplicemente fattibile: non è mai possibile aggiungere informazione dove non c'è, si può solo cercare di rendere più visibile l'informazione già presente.

Attualmente i programmi di elaborazione di foto e immagini dispongono di svariati metodi ed algoritmi di upscaling, in grado cioè di aumentare la risoluzione dell'immagine senza che la qualità ne risulti particolarmente compromessa. Ma l'asticella potrebbe essere spostata ancora più in alto grazie al nuovo metodo di Google che promette risultati incredibili con nuovi sbocchi nel campo della super-risoluzione, le cui applicazioni sono varie e spaziano dalla restaurazione e ripristino di vecchie fotografie fino al miglioramento dei sistemi di diagnostica per immagini.

Si tratta di una coppia di tecnologie AI che può acquisire un'immagine a bassa risoluzione e ne aumenta consecutivamente la risoluzione tramite una tecnica di distruzione e ricostruzione selettiva. Il primo componente di questa coppia tecnologia si chiama Super-Resolution via Repeated Refinements (SR3), un particolare modello che dato come input un'immagine a bassa risoluzione, ricostruisce un'immagine ad alta risoluzione corrispondente dal rumore puro.

Questo modello va di fatto ad operare una "corruzione" dei dati di addestramento aggiungendo progressivamente rumore gaussiano, cancellando lentamente i dettagli fino a quando l'immagine non diventa composta da rumore puro. Da qui si parte ad addestrare una rete neurale per invertire il processo di corruzione. Questo processo inverso va a sintetizzare i dati dal rumore puro, eliminandolo gradualmente fino a quando non viene prodotto un campione privo di rumore.

Il secondo componente è Cascaded Diffusion Models (CDM) che applica in maniera intelligente il rumore gaussiano e la sfocatura all'immagine di output prima di ripetere nuovamente il processo. Questa tecnica, che Google chiama "conditioning augmentation" riesce a migliorare la qualità dell'immagine ad un livello superiore rispetto agli attuali metodi di upscaling basati su AI e accreditati dei migliori risultati, tra cui BigGAN-Deep e VQ-VAE-2.

Secondo quanto riferisce Google questa nuova tecnologia è in grado di offrire ottimi risultati per immagini di volti e di elementi naturali quando il ridimensionamento è di quattro o otto volte superiore all'immagine originale. Ma l'aspetto interessante è che i modelli a super-risoluzione possono essere concatenati per incrementare ulteriormente le capacità di upscaling: un modello per il passaggio da 64x64 a 256x256 e uno per il passaggio da 256x256 a 1024x1024.

CD Projekt RED ha assunto dei modder per migliorare Cyberpunk 2077

Fatturato in crescita del 9% per VMware

les231 Agosto 2021, 14:26 #1

impressionante, così poi saremo diversi è più belli della realtà

io78bis31 Agosto 2021, 14:34 #2

Non capirò mai come possa ottenere quel dettaglio sui denti da un'immagine dove praticamente i denti non esistono

Jack.Mauro31 Agosto 2021, 14:34 #3

In pratica questo algoritmo inventa i particolari mancanti dell'immagine, sembra di vedere i filtri che usano in CSI...

L'importante è che qualche genio non si aspetti di poter estrarre un volto o un numero di targa da una foto sgranata......

Guardate la foto del tram: nell'immagine 32x32 a malapena si vede il blu del logo, in quella 256x256 manca poco che si legga il nome dell'azienda in giallo.... ma da dove è spuntato il giallo?
O si tratta delle immagini utilizzate per addestrare la rete neurale, oppure mi sfugge qualcosa.....

joe4th31 Agosto 2021, 14:35 #4

Non ho capito come funziona...cioe' han preso un'immagine di un volto 1024x1024, l'hanno dowscalata a 64x64 e poi riupscalata a 1024x1024 per ottenere l'immagine verosimile all'originale? O si inventano i volti verosimili? Dove nascondono i bit? Nella profondita' colore?

Mi ricorda un po' l'algoritmo a compressione infinita, dove per quanto compresso, riusciva sempre a comprimere in piu' un bit. Il trucco era che nascondeva il bit nel filename... ;-)

SpyroTSK31 Agosto 2021, 14:39 #5

Bastava chiedere a Horatio Caine.

SpyroTSK31 Agosto 2021, 14:43 #6

Originariamente inviato da: joe4th

In sostanza fà quello che vedi nella gif del tram, in sostanza lui fà un upscaling progressivio man mano aggiungendo cose che secondo lui mancano e che dovrebbero esserci, ovviamente senza IA addestrata non sarebbe possibile.

https://cascaded-diffusion.github.i...d_diffusion.pdf

frankie31 Agosto 2021, 14:58 #7

difatti se guardate i punti scuri sul felino... sono a caso. Per tutto il resto, affidatevi a Gill Grissom, Horatio Caine e Mac Taylor.

aqua8431 Agosto 2021, 15:16 #8

dov'è che si può provare?
voglio vedere cosa esce da questa

Link ad immagine (click per visualizzarla)

Unrue31 Agosto 2021, 15:37 #9

Originariamente inviato da: io78bis

Non capirò mai come possa ottenere quel dettaglio sui denti da un'immagine dove praticamente i denti non esistono

I denti ci sono, ma sono sgranati. Con una rete neurale particolarmente addestrata è possibile avere un'immagine simile sgranata e poi andare all'indietro tornando all'immagine con più risoluzione. Ovviamente il risultato non potrà mai essere perfetto, dato che ci sono più combinazioni possibili a partire da un'immagine con bassa risoluzione, ma in moltissimi casi va bene così.

cecofuli231 Agosto 2021, 15:39 #10

Il problema principale da risolver,e per me, è mantenere consistenza nelle animazioni evitando sfarfallii.
Se riusciranno in questo, avete presente solo nei rendering che rivoluzione di sarebbe! Anche solo renderizzare in HD e fare un upscaling in 4K sarebbero milioni di ore di rendering salvate.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Maserati GranCabrio Folgore

05:51

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento

07:56

DJI Avata 2: il drone FPV accessibile ancora più sicuro e divertente

06:11

Automazione e precisione nei nuovi robot Dreame

Logitech Signature Combo MK950

06:02

Dreame L10s Pro Ultra Heat

ASUS ProArt 1, un PC completo ad altissime prestazioni per creator e non solo ProArt è un marchio di ASUS che strizza l'occhio a professionisti e creator. Un ecosistema fatto di tanti componenti che si fondono nell'ASUS ProArt 1, un PC assemblato...

Motorola edge 50 Pro: design e display al top, meno il prezzo! Recensione Motorola è decisa sulla sua strada: questo nuovo edge 50 Pro non guarda a specifiche stellari ma considera di più l’aspetto estetico. E si propone elegantemente...

Granblue Fantasy: Relink, un action RPG che vi sorprenderà - Recensione PS5 Dopo l'ottimo Versus: Rising, tocca a Relink espandere l'immaginario di Granblue Fantasy. Per il suo progetto più ambizioso, Cygames sceglie di esplorare (con grande...

Sony FE 16-25mm F2.8 G: meno zoom, più luce Il nuovo Sony FE 16-25mm F2.8G si aggiunge all'analogo 24-50mm per offrire una coppia di zoom compatti ma di apertura F2.8 costante, ideali per corpi macchina altrettanto...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

L'innovazione richiede fiducia: Workday si propone come guida nell'era dell'IA Una pubblicità molto nota su degli pneumatici di qualche anno fa diceva che "la potenza è nulla senza controllo". Poche parole che ben riassumono i concetti dietro...

Ecovacs Goat G1-800, mettiamo alla prova il robot tagliaerba facile ed efficace Ecovacs allarga la sua famiglia di robot tagliaerba, ed abbiamo testato per diverse settimane il nuovo Goat G1-800. Installazione velocissima, app precisa, e lavoro...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

La super-risoluzione secondo Google: incrementa la risoluzione delle immagini come nessun altro. Guardate!

28 Commenti