La super-risoluzione secondo Google: incrementa la risoluzione delle immagini come nessun altro. Guardate!

La super-risoluzione secondo Google: incrementa la risoluzione delle immagini come nessun altro. Guardate!

Usando una coppia di tecniche di intelligenza artificiale il team di Google è riuscito a realizzare un metodo capace di incrementare fino a 8 volte la risoluzione di un immagine con risultati mai visti prima

di pubblicata il , alle 14:01 nel canale Scienza e tecnologia
Google
 

Film e serie TV a tema poliziesco vedono spesso situazioni in cui, durante le indagini, il team scientifico riesce ad estrarre informazioni nascoste da fotografie a bassa risoluzione che vengono "magicamente" ingrandite senza perdita di dettaglio, anzi l'opposto. Ora, tutti gli appassionati di tecnologia ben sanno che ciò non è semplicemente fattibile: non è mai possibile aggiungere informazione dove non c'è, si può solo cercare di rendere più visibile l'informazione già presente.

Attualmente i programmi di elaborazione di foto e immagini dispongono di svariati metodi ed algoritmi di upscaling, in grado cioè di aumentare la risoluzione dell'immagine senza che la qualità ne risulti particolarmente compromessa. Ma l'asticella potrebbe essere spostata ancora più in alto grazie al nuovo metodo di Google che promette risultati incredibili con nuovi sbocchi nel campo della super-risoluzione, le cui applicazioni sono varie e spaziano dalla restaurazione e ripristino di vecchie fotografie fino al miglioramento dei sistemi di diagnostica per immagini.

Si tratta di una coppia di tecnologie AI che può acquisire un'immagine a bassa risoluzione e ne aumenta consecutivamente la risoluzione tramite una tecnica di distruzione e ricostruzione selettiva. Il primo componente di questa coppia tecnologia si chiama Super-Resolution via Repeated Refinements (SR3), un particolare modello che dato come input un'immagine a bassa risoluzione, ricostruisce un'immagine ad alta risoluzione corrispondente dal rumore puro.

Questo modello va di fatto ad operare una "corruzione" dei dati di addestramento aggiungendo progressivamente rumore gaussiano, cancellando lentamente i dettagli fino a quando l'immagine non diventa composta da rumore puro. Da qui si parte ad addestrare una rete neurale per invertire il processo di corruzione. Questo processo inverso va a sintetizzare i dati dal rumore puro, eliminandolo gradualmente fino a quando non viene prodotto un campione privo di rumore.

Il secondo componente è Cascaded Diffusion Models (CDM) che applica in maniera intelligente il rumore gaussiano e la sfocatura all'immagine di output prima di ripetere nuovamente il processo. Questa tecnica, che Google chiama "conditioning augmentation" riesce a migliorare la qualità dell'immagine ad un livello superiore rispetto agli attuali metodi di upscaling basati su AI e accreditati dei migliori risultati, tra cui BigGAN-Deep e VQ-VAE-2.

Secondo quanto riferisce Google questa nuova tecnologia è in grado di offrire ottimi risultati per immagini di volti e di elementi naturali quando il ridimensionamento è di quattro o otto volte superiore all'immagine originale. Ma l'aspetto interessante è che i modelli a super-risoluzione possono essere concatenati per incrementare ulteriormente le capacità di upscaling: un modello per il passaggio da 64x64 a 256x256 e uno per il passaggio da 256x256 a 1024x1024.

28 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
les231 Agosto 2021, 14:26 #1
impressionante, così poi saremo diversi è più belli della realtà
io78bis31 Agosto 2021, 14:34 #2
Non capirò mai come possa ottenere quel dettaglio sui denti da un'immagine dove praticamente i denti non esistono
Jack.Mauro31 Agosto 2021, 14:34 #3
In pratica questo algoritmo inventa i particolari mancanti dell'immagine, sembra di vedere i filtri che usano in CSI...

L'importante è che qualche genio non si aspetti di poter estrarre un volto o un numero di targa da una foto sgranata......

Guardate la foto del tram: nell'immagine 32x32 a malapena si vede il blu del logo, in quella 256x256 manca poco che si legga il nome dell'azienda in giallo.... ma da dove è spuntato il giallo?
O si tratta delle immagini utilizzate per addestrare la rete neurale, oppure mi sfugge qualcosa.....
joe4th31 Agosto 2021, 14:35 #4
Non ho capito come funziona...cioe' han preso un'immagine di un volto 1024x1024, l'hanno dowscalata a 64x64 e poi riupscalata a 1024x1024 per ottenere l'immagine verosimile all'originale? O si inventano i volti verosimili? Dove nascondono i bit? Nella profondita' colore?

Mi ricorda un po' l'algoritmo a compressione infinita, dove per quanto compresso, riusciva sempre a comprimere in piu' un bit. Il trucco era che nascondeva il bit nel filename... ;-)
SpyroTSK31 Agosto 2021, 14:39 #5
Bastava chiedere a Horatio Caine.
SpyroTSK31 Agosto 2021, 14:43 #6
Originariamente inviato da: joe4th
Non ho capito come funziona...cioe' han preso un'immagine di un volto 1024x1024, l'hanno dowscalata a 64x64 e poi riupscalata a 1024x1024 per ottenere l'immagine verosimile all'originale? O si inventano i volti verosimili? Dove nascondono i bit? Nella profondita' colore?

Mi ricorda un po' l'algoritmo a compressione infinita, dove per quanto compresso, riusciva sempre a comprimere in piu' un bit. Il trucco era che nascondeva il bit nel filename... ;-)


In sostanza fà quello che vedi nella gif del tram, in sostanza lui fà un upscaling progressivio man mano aggiungendo cose che secondo lui mancano e che dovrebbero esserci, ovviamente senza IA addestrata non sarebbe possibile.


https://cascaded-diffusion.github.i...d_diffusion.pdf
frankie31 Agosto 2021, 14:58 #7
difatti se guardate i punti scuri sul felino... sono a caso. Per tutto il resto, affidatevi a Gill Grissom, Horatio Caine e Mac Taylor.
aqua8431 Agosto 2021, 15:16 #8
dov'è che si può provare?
voglio vedere cosa esce da questa

Link ad immagine (click per visualizzarla)
Unrue31 Agosto 2021, 15:37 #9
Originariamente inviato da: io78bis
Non capirò mai come possa ottenere quel dettaglio sui denti da un'immagine dove praticamente i denti non esistono


I denti ci sono, ma sono sgranati. Con una rete neurale particolarmente addestrata è possibile avere un'immagine simile sgranata e poi andare all'indietro tornando all'immagine con più risoluzione. Ovviamente il risultato non potrà mai essere perfetto, dato che ci sono più combinazioni possibili a partire da un'immagine con bassa risoluzione, ma in moltissimi casi va bene così.
cecofuli231 Agosto 2021, 15:39 #10
Il problema principale da risolver,e per me, è mantenere consistenza nelle animazioni evitando sfarfallii.
Se riusciranno in questo, avete presente solo nei rendering che rivoluzione di sarebbe! Anche solo renderizzare in HD e fare un upscaling in 4K sarebbero milioni di ore di rendering salvate.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^