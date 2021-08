Film e serie TV a tema poliziesco vedono spesso situazioni in cui, durante le indagini, il team scientifico riesce ad estrarre informazioni nascoste da fotografie a bassa risoluzione che vengono "magicamente" ingrandite senza perdita di dettaglio, anzi l'opposto. Ora, tutti gli appassionati di tecnologia ben sanno che ciò non è semplicemente fattibile: non è mai possibile aggiungere informazione dove non c'è, si può solo cercare di rendere più visibile l'informazione già presente.

Attualmente i programmi di elaborazione di foto e immagini dispongono di svariati metodi ed algoritmi di upscaling, in grado cioè di aumentare la risoluzione dell'immagine senza che la qualità ne risulti particolarmente compromessa. Ma l'asticella potrebbe essere spostata ancora più in alto grazie al nuovo metodo di Google che promette risultati incredibili con nuovi sbocchi nel campo della super-risoluzione, le cui applicazioni sono varie e spaziano dalla restaurazione e ripristino di vecchie fotografie fino al miglioramento dei sistemi di diagnostica per immagini.

Si tratta di una coppia di tecnologie AI che può acquisire un'immagine a bassa risoluzione e ne aumenta consecutivamente la risoluzione tramite una tecnica di distruzione e ricostruzione selettiva. Il primo componente di questa coppia tecnologia si chiama Super-Resolution via Repeated Refinements (SR3), un particolare modello che dato come input un'immagine a bassa risoluzione, ricostruisce un'immagine ad alta risoluzione corrispondente dal rumore puro.

Questo modello va di fatto ad operare una "corruzione" dei dati di addestramento aggiungendo progressivamente rumore gaussiano, cancellando lentamente i dettagli fino a quando l'immagine non diventa composta da rumore puro. Da qui si parte ad addestrare una rete neurale per invertire il processo di corruzione. Questo processo inverso va a sintetizzare i dati dal rumore puro, eliminandolo gradualmente fino a quando non viene prodotto un campione privo di rumore.

Il secondo componente è Cascaded Diffusion Models (CDM) che applica in maniera intelligente il rumore gaussiano e la sfocatura all'immagine di output prima di ripetere nuovamente il processo. Questa tecnica, che Google chiama "conditioning augmentation" riesce a migliorare la qualità dell'immagine ad un livello superiore rispetto agli attuali metodi di upscaling basati su AI e accreditati dei migliori risultati, tra cui BigGAN-Deep e VQ-VAE-2.

Secondo quanto riferisce Google questa nuova tecnologia è in grado di offrire ottimi risultati per immagini di volti e di elementi naturali quando il ridimensionamento è di quattro o otto volte superiore all'immagine originale. Ma l'aspetto interessante è che i modelli a super-risoluzione possono essere concatenati per incrementare ulteriormente le capacità di upscaling: un modello per il passaggio da 64x64 a 256x256 e uno per il passaggio da 256x256 a 1024x1024.