L'intelligenza artificiale di Google può creare brevi video partendo da una sola immagine. Guardate!

L'intelligenza artificiale di Google può creare brevi video partendo da una sola immagine. Guardate!

Si chiama Transframer ed è capace di realizzare brevi spezzoni di video partendo da una singola immagine, riuscendo a ricreare la rappresentazione prospettica degli oggetti

di pubblicata il , alle 14:01 nel canale Scienza e tecnologia
 

La rete neurale di Google, Deep Mind, ha dato dimostrazione della possibilità di realizzare brevi spezzoni video a partire da un singolo fotogramma o una singola fotografia. E' la stessa Google tramite il profilo Twitter ufficiale di DeepMind a mostrare cosa l'AI è riuscita a fare partendo da una sola immagine.

Il modello di intelligenza artificiale dedicato a questo compito è chiamato "Transframer", un gioco di parole tra "transformer" e "frame" e che si basa concettualmente sullo stesso principio di altri strumenti di intelligenza artificiale quali ad esempio proprio i "Transformer" che partendo da alcune parole possono generare dei testi più o meno completi di senso compiuto.

Transframer realizza i suoi video riuscendo a prevedere l'ambiente circostante e "indovinando" l'aspetto degli elementi e la loro rappresentazione prospettica grazie ad un set di dati di addestramento che gli permettono di immaginare come un oggetto reale debba apparire se visto da un'angolazione differente.

Per quanto i video mostrati siano a bassissima risoluzione, si tratta comunque di un modello di AI particolarmente interessante poiché mostra una qualche capacità di applicazione della percezione della profondità e della prospettiva per realizzare un'immagine verosimile, simile a quanto vediamo spostandoci in un ambiente reale. Se, ovviamente, la prima applicazione possibile che viene in mente per una tecnologia di questo tipo è quella della generazione di ambienti virtuali per videogiochi o esperienze VR, i campi d'impiego possono essere vari e, con essi, anche i risvolti discutibili con la possibilità di sconfinare in maniera ancora più complessa nell'ambito dei deepfake.

Nella conversazione su Twitter un utente ha espresso la volontà di usare Transframer in sinergia con DALL-E di OpenAI, l'algoritmo di generazione di immagini artificiale (come Imagen, della stessa Google) allo scopo di esplorare le possibilità creative per realizzare un video realistico a partire da un'immagine inventata dall'AI: si tratta di un esempio molto interessante delle interazioni tra diversi modelli AI, un filone che si preannuncia come ricco di sorprese negli anni a venire.

16 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
nonsidice18 Agosto 2022, 14:10 #1
Sarebbe curioso sapere se ad ogni "iterazione" con la stessa immagine genera la stessa animazione/ambientazione oppure ne "pensa" una nuova
randorama18 Agosto 2022, 14:33 #2
a me sembra una banalissima zommata.
l'unico pan lo fa con l'immagine del mare.
acerbo18 Agosto 2022, 14:51 #3
si ma é possibile che con tutta sta intelligenza non riescono ancora a far funzionare una stronzata cosi' basilare come le traduzioni? Minkia spesso sbaglia anche con una sola parola!
giovanni6918 Agosto 2022, 15:13 #4
Mi vengono in mente le zoomate presenti in Blade Runner... quando l'agente Deckard si mette a dare in pasto la foto . Chi è vecchio abbastanza da ricordarsi?
https://www.youtube.com/watch?v=QOlPNZzneGw
https://www.youtube.com/watch?v=qHepKd38pr0

E' come se Deckard aka Harrison Ford si spostasse all'interno di un ambiente 3D. Vedasi commenti in quei video e limiti della tecnologia se fosse un vero 'zoom' e non una ricostruzione da AI come in questo caso.

Tuttavia di quelle mostrate nel video dell'articolo, l'unica che è sorprendente è quella che parte in alto a sinistra. Le altre sono delle banalità: ovvio che lungo la spiaggia se alla destra c'è del mare è probabile che spostandosi verso destra ci possa essere del mare. Lo zoom verso quello che appare con un faro con un edificio sulla destra non è niente di particolare.

Poi certo, dipende cosa viene dato in pasto all'AI: se oltre alla foto ha avuto modo di fare training anche con qualche mappa che include quelle foto, non mi stupirebbe nemmeno il primo video in alto a sinistra.
cignox118 Agosto 2022, 15:37 #5
--si ma é possibile che con tutta sta intelligenza non riescono ancora a far funzionare una stronzata cosi' basilare come le traduzioni?

Se parli di google translate, ho visto un nettissimo miglioramento negli ultimi 10 anni. Scrivo e leggo quotidianamente email in inglese e tedesco e se trovo qualche punto oscuro in quelle tedesche le passo per google translate (di solito verso l'inglese, alle volte verso l'italiano) ottenendo solitamente traduzioni piuttosto buone.
Alle volte passo anche le mie in inglese, e le traduco in italiano, se sono email particolarmente importanti: se google le traduce bene, allora grossi errori non ne devo aver fatti. E 9 volte su 10 le traduce in maniera decisamente buona.
acerbo18 Agosto 2022, 15:59 #6
Originariamente inviato da: cignox1
--si ma é possibile che con tutta sta intelligenza non riescono ancora a far funzionare una stronzata cosi' basilare come le traduzioni?

Se parli di google translate, ho visto un nettissimo miglioramento negli ultimi 10 anni. Scrivo e leggo quotidianamente email in inglese e tedesco e se trovo qualche punto oscuro in quelle tedesche le passo per google translate (di solito verso l'inglese, alle volte verso l'italiano) ottenendo solitamente traduzioni piuttosto buone.
Alle volte passo anche le mie in inglese, e le traduco in italiano, se sono email particolarmente importanti: se google le traduce bene, allora grossi errori non ne devo aver fatti. E 9 volte su 10 le traduce in maniera decisamente buona.


Guarda vivendo all'estero uso tantissimo la ricerca e le traduzioni in inglese e francese e l'unico servizio decente che ti aiuta nello scrivere frasi piu' o meno complesse é linguee che si basa su deepl. Google translate é uno dei peggiori, come ho scritto sopra alcune traduzioni sono sballate anche se cerchi una singola parola.
Therinai18 Agosto 2022, 16:00 #7
Non si capisce niente dalla gif di twitter, considerata la modalità di presentazione direi che è più clickbait che altro
danylo18 Agosto 2022, 16:29 #8
Originariamente inviato da: acerbo
si ma é possibile che con tutta sta intelligenza non riescono ancora a far funzionare una stronzata cosi' basilare come le traduzioni?

Per tradurre un testo, bisogna capire il significato della frase.
Le macchine attuali non sono ancora in grado di farlo.
(ci vorra' ancora del tempo)
acerbo18 Agosto 2022, 16:45 #9
Originariamente inviato da: danylo
Per tradurre un testo, bisogna capire il significato della frase.
Le macchine attuali non sono ancora in grado di farlo.
(ci vorra' ancora del tempo)


eh si appunto, qua si parla di intelligenze artificiali sempre piu' potenti in grado di dipingere, montare un video, giocare a scacchi e imbastire dibattiti su argomenti di ogni genere, poi pero' non riescono ancora a tradurre una frase standard con soggeto e predicato dalla lingua x a quella y.
Therinai18 Agosto 2022, 17:07 #10
Originariamente inviato da: acerbo
eh si appunto, qua si parla di intelligenze artificiali sempre piu' potenti in grado di dipingere, montare un video, giocare a scacchi e imbastire dibattiti su argomenti di ogni genere, poi pero' non riescono ancora a tradurre una frase standard con soggeto e predicato dalla lingua x a quella y.


Non ti seguo, puoi fare un esempio in cui google translator non funziona?
Per quanto riguarda italiano-inglese mi pare ok, qualche volta lo uso per togliermi un dubbio o per tradurre termini che non conosco e mi pare ok.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^