L'intelligenza artificiale di Google può creare brevi video partendo da una sola immagine. Guardate!
Si chiama Transframer ed è capace di realizzare brevi spezzoni di video partendo da una singola immagine, riuscendo a ricreare la rappresentazione prospettica degli oggetti
di Andrea Bai pubblicata il 18 Agosto 2022, alle 14:01 nel canale Scienza e tecnologiaLa rete neurale di Google, Deep Mind, ha dato dimostrazione della possibilità di realizzare brevi spezzoni video a partire da un singolo fotogramma o una singola fotografia. E' la stessa Google tramite il profilo Twitter ufficiale di DeepMind a mostrare cosa l'AI è riuscita a fare partendo da una sola immagine.
Il modello di intelligenza artificiale dedicato a questo compito è chiamato "Transframer", un gioco di parole tra "transformer" e "frame" e che si basa concettualmente sullo stesso principio di altri strumenti di intelligenza artificiale quali ad esempio proprio i "Transformer" che partendo da alcune parole possono generare dei testi più o meno completi di senso compiuto.
Transframer realizza i suoi video riuscendo a prevedere l'ambiente circostante e "indovinando" l'aspetto degli elementi e la loro rappresentazione prospettica grazie ad un set di dati di addestramento che gli permettono di immaginare come un oggetto reale debba apparire se visto da un'angolazione differente.
Transframer is a general-purpose generative framework that can handle many image and video tasks in a probabilistic setting. New work shows it excels in video prediction and view synthesis, and can generate 30s videos from a single image: https://t.co/wX3nrrYEEa 1/ pic.twitter.com/gQk6f9nZyg
— DeepMind (@DeepMind) August 15, 2022
Per quanto i video mostrati siano a bassissima risoluzione, si tratta comunque di un modello di AI particolarmente interessante poiché mostra una qualche capacità di applicazione della percezione della profondità e della prospettiva per realizzare un'immagine verosimile, simile a quanto vediamo spostandoci in un ambiente reale. Se, ovviamente, la prima applicazione possibile che viene in mente per una tecnologia di questo tipo è quella della generazione di ambienti virtuali per videogiochi o esperienze VR, i campi d'impiego possono essere vari e, con essi, anche i risvolti discutibili con la possibilità di sconfinare in maniera ancora più complessa nell'ambito dei deepfake.
Nella conversazione su Twitter un utente ha espresso la volontà di usare Transframer in sinergia con DALL-E di OpenAI, l'algoritmo di generazione di immagini artificiale (come Imagen, della stessa Google) allo scopo di esplorare le possibilità creative per realizzare un video realistico a partire da un'immagine inventata dall'AI: si tratta di un esempio molto interessante delle interazioni tra diversi modelli AI, un filone che si preannuncia come ricco di sorprese negli anni a venire.










Recensione OnePlus 15: potenza da vendere e batteria enorme dentro un nuovo design
AMD Ryzen 5 7500X3D: la nuova CPU da gaming con 3D V-Cache per la fascia media
SONY BRAVIA 8 II e BRAVIA Theatre System 6: il cinema a casa in formato compatto
Svolta per le centrali a batteria: Peak Energy userà le batterie agli ioni di sodio
Truffa da 1 miliardo di dollari attraverso siti falsi: Google porta l'azienda cinese in tribunale
Oggi il Black Friday in anticipo fa crollare i prezzi di MacBook Pro chip M5, TV LG OLED e QNED, smartphone Samsung Galaxy e altro
Black Friday anticipato su Amazon: soundbar Hisense e LG da 240 e da 300W con subwoofer wireless in super offerta da 89,99€
ARC Raiders si espande con il nuovo aggiornamento: arriva la nuova mappa e un nemico più potente della Regina
Solo svantaggi per gli utenti: Apple prova a smontare (di nuovo) il DMA europeo con uno studio
L'Irlanda apre un'indagine su X: sospette violazioni del Digital Services Act europeo
Arriva PE3000N, la piattaforma per l'IA sull'edge di ASUS IoT
L'Agenzia internazionale dell'energia rivede le stime: il picco dei combustibili fossili potrebbe non arrivare nel 2030
Offerta a tempo Amazon: PlayStation 5 a 399€ e PS5 Pro a 769,99€ — scorte limitate, corri!
Google allenta le norme di sicurezza su Android: sarà possibile installare app non verificate, ma a proprio rischio
Offerta lampo su Amazon: Samsung Galaxy A56 5G a soli 299,90€ con scorte limitate, un prezzo speciale per essere un Galaxy
Rockstar accusata di licenziamenti illegali: il sindacato IWGB avvia un'azione legale nel Regno Unito
Steam Frame ponte tra Windows e Android: giochi PC e mobile in un'unica libreria









16 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infol'unico pan lo fa con l'immagine del mare.
https://www.youtube.com/watch?v=QOlPNZzneGw
https://www.youtube.com/watch?v=qHepKd38pr0
E' come se Deckard aka Harrison Ford si spostasse all'interno di un ambiente 3D. Vedasi commenti in quei video e limiti della tecnologia se fosse un vero 'zoom' e non una ricostruzione da AI come in questo caso.
Tuttavia di quelle mostrate nel video dell'articolo, l'unica che è sorprendente è quella che parte in alto a sinistra. Le altre sono delle banalità: ovvio che lungo la spiaggia se alla destra c'è del mare è probabile che spostandosi verso destra ci possa essere del mare. Lo zoom verso quello che appare con un faro con un edificio sulla destra non è niente di particolare.
Poi certo, dipende cosa viene dato in pasto all'AI: se oltre alla foto ha avuto modo di fare training anche con qualche mappa che include quelle foto, non mi stupirebbe nemmeno il primo video in alto a sinistra.
Se parli di google translate, ho visto un nettissimo miglioramento negli ultimi 10 anni. Scrivo e leggo quotidianamente email in inglese e tedesco e se trovo qualche punto oscuro in quelle tedesche le passo per google translate (di solito verso l'inglese, alle volte verso l'italiano) ottenendo solitamente traduzioni piuttosto buone.
Alle volte passo anche le mie in inglese, e le traduco in italiano, se sono email particolarmente importanti: se google le traduce bene, allora grossi errori non ne devo aver fatti. E 9 volte su 10 le traduce in maniera decisamente buona.
Se parli di google translate, ho visto un nettissimo miglioramento negli ultimi 10 anni. Scrivo e leggo quotidianamente email in inglese e tedesco e se trovo qualche punto oscuro in quelle tedesche le passo per google translate (di solito verso l'inglese, alle volte verso l'italiano) ottenendo solitamente traduzioni piuttosto buone.
Alle volte passo anche le mie in inglese, e le traduco in italiano, se sono email particolarmente importanti: se google le traduce bene, allora grossi errori non ne devo aver fatti. E 9 volte su 10 le traduce in maniera decisamente buona.
Guarda vivendo all'estero uso tantissimo la ricerca e le traduzioni in inglese e francese e l'unico servizio decente che ti aiuta nello scrivere frasi piu' o meno complesse é linguee che si basa su deepl. Google translate é uno dei peggiori, come ho scritto sopra alcune traduzioni sono sballate anche se cerchi una singola parola.
Per tradurre un testo, bisogna capire il significato della frase.
Le macchine attuali non sono ancora in grado di farlo.
(ci vorra' ancora del tempo)
Le macchine attuali non sono ancora in grado di farlo.
(ci vorra' ancora del tempo)
eh si appunto, qua si parla di intelligenze artificiali sempre piu' potenti in grado di dipingere, montare un video, giocare a scacchi e imbastire dibattiti su argomenti di ogni genere, poi pero' non riescono ancora a tradurre una frase standard con soggeto e predicato dalla lingua x a quella y.
Non ti seguo, puoi fare un esempio in cui google translator non funziona?
Per quanto riguarda italiano-inglese mi pare ok, qualche volta lo uso per togliermi un dubbio o per tradurre termini che non conosco e mi pare ok.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".