Deepfake, Intel può identificarli in tempo reale senza sbagliare (o quasi)

Deepfake, Intel può identificarli in tempo reale senza sbagliare (o quasi)

Intel ha presentato un "rilevatore di deepfake" in tempo reale chiamato FakeCatcher. La tecnologia analizza il "flusso sanguigno" nei pixel video per restituire risultati in millisecondi con una precisione del 96%.

di pubblicata il , alle 10:01 nel canale Web
Intel
 

L'intelligenza artificiale può essere di grande aiuto per l'umanità, ma allo stesso tempo può rappresentare un grande problema. Può aiutarci ad affrontare le sfide globali, ma anche annientarci. Prendete i deepfake, video in cui viene riprodotta una persona in modo praticamente indistinguibile dalla realtà per farle dire, con voce identica a quella della persona vera, cose che non pensa e che non ha mai pronunciato.

Gli esperimenti con i deepfake sono molteplici e i risultati migliorano anno dopo anno, rendendo difficile distinguere cos'è vero e cos'è falso. Qualcuno potrebbe far dichiarare a un capo di Stato guerra a un'altra nazione. In un momento di fortissime tensioni politiche tra superpotenze come quello attuale, si può ben capire che una parola fuori posto benché falsa potrebbe far precipitare la situazione.

Ed è forse pensando a questo scenario (ma non solo) che in casa Intel hanno creato FakeCatcher, una tecnologia che può rilevare i video falsi con una precisione del 96%. Non solo, la piattaforma anti-deepfake è in grado di farlo in tempo reale, con risultati in pochi millisecondi.

"I video deepfake sono ovunque. Probabilmente li hai già visti; video di celebrità che fanno o dicono cose che in realtà non hanno mai fatto", ha dichiarato Ilke Demir, senior staff research scientist degli Intel Labs che ha lavorato con Umur Ciftci della State University of New York di Binghamton sulla tecnologia.

FakeCatcher lavora su un server e s'interfaccia tramite una piattaforma web. Il tutto funziona servendosi di hardware e software di Intel. OpenVino permette di eseguire modelli IA per il rilevamento di volti e punti di riferimento, mentre i blocchi relativi alla computer vision sono stati ottimizzati con Integrated Performance Primitives (una libreria software multi-thread) e OpenCV (un toolkit per l'elaborazione di immagini e video in tempo reale). I blocchi di inferenza sono stati ottimizzati con Deep Learning Boost e Advanced Vector Extensions 512, mentre i blocchi multimediali con Advanced Vector Extensions 2.


Clicca per ingrandire

Gli scienziati si sono affidati anche al progetto Open Visual Cloud per fornire uno stack software integrato per la famiglia di processori Intel Xeon Scalable. Sul lato hardware, la piattaforma di rilevamento in tempo reale può eseguire fino a 72 diversi flussi di rilevamento contemporaneamente su processori Xeon Scalable di terza generazione.

"La maggior parte dei rilevatori basati sul deep learning esamina i dati grezzi per cercare di trovare segni di inautenticità e identificare cosa non va in un video. Al contrario, FakeCatcher cerca indizi autentici nei video reali, valutando ciò che ci rende umani: il sottile "flusso sanguigno" nei pixel di un video. Quando il cuore pompa sangue, le nostre vene cambiano colore. Questi segnali del flusso sanguigno vengono raccolti da tutto il viso e gli algoritmi traducono questi segnali in mappe spaziotemporali. Quindi, utilizzando il deep learning, possiamo rilevare istantaneamente se un video è reale o falso".

Grazie a FakeCatcher le piattaforme di social media potrebbero impedire agli utenti di caricare video deepfake dannosi, mentre le testate giornalistiche potrebbero evitare di amplificare inavvertitamente video manipolati, come quello di Barack Obama all'inizio di questa notizia.

8 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
cignox116 Novembre 2022, 11:29 #1
>>cerca indizi autentici nei video reali, valutando ciò che ci rende umani: il sottile "flusso sanguigno" nei pixel di un video

La cosa piú sorprendente é che siamo arrivati ad un punto in cui quello che 20 anni fa era insulso blabla pseudoscientificheggiante nei film sembra sempre meno insulso.
Tra poco perfino lo zoom infinito di CSI sará cosa comune XD
deggial16 Novembre 2022, 11:56 #2
Originariamente inviato da: cignox1
>>cerca indizi autentici nei video reali, valutando ciò che ci rende umani: il sottile "flusso sanguigno" nei pixel di un video

La cosa piú sorprendente é che siamo arrivati ad un punto in cui quello che 20 anni fa era insulso blabla pseudoscientificheggiante nei film sembra sempre meno insulso.
Tra poco perfino lo zoom infinito di CSI sará cosa comune XD


Ahaha soprattutto quello!
Tra l'altro, fino a qualche anno fa mi occupavo anche di sistemi videosorveglianza comunale, e dovevo proprio dire ai vari comandanti di polizia locale che "no, non funziona come in CSI. non possiamo zoomare così tanto sulle registrazioni"
ninja75016 Novembre 2022, 12:13 #3
Originariamente inviato da: cignox1

Tra poco perfino lo zoom infinito di CSI sará cosa comune XD


certo, telecamera 360P che upscala con DLSS3.0 a 8k
Ultravincent17 Novembre 2022, 06:11 #4
Lo potevo dire anche io che e' un deepfake, non tanto dal video ma dalla voce, che e' leggermente diversa da quella vera di Obama. La tecnologia sta facendo passi da gigante pero'... tra qualche anno penso non potremo piu' affidarci ai video non potendo sapere se siano veri o fake
Uakko17 Novembre 2022, 07:52 #5
Originariamente inviato da: Ultravincent
Lo potevo dire anche io che e' un deepfake, non tanto dal video ma dalla voce, che e' leggermente diversa da quella vera di Obama. La tecnologia sta facendo passi da gigante pero'... tra qualche anno penso non potremo piu' affidarci ai video non potendo sapere se siano veri o fake



Tra qualche tempo, sarà possibile utilizzare la voce originale di un attore, per doppiare se stesso in qualsiasi lingua e un' "intelligenza artificiale" si occuperà di modificare il labiale del video per renderlo sincronizzato alla lingua parlata.
toni.bacan17 Novembre 2022, 11:35 #6
Originariamente inviato da: Uakko
...e un' "intelligenza artificiale" si occuperà di modificare il labiale del video per renderlo sincronizzato alla lingua parlata.

Il passo successivo sarà quello dare un maggiore spessore all'espressione facciale di alcuni attori cani.. e non mi riferisco a Rintintin
aqua8417 Novembre 2022, 12:33 #7
Originariamente inviato da: ninja750
certo, telecamera 360P che upscala con DLSS3.0 a 8k


Ecco il ladro di auto

Link ad immagine (click per visualizzarla)
aqua8417 Novembre 2022, 12:38 #8
Ma volendo è possibile andare ancora piu nel dettaglio Link ad immagine (click per visualizzarla)

Proprio come in CSI...

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^