Google Gemini: il video di presentazione è ingannevole, la realtà è diversa
Durante la presentazione di Google Gemini, il nuovo modello di Intelligenza Artificiale, la società ha mostrato un video sorprendente di interazione uomo-macchina. La realtà è però diversa e il video è stato sostanzialmente modificato.
di Mattia Speroni pubblicata il 09 Dicembre 2023, alle 18:08 nel canale WebGeminiGoogleAIChatGPTOpenAI
In questi mesi si è fatto un gran parlare di Intelligenza Artificiale sotto diversi aspetti, con molte perplessità sul suo utilizzo, problematiche di tipo legale e possibili pericoli per l'umanità (ma anche potenzialità in senso positivo). Tra i nomi più ricorrenti c'è sicuramente ChatGPT (anche se non è l'unico) e non solo per le problematiche manageriali che hanno coinvolto OpenAI nelle scorse settimane ma anche perché viene ritenuto il "metro di paragone" sia dagli utilizzatori che dalla concorrenza. Un esempio è quello di Google che, durante la presentazione di Gemini, ha mostrato dei confronti proprio con ChatGPT per mostrare come la sua soluzione fosse in generale superiore.
In particolare il video (visibile qui sopra) che mostra l'interazione tra esseri umani e modello di Intelligenza Artificiale Google Gemini è sicuramente impressionante. Ma proprio quel filmato presenta un problema di fondo: non fa apparire come avviene effettivamente l'interazione tra IA e persona in quanto il video è stato montato per farlo apparire "più bello" di quello che è in realtà. Non si è trattato solo di accelerare i tempi di risposta per questioni di tempo. Quel particolare è chiaro ed esplicitato da Google stessa che riporta nelle note "ai fini di questa demo, la latenza è stata ridotta e gli output di Gemini sono stati abbreviati per brevità".
Il video di presentazione di Google Gemini
Nel video si vede un'interazione sorprendente tra umano e Gemini con una serie di prove differenti alle quali l'Intelligenza Artificiale risponde in maniera coerente superando decisamente le aspettative. Come chiarito successivamente, e come visibile sul blog della società dedicato agli sviluppatori, l'interazione è avvenuta in maniera differente.

Innanzitutto viene impiegata la versione Ultra, descritta come "il nostro modello più grande e potente, per compiti altamente complessi", che non è ancora ufficialmente disponibile e che potrebbe arrivare in futuro (all'inizio del prossimo anno, secondo quanto dichiarato). Attualmente quindi un utente "standard" non può impiegare questa versione e non può quindi fare un confronto con ChatGPT o altri modelli (è possibile solo per un selezionato gruppo di utenti/società per via della fase di test).

In secondo luogo non è mai esistita effettiva interazione vocale tra umano e modello IA. Il filmato dimostrativo (senza interazione con l'IA) è stato registrato prima e poi solo alcuni fotogrammi presi dallo stesso sono stati impiegati per generare le risposte di Gemini. Ma non solo. Insieme alle immagini veniva dato un input (spesso molto specifico) per cercare di indirizzare la risposta dell'Intelligenza Artificiale per trovare la risposta corretta. Come indicato sopra, questo è più chiaro osservando il post sul blog per gli sviluppatori di Google.
Certo, la società statunitense non lo ha effettivamente nascosto (la presenza stessa del post per gli sviluppatori lo rende chiaro) ma neanche esplicitato in maniera chiara mostrando il video "Hands-on with Gemini". Le reazioni sono state le più diverse, ma in generale negative. Proprio queste reazioni hanno portato Oriol Vinyals (VP of Research & Deep Learning Lead e Gemini co-lead) a scrivere un post su X tra le altre affermazioni che "il video illustra come potrebbero essere le esperienze utente multimodali realizzate con Gemini. L'abbiamo realizzato per ispirare gli sviluppatori".
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
— Oriol Vinyals (@OriolVinyalsML) December 7, 2023
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP
Vinyals ha aggiunto che le interazioni sono comunque reali e la base dei test è reale e quindi gli utenti avranno risposte simili. L'esperienza sarà comunque diversa, almeno in questa prima fase. Una prima prova di ChatGPT (3.5 e 4.0 Turbo) e Gemini (in versione Pro e non Ultra) è stata realizzata da ArsTechnica mostrando che sì, Google ha fatto un buon passo in avanti rispetto a PaLM (che precedeva Gemini), ma che ChatGPT rimane in generale migliore per diversi aspetti e che la strada di Google per riuscire a competere nel campo dei modelli di Intelligenza Artificiale è ancora lunga e gli avversari non staranno certo a guardare. In futuro l'esperienza utente con le IA sarà come mostrato nel video promozionale del colosso statunitense? Possibile. Ma attualmente la realtà è un po' diversa.










Nutanix: innovazione, semplicità e IA al centro della strategia hybrid multicloud
Lenovo LOQ 15i Gen 10 (15IRX10) alla prova: il notebook gaming 'budget' che non ti aspetti
Due mesi di Battlefield 6: dalla campagna al battle royale, è l'FPS che stavamo aspettando
Pebble torna in scena con Index 01: lo smart ring minimalista per registrare memo vocali
Microsoft promette: Windows 11 sarà il 'miglior posto per giocare'
Dreame e le promozioni natalizie: pulizia senza fatica e con grandi risparmi
La Stark Varg EX elettrica stabilisce un nuovo record mondiale, su un vulcano attivo
Il gorilla che ''batte il cinque'' è la foto vincitrice dei Nikon Comedy Wildlife Awards 2025
Mega sconto Amazon Haul: –50% comprando 2 articoli, ecco come sfruttare l'offerta
Arrestato hacker diciannovenne: è sospettato di aver trafugato 64 milioni di dati
Ogni giorno sconti nuovi: Amazon sfida la concorrenza con prezzi mai visti durante l'anno ecco le novità (aggiornamenti costanti)
Speciale Arlo: sicurezza smart al top, ora a prezzi come al Black Friday
Sconti folli sul gaming: PS5, Meta Quest 3S, monitor OLED e accessori top ai prezzi più bassi dell'anno
Stellantis tenta il colpaccio: porta la Fiat Topolino negli Stati Uniti
Il nuovo HONOR Magic 8 Lite è ufficiale: buone specifiche e una super batteria per la fascia media
Super sconti Ring: videocitofoni, allarmi e telecamere smart a prezzi minimi su Amazon
Blink esplode di sconti: videocamere smart fino a due anni di autonomia ai prezzi più bassi del momento









24 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infohttps://www.youtube.com/watch?v=rI0X6be5zC4
La cosa che è sbagliata è cercare di farle passare per qualcosa di già pronto e fruibile adesso quando non è così.
Sono impressionanti le possibilità ma è tutto a uno stato embrionale, la moda passerà ma sono certo che resterà in lavorazione per poi ritornare tra 20 anni o quel che sarà qaundo la tecnologia sarà matura.
Un po' come è successo con la realtà virtuale.
Sono impressionanti le possibilità ma è tutto a uno stato embrionale, la moda passerà ma sono certo che resterà in lavorazione per poi ritornare tra 20 anni o quel che sarà qaundo la tecnologia sarà matura.
Un po' come è successo con la realtà virtuale.
La strategia corretta è quella seguita da Microsoft e non si tratta di fanboysmo dato che non mi ricordo nemmeno l'ultima volta che ho avviato Windows
Si chiama "copilot" perchè chi guida sei tu, l'IA serve solo a darti una mano ed è già fruibile ora per diversi compiti d'ufficio.
Non si tratta di una moda passeggera come VR, qui ci sono in ballo investimenti di diversi ordini di grandezza superiori. L'IA generativa è qui per rimanere
Sono impressionanti le possibilità ma è tutto a uno stato embrionale, la moda passerà ma sono certo che resterà in lavorazione per poi ritornare tra 20 anni o quel che sarà qaundo la tecnologia sarà matura.
Un po' come è successo con la realtà virtuale.
Non credo che sia una moda sinceramente eh
https://www.youtube.com/watch?v=rI0X6be5zC4
Citando Emilio Fede "Che figura di merda" davvero, mi pare che Google sia indifendibile.
O peggio che superi le aspettative, tanto che molti qui gridano già a Skynet al grande fratello GBT o perfino farne una divinità con tanto di culto...
Forse non hai capito che c'è già tanta gente che lavora con l'IA di fianco, è una realtà, non si tratta di promesse. Per esempio chiunque faccia il programmatore dovrebbe usarla, non si tratta di competenze, semplicemente si può evitare di passare ore nei meandri di stackoverflow per trovare la soluzione a un problema, oppure far funzionare una libreria documentata coi piedi.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".