Google Gemini 1.5 ufficiale: il nuovo modello IA promette prestazioni straordinarie
Google ha annunciato Gemini 1.5, la nuova versione del suo modello di intelligenza artificiale generativa. La nuova tecnologia può sfruttare una finestra di contesto che può arrivare fino a 1 milione di token, consentendo al modello di elaborare una quantità di informazioni senza precedenti.
di Nino Grasso pubblicata il 16 Febbraio 2024, alle 09:31 nel canale WebGoogleGemini
Google fa un altro passo avanti nella corsa all'intelligenza artificiale annunciando Gemini 1.5, la nuova versione del suo modello linguistico di grandi dimensioni. Solo la scorsa settimana l'azienda aveva annunciato la variante Ultra più avanzata di Gemini 1.0, ma la nuova versione promette novità importanti sia in termini di performance che di funzionalità.
Le caratteristiche di Gemini 1.5 sono state svelate all'interno di un lungo post sul blog ufficiale firmato anche dal CEO Sundar Pichai, che ne ha sottolineato i miglioramenti in efficienza e comprensione del contesto. Il primo modello che verrà reso disponibile per i test sarà Gemini 1.5 Pro, che può offrire prestazioni paragonabili alla versione Ultra del modello attuale, cioè la variante top di gamma, pur richiedendo meno risorse computazionali. Ciò è stato ottenuto grazie ad una nuova architettura, chiamata Mixture-of-Experts, che attiva selettivamente solo i percorsi neurali più rilevanti per l'input fornito.
Google annuncia Gemini 1.5 Pro, e le novità sembrano molto promettenti
Ma la novità probabilmente più interessante del nuovo modello linguistico è l'introduzione di una finestra contestuale che può arrivare fino al milione di token. Si tratta di un incremento di grandezza esponenziale rispetto ai modelli precedenti: basti pensare che GPT-4 Turbo di OpenAI arriva a 128.000 token e Gemini 1.0 Pro a 32.000. Per rendere l'idea, Google ha spiegato che 1 milione di token corrisponde a "10-11 ore di video o decine di migliaia di righe di codice" elaborate contemporaneamente.
Grazie a questa caratteristica, Gemini 1.5 Pro è in grado di analizzare, classificare e riassumere enormi quantità di contenuti forniti. Ad esempio, Google gli ha fornito un documento di 402 pagine della missione Apollo 11 e il modello è riuscito a ragionare su conversazioni, eventi e dettagli menzionati identificando elementi rilevanti. Lo stesso vale per i contenuti multimediali: Gemini 1.5 Pro può analizzare accuratamente trama ed eventi in un film muto di 44 minuti, cogliendo anche piccoli particolari. L'azienda ha testato il modello con Sherlock Jr. di Buster Keaton.
Anche le capacità di problem solving e ragionamento su codice di programmazione traggono beneficio dai nuovi limiti per la finestra contestuale. Fornendogli 100 mila righe di codice, nei test preliminari condotti da Google Gemini 1.5 Pro è riuscito a fornire modifiche utili e spiegare il funzionamento di diverse parti, mostrando una comprensione approfondita.
Il modello "mid-size" Gemini 1.5 Pro è attualmente disponibile solo per gli utenti aziendali e gli sviluppatori via Vertex AI e AI Studio di Google. In seguito, quando sarà pronto per la distribuzione pubblica, sostituirà Gemini 1.0 Pro (attualmente usato su gemini.google.com e nelle app dell'azienda) con una finestra contestuale di 128.000 token. La versione con supporto alla finestra contestuale più estesa è attualmente fornita gratuitamente in test a un "gruppo limitato di sviluppatori e clienti enterprise", e verrà resa disponibile per tutti in futuro a pagamento. La sfida attuale è capire come gestire latenza e prestazioni su volumi di dati così elevati, ma il potenziale in termini di nuove applicazioni è chiaramente straordinario.
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".