Google annuncia Gemini 2.5, l'IA che ragiona meglio di DeepSeek R1 e OpenAI o3-mini

Il colosso di Mountain View ha lanciato la nuova generazione del suo modello AI, capace di ragionare e affrontare problemi complessi con un approccio più umano. Gemini 2.5 Pro in particolare si posiziona al vertice dei benchmark di settore.
di Nino Grasso pubblicata il 26 Marzo 2025, alle 11:21 nel canale WebGoogleGemini
Google ha annunciato il rilascio di Gemini 2.5, un nuovo modello pensato per elaborare richieste complesse e rispondere in maniera accurata attraverso il ragionamento. La nuova versione, infatti, "pensa" prima di fornire una risposta, un approccio che vuole migliorare significativamente l'accuratezza e la pertinenza dei risultati, riducendo il numero di allucinazioni e risposte errate.
La versione sperimentale di Gemini 2.5 Pro è già disponibile per gli utenti di Google AI Studio e per gli abbonati a Gemini Advanced tramite l'app dedicata. Nei risultati condivisi dall'azienda, il modello si è posizionato al primo posto su LMArena, una piattaforma che valuta le preferenze umane nei confronti delle risposte generate dall'AI, superando la concorrenza con un "margine considerevole". Il risultato suggerisce che Gemini 2.5 sia in grado di produrre output di alta qualità, più vicini alle aspettative e alle preferenze degli utenti umani.
Gemini 2.5 Pro è, secondo i test di Google, l'IA più brava a ragionare
Gemini 2.5 ha dimostrato prestazioni straordinarie in una vasta gamma di benchmark, in particolare nelle aree della matematica, della scienza e della programmazione. Senza ricorrere a tecniche che aumentano i costi computazionali, come il majority voting, Gemini 2.5 Pro ha ottenuto risultati di primo piano in test come GPQA e AIME 2025, sfruttando la sua abilità nel gestire problemi complessi che richiedono un ragionamento avanzato. Nell'esame Humanity's Last Exam, un dataset creato da centinaia di esperti per valutare la frontiera della conoscenza e del ragionamento umano, il modello ha raggiunto un punteggio del 18,8%, il più alto tra i modelli che non utilizzano strumenti esterni.
Anche nel campo della programmazione Google ha compiuto progressi significativi, con il nuovo modello che rappresenta un notevole avanzamento rispetto alla versione 2.0, eccellendo nella creazione di applicazioni web visivamente accattivanti e nello sviluppo di codice agentico. Il modello ha ottenuto un punteggio del 63,8% su SWE-Bench Verified, considerato lo standard di riferimento per le valutazioni di codice agentico, utilizzando una configurazione personalizzata dell'agente. La multimodalità nativa rimane un punto di forza di Gemini, con la capacità di comprendere e processare dati provenienti da diverse fonti, inclusi testo, audio, immagini, video e interi repository di codice.
Combinata con una finestra di contesto estesa fino a 1 milione di token (con piani per arrivare a 2 milioni), questa capacità consente a Gemini 2.5 di affrontare problemi complessi che richiedono l'integrazione di informazioni provenienti da fonti eterogenee. L'approccio basato sul "pensiero" prima dell'azione rappresenta un cambiamento di paradigma nel modo in cui i modelli AI elaborano le informazioni e prendono decisioni e, integrando queste capacità di ragionamento direttamente nel cuore dei suoi modelli, Google vuole creare sistemi AI più consapevoli del contesto ed efficaci per elaborazioni più sofisticate.
Sviluppatori e realtà professionali possono già sperimentare con Gemini 2.5 Pro attraverso Google AI Studio, mentre la disponibilità imminente su Vertex AI promette di ampliare ulteriormente l'accessibilità e l'applicabilità delle più moderne capacità di AI di Big G, in attesa dell'espansione verso un pubblico ancora più ampio.
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoPer cui Goole ha tutto l'interesse a potenziare il suo Gemini altrimenti Goole potrebbe subire un drastico calo del traffico
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".