Grok 4 è meglio di un dottorato in 'tuttologia' secondo Elon Musk

xAI ha presentato Grok 4, il nuovo modello AI avanzato che punta a superare la concorrenza con prestazioni multimodali e capacità da "PhD universale". Tuttavia, il lancio è stato condizionato da alcune criticità tra cui, le critiche sulla trasparenza dell'azienda e le dimissioni del CEO di X
di Vittorio Rienzo pubblicata il 10 Luglio 2025, alle 18:58 nel canale WebGrokxAIIntelligenza Artificiale
xAI, la compagnia guidata da Elon Musk impegnata nello sviluppo del modello AI Grok, ha annunciato il lancio ufficiale di Grok 4. La presentazione, avvenuta in diretta streaming, è stata condotta dallo stesso Musk, che ha definito il modello come "più intelligente di quasi tutti gli studenti laureati in tutte le materie contemporaneamente".
Introducing Grok 4, the world's most powerful AI model.
— Engineering (@XEng) July 10, 2025
Watch the livestream with @elonmusk and the @xAI team now. https://t.co/Mjt6w21qwd
Secondo i dati divulgati durante la presentazione, Grok 4 ha ottenuto risultati superiori nei principali benchmark di riferimento, come Humanity's Last Exam, GPQA, AIME25 e ARC-AGI-2, superando i concorrenti più diretti come Gemini 2.5 Pro (Google), o3 (OpenAI) e Claude Opus 4 (Anthropic). In particolare, nel test ARC-AGI-2, basato su puzzle visivi, Grok 4 ha raggiunto il 16,2%, quasi il doppio rispetto al precedente leader.
Oltre alla versione base, xAI ha presentato Grok 4 Heavy, una variante definita "multi-agente" in cui diversi sottosistemi analizzano simultaneamente un problema per confrontare e selezionare la risposta più coerente. L'accesso a questa versione è riservato agli utenti del nuovo piano SuperGrok Heavy, proposto a 300 dollari al mese. Il piano standard da 30 dollari mensili consente l'uso di Grok 4 base, mentre la versione gratuita resta limitata a Grok 3.
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
— Elon Musk (@elonmusk) July 10, 2025
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question. https://t.co/vB6NUOZTOX
Musk ha evidenziato le capacità multimodali di Grok 4, in grado di operare su testi, immagini e audio. Una delle dimostrazioni ha incluso l'analisi di videogiochi e l'integrazione con Polymarket, una piattaforma Ethereum per scommesse predittive, utilizzando dati in tempo reale da X. Inoltre, ha accennato a un'espansione futura verso agenti autonomi e generatori video, previsti tra agosto e ottobre.
Tuttavia, il lancio non è avvenuto senza ombre. Pochi giorni prima della presentazione, l'account automatizzato di Grok su X ha diffuso contenuti che lodavano Adolf Hitler e criticavano figure ebraiche di Hollywood. Il sistema aveva infatti subito modifiche per produrre risposte meno "politicamente corrette", provocando reazioni immediate da parte dell'Anti-Defamation League e costringendo xAI a rivedere il prompt di sistema.
After two incredible years, I’ve decided to step down as CEO of 𝕏.
— Linda Yaccarino (@lindayaX) July 9, 2025
When @elonmusk and I first spoke of his vision for X, I knew it would be the opportunity of a lifetime to carry out the extraordinary mission of this company. I’m immensely grateful to him for entrusting me…
A peggiorare la situazione, sono arrivate le dimissioni di Linda Yaccarino, CEO di X, sollevando interrogativi su una possibile connessione tra l'episodio e l'abbandono. Le critiche, inoltre, non hanno risparmiato la mancanza di trasparenza: al momento non è stata rilasciata alcuna documentazione tecnica approfondita, il che fornisce ad analisti e osservatori pochi strumenti per una valutazione indipendente.
L'economista e docente Ethan Mollick ha espresso perplessità sulla possibilità che aziende adottino un sistema con così poca documentazione tecnica, nonostante abbia definito i risultati di Grok 4 "impressionanti". Secondo lui, l'aumento delle performance è coerente con le Scaling Laws, ma non basta a colmare le lacune in ambito etico e informativo.
Nel contesto di una crescente corsa globale allo sviluppo di modelli pionieristici, Grok 4 si posiziona come un diretto rivale di GPT-5, atteso entro la fine dell'estate. Tuttavia, la sfida di xAI non è solo tecnologica, ma anche reputazionale, e sarà il tempo a stabilire se l'ambizioso progetto riuscirà a mantenere la sua promessa di rivoluzionare l'intelligenza artificiale.
8 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoSono passati al comando.
Purtroppo ancora non si puo' usare dall'UE, e non ho voglia di sbattermi con VPN TOR o simili
Come le racconta lui le favole nessuno ci riesce
Musk come raccontatore di balle è il numero 1 da parecchio
https://x.com/jeremyphoward/status/1943436621556466171
In pratica Grok 4 è stato militantizzato con "post e pensieri" di Capitan Ketamina.
Mah, tra lui e il suo ex migliore amico Trump non so chi primeggi nello sparare cazzate.... e più le sparano grosse più aumenta il consenso.
proprio stamani mi è capitato di imbattermi in questo articolo di Massimo Polidoro Elon Musk non è uno scienziato
https://x.com/jeremyphoward/status/1943436621556466171
In pratica Grok 4 è stato militantizzato con "post e pensieri" di Capitan Ketamina.
Mi pare si sia parlato che addirittura ha provato a rispondere non solo con il stesso stile sarcastico ma ha risposto proprio in prima persona ad alcune domande su Elon Musk, insomma come se fosse il suo clone digitale...
che poi ad una rapidissima ricerca leggo che "Grok usa come fonte i post di Elon Musk per rispondere a domande su temi controversi: i test su guerra a Gaza, aborto e immigrazione"
Non credo che Elon abbia le competenze per sviluppare l'architettura di training di un modello di intelligenza artificiale e non credo nemmeno che si sia messo lì a preparare il dataset...
Avrà messo i soldi (tanti) per l'infrastruttura e bon.
P.S.: lasciate stare la politica, che c'entra come i cavoli a merenda...
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".