Secondo i primi test, Grok 4 di Elon Musk ha già superato i rivali [Archivio]

Redazione di Hardware Upg

11-07-2025, 13:31

Link alla notizia: https://www.hwupgrade.it/news/web/secondo-i-primi-test-grok-4-di-elon-musk-ha-gia-superato-i-rivali_140977.html

Il nuovo modello AI di xAI ha conquistato i benchmark più duri del settore. Ha, infatti, raggiunto un Intelligence Index pari a 73 secondo ArtificialAnalysis e prestazioni multimodali che secondo Musk surclassano i laureati in ogni disciplina

Click sul link per visualizzare la notizia.

LMCH

11-07-2025, 14:10

Siamo agli stessi livelli di quando 10 anni fa prometteva la guida autonoma per l'anno successivo.

Questa continua antropomorfizzazione dei software LLM è veramente deprimente.

Grok 4 è strutturalmente inaffidabile, come i suoi "colleghi" va usato tenendo conto delle sue limitazioni o si finisce col far danni, non parliamo poi di come Capitan Ketamina sta sperimentando come usarlo a fini memetico-propagandisti.

Ago72

11-07-2025, 14:53

Grok 4 è strutturalmente inaffidabile, come i suoi "colleghi" va usato tenendo conto delle sue limitazioni o si finisce col far danni,

Concordo. Oggi l'IA ha il ruolo di un ottimo neo-assunto primo-impiego*. E' come avere uan schiera di neo assunti, se suddividi il lavoro in piccoli task e li dai a loro da fare e tu controlli, sono un ottimo aiuto.
Ma da quello che ho provato, per task complessi non sono ancora pronti.
E sto parlando di programmazione, risposte mail, aggregazione dati e qualche idea per qualche slide al volo.

*Ma se l'IA farà quei lavori che venivano dati a chi iniziava a lavorare per formarli, come faremo a formare le persone?

Lo Straniero Misterioso

11-07-2025, 16:43

Bah, come se i colleghi non facessero mai ca%%ate sul posto di lavoro... :)

Solo che se la cavolata l'ha fatta Pippo, allora è colpa sua e siamo a posto. Se l'ha fatta Gemini, la colpa e mia è quindi non posso correre il rischio.

Paracubo che non siamo altro! :D

pachainti

11-07-2025, 16:45

Companies That Tried to Save Money With AI Are Now Spending a Fortune Hiring People to Fix Its Mistakes (https://futurism.com/companies-fixing-ai-replacement-mistakes)

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity (https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/)
When developers are allowed to use AI tools, they take 19% longer to complete issues—a significant slowdown that goes against developer beliefs and expert forecasts. This gap between perception and reality is striking: developers expected AI to speed them up by 24%, and even after experiencing the slowdown, they still believed AI had sped them up by 20%.

Manu1976

12-07-2025, 14:30

TorettoMilano

12-07-2025, 14:36

be', è una battaglia all'ultimo sangue, che comunque farà venir fuori IA sempre migliori. quel che san già fare ora è incredibile se chiudo gli occhi e penso a 3 anni fa. e tra 3 anni forse ci sarà della fantascienza ancora inimmaginata.

è il pensiero generale. mi sembra irreale come si possano creare video realistici da un semplice comando di testo, ma anche solo interfacciarsi a un chatbot come se fosse umano è qualcosa di incredibile (anche se non sempre affidabile)