Redazione di Hardware Upg
11-07-2025, 13:31
Link alla notizia: https://www.hwupgrade.it/news/web/secondo-i-primi-test-grok-4-di-elon-musk-ha-gia-superato-i-rivali_140977.html
Il nuovo modello AI di xAI ha conquistato i benchmark più duri del settore. Ha, infatti, raggiunto un Intelligence Index pari a 73 secondo ArtificialAnalysis e prestazioni multimodali che secondo Musk surclassano i laureati in ogni disciplina
Click sul link per visualizzare la notizia.
Siamo agli stessi livelli di quando 10 anni fa prometteva la guida autonoma per l'anno successivo.
Questa continua antropomorfizzazione dei software LLM è veramente deprimente.
Grok 4 è strutturalmente inaffidabile, come i suoi "colleghi" va usato tenendo conto delle sue limitazioni o si finisce col far danni, non parliamo poi di come Capitan Ketamina sta sperimentando come usarlo a fini memetico-propagandisti.
Grok 4 è strutturalmente inaffidabile, come i suoi "colleghi" va usato tenendo conto delle sue limitazioni o si finisce col far danni,
Concordo. Oggi l'IA ha il ruolo di un ottimo neo-assunto primo-impiego*. E' come avere uan schiera di neo assunti, se suddividi il lavoro in piccoli task e li dai a loro da fare e tu controlli, sono un ottimo aiuto.
Ma da quello che ho provato, per task complessi non sono ancora pronti.
E sto parlando di programmazione, risposte mail, aggregazione dati e qualche idea per qualche slide al volo.
*Ma se l'IA farà quei lavori che venivano dati a chi iniziava a lavorare per formarli, come faremo a formare le persone?
Lo Straniero Misterioso
11-07-2025, 16:43
Bah, come se i colleghi non facessero mai ca%%ate sul posto di lavoro... :)
Solo che se la cavolata l'ha fatta Pippo, allora è colpa sua e siamo a posto. Se l'ha fatta Gemini, la colpa e mia è quindi non posso correre il rischio.
Paracubo che non siamo altro! :D
pachainti
11-07-2025, 16:45
Companies That Tried to Save Money With AI Are Now Spending a Fortune Hiring People to Fix Its Mistakes (https://futurism.com/companies-fixing-ai-replacement-mistakes)
Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity (https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/)
When developers are allowed to use AI tools, they take 19% longer to complete issues—a significant slowdown that goes against developer beliefs and expert forecasts. This gap between perception and reality is striking: developers expected AI to speed them up by 24%, and even after experiencing the slowdown, they still believed AI had sped them up by 20%.
Manu1976
12-07-2025, 14:30
be', è una battaglia all'ultimo sangue, che comunque farà venir fuori IA sempre migliori. quel che san già fare ora è incredibile se chiudo gli occhi e penso a 3 anni fa. e tra 3 anni forse ci sarà della fantascienza ancora inimmaginata.
TorettoMilano
12-07-2025, 14:36
be', è una battaglia all'ultimo sangue, che comunque farà venir fuori IA sempre migliori. quel che san già fare ora è incredibile se chiudo gli occhi e penso a 3 anni fa. e tra 3 anni forse ci sarà della fantascienza ancora inimmaginata.
è il pensiero generale. mi sembra irreale come si possano creare video realistici da un semplice comando di testo, ma anche solo interfacciarsi a un chatbot come se fosse umano è qualcosa di incredibile (anche se non sempre affidabile)
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.