Torna indietro   Hardware Upgrade Forum > Hardware Upgrade > News

HONOR Magic V5: il pieghevole ultra sottile e completo! La recensione
HONOR Magic V5: il pieghevole ultra sottile e completo! La recensione
Abbiamo provato per diverse settimane il nuovo Magic V5 di HONOR, uno smartphone pieghevole che ci ha davvero stupito. Il device è il più sottile (solo 4.1mm) ma non gli manca praticamente nulla. Potenza garantita dallo Snapdragon 8 Elite, fotocamere di ottima qualità e batteria in silicio-carbonio che garantisce un'ottima autonomia. E il Prezzo? Vi diciamo tutto nella nostra recensione completa.
Recensione Google Pixel 10 Pro XL: uno zoom 100x assurdo sempre in tasca (e molto altro)
Recensione Google Pixel 10 Pro XL: uno zoom 100x assurdo sempre in tasca (e molto altro)
Google Pixel 10 Pro XL è il top di gamma della serie Pixel, presentando un ampio display Super Actua da 6.8 pollici insieme alle novità della serie, fra cui la ricarica wireless magnetica Pixelsnap e le nuove funzionalità AI avanzate. Il comparto fotografico include un sistema a tripla fotocamera con zoom Pro Res fino a 100x, mentre il processore Tensor G5 con 16GB di RAM garantisce prestazioni percepite molto elevate su Android.
Lenovo IdeaPad Slim 3: un notebook Snapdragon X economico
Lenovo IdeaPad Slim 3: un notebook Snapdragon X economico
Forte della piattaforma Qualcomm Snapdragon X, il notebook Lenovo IdeaPad Slim 3 riesce a coniugare caratteristiche tecniche interessanti ad uno chassis robusto, con autonomia di funzionamento a batteria che va ben oltre la tipica giornata di lavoro. Un notebook dal costo accessibile pensato per l'utilizzo domestico o in ufficio, soprattutto con applicazioni native per architettura ARM
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 05-08-2025, 12:17   #1
Redazione di Hardware Upg
www.hwupgrade.it
 
Iscritto dal: Jul 2001
Messaggi: 75173
Link alla notizia: https://www.hwupgrade.it/news/web/l-...nk_141940.html

Google ha rilasciato Gemini 2.5 Deep Think, il suo modello AI più avanzato, ora disponibile per gli abbonati AI Ultra. Basato su un'architettura multi-agente, il modello ha già superato Grok 4 di xAI e o3 di OpenAI

Click sul link per visualizzare la notizia.
Redazione di Hardware Upg è offline   Rispondi citando il messaggio o parte di esso
Old 05-08-2025, 12:41   #2
BadBoy80
Senior Member
 
L'Avatar di BadBoy80
 
Iscritto dal: Aug 2006
Città: Noale
Messaggi: 3726
42
BadBoy80 è offline   Rispondi citando il messaggio o parte di esso
Old 05-08-2025, 12:54   #3
Unrue
Senior Member
 
L'Avatar di Unrue
 
Iscritto dal: Nov 2002
Messaggi: 5986
Non è una novità il reasoning negli LLM...
Unrue è offline   Rispondi citando il messaggio o parte di esso
Old 05-08-2025, 15:19   #4
Nemios
Senior Member
 
L'Avatar di Nemios
 
Iscritto dal: Oct 2004
Messaggi: 1431
Quote:
Originariamente inviato da BadBoy80 Guarda i messaggi
42
Infatti! Non c'era bisogno di "esplorare simultaneamente molteplici ipotesi prima di formulare una risposta definitiva" quando questa è già stata ottenuta.
__________________

Notebook: Ryzen 5 3500U, 12GB DDR4, Radeon Vega 8, Windows 10 Home e Linux Mint Debian Edition (Lenovo IdeaPad 3 15ADA05)
Console : Nintendo Wii & 2DS
Nemios è offline   Rispondi citando il messaggio o parte di esso
Old 05-08-2025, 16:39   #5
randorama
Senior Member
 
Iscritto dal: Sep 2013
Messaggi: 9107
Quote:
Originariamente inviato da Nemios Guarda i messaggi
Infatti! Non c'era bisogno di "esplorare simultaneamente molteplici ipotesi prima di formulare una risposta definitiva" quando questa è già stata ottenuta.
a quale domanda?
randorama è offline   Rispondi citando il messaggio o parte di esso
Old 05-08-2025, 18:34   #6
supertigrotto
Senior Member
 
Iscritto dal: Aug 2006
Città: Valdagno
Messaggi: 5222
Per ora sarà gratis la IA di base ma prepariamoci a un futuro di abbonamenti.
Almeno che non ci salverà la IA locale dei nostri PC
supertigrotto è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 10:10   #7
pachainti
Senior Member
 
Iscritto dal: May 2020
Messaggi: 919
Ancora con questa storia del ragionamento? Gli LLM sono generatori di stronzate: chatGPT is bullshit

Rodney Brooks’ Three Laws of Artificial Intelligence
Three laws of Artificial Intelligence, about how people perceive AI systems, about how they operate in the world and how difficult it is to make them general purpose in any sense.
1) When an AI system performs a task, human observers immediately estimate its general competence in areas that seem related. Usually that estimate is wildly overinflated.
2) Most successful AI deployments have a human somewhere in the loop (perhaps the person they are helping) and their intelligence smooths the edges.
3) Without carefully boxing in how an AI system is deployed there is always a long tail of special cases that take decades to discover and fix. Paradoxically all those fixes are AI-complete themselves.


Giugno 2025 LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? We introduce LiveCodeBench Pro, a benchmark composed of problems from Codeforces, ICPC, and IOI that are continuously updated to reduce the likelihood of data contamination. A team of Olympiad medalists annotates every problem for algorithmic categories and conducts a line-by-line analysis of failed model-generated submissions. Using this new data and benchmark, we find that frontier models still have significant limitations: without external tools, the best model achieves only 53% pass@1 on medium-difficulty problems and 0% on hard problems, domains where expert humans still excel. We also find that LLMs succeed at implementation-heavy problems but struggle with nuanced algorithmic reasoning and complex case analysis, often generating confidently incorrect justifications. High performance appears largely driven by implementation precision and tool augmentation, not superior reasoning.


Giugno 2025 The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity
Through extensive experimentation across diverse puzzles, we show that frontier LRMs face a complete accuracy collapse beyond certain complexities.
Moreover, they exhibit a counter- intuitive scaling limit: their reasoning effort increases with problem complexity up to a point, then declines despite having an adequate token budget. By comparing LRMs with their standard LLM counterparts under equivalent inference compute, we identify three performance regimes: (1) low- complexity tasks where standard models surprisingly outperform LRMs, (2) medium-complexity tasks where additional thinking in LRMs demonstrates advantage, and (3) high-complexity tasks where both models experience complete collapse.


Marzo 2025 Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad
Our results reveal that all tested models struggled significantly: only Gemini-2.5-Pro achieves a non-trivial score of 25%, while all other models achieve less than 5%. Through detailed analysis of reasoning traces, we identify the most common failure modes and find several unwanted artifacts arising from the optimization strategies employed during model training. Overall, our results suggest that current LLMs are inadequate for rigorous mathematical reasoning tasks, highlighting the need for substantial improvements in reasoning and proof generation capabilities.

Aprile 2025 Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics
Our study reveals that current LLMs fall significantly short of solving challenging Olympiad-level problems and frequently fail to distinguish correct mathematical reasoning from clearly flawed solutions. Our analyses demonstrate that the occasional correct final answers provided by LLMs often result from pattern recognition or heuristic shortcuts rather than genuine mathematical reasoning. These findings underscore the substantial gap between LLM performance and human expertise in advanced mathematical reasoning and highlight the importance of developing benchmarks that prioritize the soundness of the reasoning used to arrive at an answer rather than the mere correctness of the final answers.
__________________
Nel tempo dell'inganno universale, dire la verità è un atto rivoluzionario. George Orwell

Il vero valore di una persona non si misura dai valori in cui sostiene di credere, ma da che cosa è disposto a fare per proteggerli. Se non pratichi i valori in cui credi, probabilmente non ci credi fino in fondo. Edward Snowden

Coloro che rinuncerebbero alla libertà essenziale, per acquistare un po' di sicurezza temporanea, non meritano né libertà né sicurezza. Benjamin Franklin

Ultima modifica di pachainti : 08-08-2025 alle 10:13.
pachainti è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 11:06   #8
aqua84
Senior Member
 
L'Avatar di aqua84
 
Iscritto dal: Jan 2010
Messaggi: 7374
NON RAGIONANO, avranno semplicemente messo un timer di attesa prima di dare la risposta immediata, per simulare il ragionamento.
__________________
Telegram: @shutter1sland
aqua84 è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 12:57   #9
Unrue
Senior Member
 
L'Avatar di Unrue
 
Iscritto dal: Nov 2002
Messaggi: 5986
Quote:
Originariamente inviato da aqua84 Guarda i messaggi
NON RAGIONANO, avranno semplicemente messo un timer di attesa prima di dare la risposta immediata, per simulare il ragionamento.
Magari non come noi, ma se vedi l'intera cosiddetta "chain of thoughts" direi che ci si avvicina parecchio.
Unrue è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 13:08   #10
TheDarkAngel
Senior Member
 
L'Avatar di TheDarkAngel
 
Iscritto dal: Jun 2001
Città: Pavia
Messaggi: 24902
Quote:
Originariamente inviato da Unrue Guarda i messaggi
Magari non come noi, ma se vedi l'intera cosiddetta "chain of thoughts" direi che ci si avvicina parecchio.
che è la differenza tra ragionare e non ragionare un'imitazione formale del workflow non la rende capace anche solo di avvicinarsi al processo originario, non la rende pensante e non è una questione prettamente filosofica
__________________
//\\ Vendo => Noctua NF-A12x25 PWM
TheDarkAngel è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 13:21   #11
Unrue
Senior Member
 
L'Avatar di Unrue
 
Iscritto dal: Nov 2002
Messaggi: 5986
Quote:
Originariamente inviato da TheDarkAngel Guarda i messaggi
che è la differenza tra ragionare e non ragionare un'imitazione formale del workflow non la rende capace anche solo di avvicinarsi al processo originario, non la rende pensante e non è una questione prettamente filosofica
Ma che importa? Ti dà o no quello che chiedi? Non c'è scritto da nessuna parte che debbano "ragionare" come noi, sono macchine. E ti mostra anche come fa.

Ultima modifica di Unrue : 08-08-2025 alle 13:24.
Unrue è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 13:29   #12
TheDarkAngel
Senior Member
 
L'Avatar di TheDarkAngel
 
Iscritto dal: Jun 2001
Città: Pavia
Messaggi: 24902
Quote:
Originariamente inviato da Unrue Guarda i messaggi
Ma che importa? Ti dà o no quello che chiedi? Non c'è scritto da nessuna parte che debbano lavorare come noi. E ti mostra anche come fa.
Il problema è proprio lì, non mi dà quello che cerco proprio perchè ogni output lo devo revisionare dato che le parole che associa in libertà non hanno alcun vaglio di logicità.
Questo lo vedo letteralmente tutti i giorni, mi spaccia le sintassi di un database per un altro, come se fossero intercambiabili quando anche il più scemo dei junior non farebbe questo errore, perchè è inesperto ma tendenzialmente è un umano dal QI che supera quello di una scimmia morta.
__________________
//\\ Vendo => Noctua NF-A12x25 PWM
TheDarkAngel è offline   Rispondi citando il messaggio o parte di esso
Old 08-08-2025, 14:48   #13
Unrue
Senior Member
 
L'Avatar di Unrue
 
Iscritto dal: Nov 2002
Messaggi: 5986
Quote:
Originariamente inviato da TheDarkAngel Guarda i messaggi
Il problema è proprio lì, non mi dà quello che cerco proprio perchè ogni output lo devo revisionare dato che le parole che associa in libertà non hanno alcun vaglio di logicità.
Questo lo vedo letteralmente tutti i giorni, mi spaccia le sintassi di un database per un altro, come se fossero intercambiabili quando anche il più scemo dei junior non farebbe questo errore, perchè è inesperto ma tendenzialmente è un umano dal QI che supera quello di una scimmia morta.
Dipende che modelli usi. Quelli gratis sono sempre meno performanti. Ma comunque non è questione di ragionare o meno, qualunque significato gli si voglia dare, è che sono in continua evoluzione e tutt'altro che perfetti. Anche un umano può fare un ragionamento ad cazzum, anzi...
Unrue è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


HONOR Magic V5: il pieghevole ultra sottile e completo! La recensione HONOR Magic V5: il pieghevole ultra sottile e co...
Recensione Google Pixel 10 Pro XL: uno zoom 100x assurdo sempre in tasca (e molto altro) Recensione Google Pixel 10 Pro XL: uno zoom 100x...
Lenovo IdeaPad Slim 3: un notebook Snapdragon X economico Lenovo IdeaPad Slim 3: un notebook Snapdragon X ...
Recensione OnePlus Watch 3 43mm: lo smartwatch che mancava per i polsi più piccoli Recensione OnePlus Watch 3 43mm: lo smartwatch c...
BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura BOOX Note Air4 C è uno spettacolo: il tab...
HONOR Magic V5: la collaborazione con Qu...
Spyware su iPhone: WhatsApp e bug iOS 18...
Roscosmos: RSC Energia smentisce la cris...
Da 309€ a 549€, fino a 32GB di RAM: ecco...
Beats mai così convenienti: sconti fino ...
Da 27,78€ a 56,99€: 5 accessori indispen...
3 minuti: è il tempo per vedere l...
Gli Amazfit sono ora gli smartwatch più ...
Rowenta alza la posta: scopa elettrica s...
6 robot per le pulizie completi in offer...
Friggitrice ad aria Cecofry Full InoxBla...
iPhone 16 Pro Max a 10€ in più del minim...
Una chiavetta USB, ma SanDisk Ultra Slid...
La bolla dell'AI: perché l'econom...
Lo smartphone dovrebbe essere usato solo...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 07:27.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v
1