Crash delle CPU Core causati da tensioni operative elevate, patch del microcode in agosto: la dichiarazione di Intel

Intel ha dichiarato di aver individuato il problema che causa l'instabilità e i crash sui PC con CPU Core di 13a e 14a generazione: all'origine del problema vi sarebbe una "tensione operativa elevata". Un fix, tramite una patch del microcode, è previsto per agosto.
di Manolo De Agostini pubblicata il 23 Luglio 2024, alle 09:11 nel canale ProcessoriCoreRaptor LakeIntel
Intel ha rilasciato un nuovo comunicato ufficiale sull'instabilità dei PC con processori Core di 13a e 14a generazione. Secondo la casa di Santa Clara, il problema è legato a una tensione operativa troppo elevata che sarebbe all'origine dei crash. Di seguito la nota ufficiale tradotta, l'originale la trovate qui:
"Sulla base di un'analisi approfondita dei processori desktop Intel Core di 13a/14a generazione che ci sono stati restituiti a causa di problemi di instabilità, abbiamo determinato che l'elevata tensione di funzionamento causa problemi di instabilità in alcuni processori desktop di 13a/14a generazione. L'analisi dei processori restituiti conferma che la tensione operativa elevata deriva da un algoritmo del microcode che comporta richieste di tensione errate al processore".
"Intel sta distribuendo una patch del microcode che risolve la causa principale dell'esposizione alle tensioni elevate. Stiamo continuando la convalida per garantire che vengano risolti gli scenari di instabilità segnalati a Intel in merito ai processori desktop Core di 13a/14a generazione. Attualmente Intel punta alla metà di agosto per il rilascio della patch ai partner dopo la convalida completa".
"Intel si impegna a risolvere il problema con i propri clienti e continua a chiedere a tutti coloro i quali stanno riscontrando problemi di instabilità sui propri processori desktop Intel Core di 13a/14a generazione di contattare l'assistenza clienti Intel per ulteriore aiuto".
I primi report sull'instabilità delle CPU Core desktop delle ultime generazioni, entrambe basate sull'architettura Raptor Lake, sono iniziati a emergere diversi mesi fa. Intel ha dapprima puntato il dito sui firmware delle motherboard distribuiti dai partner, a suo dire con impostazioni di corrente e tensione troppo spinte, imponendo nuove impostazioni di default. In seguito, Intel ha riscontrato un bug nell'algoritmo eTVB, pur sottolineando che non si trattava dell'origine dei crash. L'azienda ha quindi continuato a indagare e, nell'ultimo periodo, la vicenda ha avuto una recrudescenza con lo sviluppatore Matthew Cassells di Alderon Games che ha sconsigliato pubblicamente le CPU Intel, arrivando a chiederne il richiamo.
Nelle scorse ore l'ultima tappa della vicenda, con un possibile coinvolgimento delle CPU Core di fascia alta mobile che, però, Intel ha negato riconducendo i problemi manifestati a cause comuni legate al funzionamento tra hardware e software.
Tornando al problema delle CPU desktop, gli appassionati sul web stanno già dissezionando la dichiarazione di Intel, avanzando dubbi sull'effettiva risoluzione del problema. Si evidenzia (su X) come nella nota ufficiale Intel affermi che la patch al microcode andrà a risolvere la "causa principale dell'esposizione alle tensioni elevate" e non la causa principale dell'instabilità stessa. Bisognerà quindi vedere se l'aggiornamento al microcode eliminerà definitivamente i problemi di stabilità delle CPU Raptor Lake o se, semplicemente, li mitigherà.
Dando per scontato che sarà risolutivo, per Intel un aggiornamento del microcode è la migliore cose che le potesse capitare. Perché se, invece, il problema fosse a livello di materiali / componenti con possibile degradazione nel corso del tempo, Intel potrebbe essere costretta davvero a operare un richiamo con conseguenti spese milionarie e danno d'immagine - che, a dire il vero, è già stata intaccata.
Rimane da capire se questo fix al microcode avrà una qualche ricaduta prestazionale, ma bisognerà aspettarne la distribuzione per appurarlo. Inoltre, sarebbe interessante avere qualche informazione in più sul problema identificato, in quanto parlare di "tensioni di esercizio elevate" è piuttosto generico.
In ultimo, abbiamo scritto a più riprese che, tra le ipotesi in campo, c'era quella che le CPU Raptor Lake potessero soffrire di degradazione di materiali nel tempo. Ebbene, per quanto Intel non leghi il problema dell'instabilità a quella tesi, ha confermato di aver vissuto in passato un problema di ossidazione di alcuni collegamenti all'interno del processore. A dirlo un rappresentante dell'azienda su Reddit:
"Possiamo confermare che un problema di ossidazione dei collegamenti ha interessato alcuni dei primi processori desktop Core di 13a generazione. Tuttavia, il problema è stato risolto alla radice con miglioramenti della produzione e interventi nel 2023. Abbiamo anche analizzato i rapporti di instabilità sui processori desktop Intel Core di 13a generazione e l'analisi fino ad oggi ha determinato che solo un piccolo numero di segnalazioni può essere collegato al problema di produzione".
"Per quanto riguarda il problema dell'instabilità, stiamo fornendo una patch del microcode che risolve l'esposizione a tensioni elevate, elemento chiave del problema. Stiamo attualmente convalidando la patch del microcode per garantire che i problemi di instabilità della 13a/14a generazione vengano risolti".
AGGIORNAMENTO
Secondo Igor's Lab, Intel starebbe ancora indagando sulle cause dell'instabilità dei chip Raptor Lake. Le tensioni operative elevate non sarebbero la vera causa del problema o, comunque, non l'unica.
Secondo la documentazione ottenuta da Igors' Lab, nei suoi test interni Intel avrebbe osservato un aumento significativo della tensione operativa minima (Vmin) su più core nei chip instabili restituiti dai clienti.
L'elevata tensione minima di funzionamento sarebbe causata da condizioni di "tensione elevata, alta frequenza e temperatura elevata". La tensione operativa minima sopra i livelli di guardia avrebbe ripercussioni sui chip anche in condizioni di idle.
Intel, inoltre, avrebbe osservato tensioni elevate sporadiche quando i chip Raptor Lake escono dallo stato di basso consumo per eseguire operazioni in background prima di entrare nuovamente in uno stato di basso consumo.
Per risolvere il problema, l'aggiornamento del microcode di Intel limiterà le richieste VID al di sopra di 1,55 V per correggere i problemi legati alla tensione. Questa modifica non dovrebbe avere un grande impatto sulle prestazioni, anche se Intel afferma che sono necessarie ulteriori analisi per verificare se l'aggiornamento riuscirà a mitigare completamente tutti i problemi di instabilità dovuti ai motivi sopra citati.
Secondo Tom's Hardware USA, il microcode che sarà rilasciato a metà agosto "non riparerà i processori coinvolti" in quanto ne causa un degrado irreversibile. La patch, invece, dovrebbe prevenire i problemi sui processori che attualmente non sono interessati dal problema.
"Intel consiglia a tutti i clienti che hanno problemi di rivolgersi all'assistenza clienti. Poiché l'aggiornamento del microcode non riparerà i processori interessati, l'azienda continuerà a sostituirli. Intel si è impegnata a concedere l'RMA a tutti i clienti interessati".
30 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoAMD permettendo, perchè al momento propendo molto più per le loro soluzioni.
Mi dispiace dirlo ma a questo giro la frittata è fatta, ormai queste due generazioni sono marchiate (male).
Triste, ma vero.
AMD permettendo, perchè al momento propendo molto più per le loro soluzioni.
Mi dispiace dirlo ma a questo giro la frittata è fatta, ormai queste due generazioni sono marchiate (male).
Triste, ma vero.
Concordo con Saturn. Generazione/i nate male, eccessivamente tirate e poi non si può accettare un TDP così elevato... tra un po' col calore da disperdere ci cuoci la cena non ha veramente senso.
Spero che Intel con la prossima generazioni torni almeno a essere vagamente competitiva o saranno dolori.
senza considerare che grandi oem dicono di avere problemi in percentuali molto superiori, che ci sono problemi anche sui chipset server a default e con ram con profilo jedec e alcuni che forniscono servizi anche con la 14esima gen, ma vabbè in queste cose la verità non la sapremo mai.
https://www.youtube.com/watch?v=QzHcrbT5D_Y
Allora disattivai nel BIOS UEFI nella sua sezione AI Tweaker l'opzione ASUS multicore enhancement, disattivai l'overclock della memoria RAM DDR 4 3600 installata, il suo clock l'ho impostato al valore nominale di 2666Mhz del relativo controller incorporato nel processore ma per contro ho potuto ridurre drasticamente i timing dei moduli di memoria (4X16 GByte dual Chanel 14, 14, 14, 32)
Non contento di tutto questo ho utilizzato il tool Intel Extreme tuning impostando manualmente tutti i parametri di esercizio del processore salvando il microcodice
Il risultato è che l'i9 9900K è magnificamente stabile e granitico, non riscalda per nulla (in condizioni di full load non supera i 72°C), i radiatori che raffreddano i VRM sono sempre tiepidi, tutto questo senza compromettere le massime prestazioni che l'i9 9900K è in grado di offrire, riesce a raggiungere i 5,1 GHz in turbo mode con 4 core attivi e riesce a lavorare alle frequenze di clock tra i 4,8 e i 4,9 Ghz con tutti e gli 8 core attivi
Allora disattivai nel BIOS UEFI nella sua sezione AI Tweaker l'opzione ASUS multicore enhancement, disattivai l'overclock della memoria RAM DDR 4 3600 installata, il suo clock l'ho impostato al valore nominale di 2666Mhz del relativo controller incorporato nel processore ma per contro ho potuto ridurre drasticamente i timing dei moduli di memoria (4X16 GByte dual Chanel 14, 14, 14, 32)
Non contento di tutto questo ho utilizzato il tool Intel Extreme tuning impostando manualmente tutti i parametri di esercizio del processore salvando il microcodice
Il risultato è che l'i9 9900K è magnificamente stabile e granitico, non riscalda per nulla (in condizioni di full load non supera i 72°C), i radiatori che raffreddano i VRM sono sempre tiepidi, tutto questo senza compromettere le massime prestazioni che l'i9 9900K è in grado di offrire, riesce a raggiungere i 5,1 GHz in turbo mode con 4 core attivi e riesce a lavorare alle frequenze di clock tra i 4,8 e i 4,9 Ghz con tutti e gli 8 core attivi
se vuoi spostare il problema sui produttori come ha provato a fare intel sei fuori strada... è intel che deve dare le specifiche per asus-msi-giga ecc e non l'ha fatto con assoluta chiarezza per anni.
Il risultato adesso è estremizzato da problemi nelle ultime due generazioni che sono arrivate ancora più al limite, ma come nel video che ti ho linkato il problema ci sta anche a default su chipset server e ram ddr5-3600 che non permettono alcun overclock (i chipset W).
AMD permettendo, perchè al momento propendo molto più per le loro soluzioni.
Mi dispiace dirlo ma a questo giro la frittata è fatta, ormai queste due generazioni sono marchiate (male).
Triste, ma vero.
Ma non é tutto da buttare. N100 mi stuzzica parecchio e credo che alla fine ne prenderó uno anche se in realtá non mi serve.
Per l'amor del cielo, ci mancherebbe.
Dico solo che dovessi/volessi assemblare una macchina per giocare e/o lavorare ad alti livelli mi sentirei molto più sicuro con AMD a questo giro...per quanto mitigheranno il problema, resta sempre l'incognita...imho !
se intel avesse fatto un nuc con n100 l'avrei preso, invece mi sono "accontentato" di un n6005
Il risultato adesso è estremizzato da problemi nelle ultime due generazioni che sono arrivate ancora più al limite, ma come nel video che ti ho linkato il problema ci sta anche a default su chipset server e ram ddr5-3600 che non permettono alcun overclock (i chipset W).
Parte del problema è legato al fatto che più core ci sono sullo stesso chip e più ci sono transienti molto diversi tra loro legati a quanti E quali core stanno salendo di tensione e frequenza e quanti E quali core stanno scendendo di tensione e frequenza (es: quando si passa un processo da un P-core ad un E-core).
Nel caso delle ultime generazioni di cpu Intel, il problema è ancor più accentuato perchè ci sono molti più core P ed E quindi l'algoritmo di "armonizzazione dei consumi" è ancora più complicato.
Quindi o si sceglie un approccio "cauto" in cui si scala tensione e frequenza più gradualmente E senza coinvolgere troppi core simultaneamente (a scapito delle prestazioni di picco) oppure cominciano ad esserci problemi come quelli che sta avendo Intel. Il fatto che ci abbiano messo così tanto a dire che risolvevano via microcodice la dice lunga su quanto ci devono aver lavorato sopra per non scendere troppo di prestazioni.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".