PDA

View Full Version : WHEA UNCORRECTABLE ERROR


floyd2
26-07-2022, 14:45
Ragazzi,

ho onestamente bisogno di una mano perchè qui sto impazzendo.

Da circa un mese sono comparsi questi crash improvvisi e che non riesco a comprendere.

La macchina è:

Main: Asus Rog Strix X570- E
CPU: AMD 5900X
GPU: Nvidia 3080
Ram: Crucial Ballistix Sport LT 16gb (8x2)
Power: Seasonic Focus+ 750W (dal 2020)

SSD: Sabrent NVME (primario con installazione OS)
Samsung 830 Pro (dati)
Samsung 850 Pro (dati)

Il tutto è raffreddato da un impianto a liquido (Cpu e Gpu in realtà).

La macchina è in funziona con questa configurazione da dicembre 2020. Mai più toccata. Mai avuto un problema. Da circa un mese ho iniziato ad avere problemi con dei crash random e schermata blu che mi indica come causa errore "WHEA UNCORRECTABLE ERROR".
Questa schermata indica che è in corso la creazione del dump...ma questo dump NON viene creato. La percentuale rimane ferma sullo 0% anche se lo lascio stare per ore (ho provato).
Temendo che il problema potesse essere l'ssd principale (il Sabrent), ho spostato la cartella di creazione Dump su uno degli ssd secondari, ma la situazione non è cambiata. Non genera alcun file di dump.

Nel visualizzatore eventi vedo gli ovvi errori sul fatto che " è avvenuto un arresto improvviso del sistema e bla bla bla" e un errore "volmgr" ID 161, "Creazione del file di dump non riuscita a causa di un errore durante la creazione del dump."

Niente altro.

La mia cpu aveva un underclock tramite curve optimizer. Nelle mie prove ho riportato a default, ma gli errori continuano ad esserci. La ram era in DOCP a 3200Mhz, riportata a default (2400MHZ). Ancora crash.

Viste velocemente le condizioni degli ssd, sembrano ok anche loro.

Era da qualche giorno che non avevo crash, mentre oggi, che sto lavorando da casa, ne avrò avuti almeno 5 o 6.

Quando succede, non sto facendo qualcosa di particolare. Un paio di volte mentre navigavo. Una volta almeno mentre giocavo (ma poi non è più successo). Oggi diverse volte mentre ero in Desktop Remoto. Almeno una volta mentre scrivevo questo messaggio e una volta mentre il pc era in idle e io ero a pranzo.

Ammetto di non aver ancora testato le ram, perchè non ho avuto materialmente tempo.

Ma la cosa che mi preme di più è capire perchè non mi genera un dump. Magari con quelle informazioni riuscirei a capire più dettagliatamente quale è il problema invece di andare alla cieca e testare a caso i componenti.

Da quello che ho visto in giro, il problema potrebbe essere dovuto ad una failure hardware magari legata alle temperature. E certamente in questi giorni ci potrebbe pure stare. Però mi sentirei di escludere il problema termico. L'impianto funziona bene. Tengo monitorate le temperature e la cpu varia tra i 40 e 50 gradi. La gpu, in questo momento è a 32 gradi e i crash sono avvenuti in momenti di non particolare sforzo. Il liquido in questo momento è a 36 gradi, mentre la temp ambiente in camera è 31 gradi (lasciamo stare...).

Quindi si, è caldo, ma l'impianto mi pare funzioni correttamente.

Però se non riesco a lavorare, questo è un problema. E se è come oggi, non riesco a lavorare, perchè questi continui crash mi hanno fatto perdere un sacco di lavoro e tempo.

Idee?

alecomputer
26-07-2022, 17:13
Quel tipo di errore di solito esce quando hai problemi hardware o ai driver .
Il pc si blocca all' istante e non riesce a creare un file dump .

Dovresti quindi fare queste prove per verificare l' hardware del pc :
1) Resetta il bios in modo da riportare tutto a default .
2) Fai un test alla ram con il programma memtest .
3) se hai punti di ripristino riporta il pc a un punto precedente .
4) Controlla in gestione dispositivi se ci sono periferiche senza driver o che segnano errori .
5) Aggiorna i driver utilizzando windows update , cliccando su l' apposita casella scarica driver .
6)controlla il funzionamento del processore con un programma apposito tip prime95 .
7) Verifica il funzionamento dell' alimentatore , utilizza un programma per verificare le tensioni fornite dall' alimentatore .
8) Prova a reinstallare windows .
9) Stacca dal pc tutto quello che non serve , lascia solo un disco fisso , un modulo di ram , stacca eventuali masterizzatori o schede pci aggiuntive , se hai la scheda grafica integrata , stacca anche la scheda grafica pci express e vedi se cosi il pc rimane stabile .

floyd2
04-08-2022, 17:03
Quel tipo di errore di solito esce quando hai problemi hardware o ai driver .
Il pc si blocca all' istante e non riesce a creare un file dump .

Dovresti quindi fare queste prove per verificare l' hardware del pc :
1) Resetta il bios in modo da riportare tutto a default .
2) Fai un test alla ram con il programma memtest .
3) se hai punti di ripristino riporta il pc a un punto precedente .
4) Controlla in gestione dispositivi se ci sono periferiche senza driver o che segnano errori .
5) Aggiorna i driver utilizzando windows update , cliccando su l' apposita casella scarica driver .
6)controlla il funzionamento del processore con un programma apposito tip prime95 .
7) Verifica il funzionamento dell' alimentatore , utilizza un programma per verificare le tensioni fornite dall' alimentatore .
8) Prova a reinstallare windows .
9) Stacca dal pc tutto quello che non serve , lascia solo un disco fisso , un modulo di ram , stacca eventuali masterizzatori o schede pci aggiuntive , se hai la scheda grafica integrata , stacca anche la scheda grafica pci express e vedi se cosi il pc rimane stabile .

Con un po' di ritardo...ho fatto tutte le prove elencate. Alcune le avevo già fatte in precedenza. Nessun errore rilevato o comportamento anomalo.

Per ultimo ho deciso di riportare il bios alle condizioni di default...anche se non ci avevo modificato chissà cosa.

Da quando lo ho fatto, i crash sembrano essere spariti. Ma questo periodo di "tregua" era già capitato in precedenza...quindi non mi sento ancora tranquillo.
Aggiungo che riportando il bios a default si è disattivato anche il TPM, che avevo attivato pensando di aggiornare presto a win 11, ma che poi non ho mai fatto. Non so se quello possa essere stato il responsabile...