floyd2
26-07-2022, 14:45
Ragazzi,
ho onestamente bisogno di una mano perchè qui sto impazzendo.
Da circa un mese sono comparsi questi crash improvvisi e che non riesco a comprendere.
La macchina è:
Main: Asus Rog Strix X570- E
CPU: AMD 5900X
GPU: Nvidia 3080
Ram: Crucial Ballistix Sport LT 16gb (8x2)
Power: Seasonic Focus+ 750W (dal 2020)
SSD: Sabrent NVME (primario con installazione OS)
Samsung 830 Pro (dati)
Samsung 850 Pro (dati)
Il tutto è raffreddato da un impianto a liquido (Cpu e Gpu in realtà).
La macchina è in funziona con questa configurazione da dicembre 2020. Mai più toccata. Mai avuto un problema. Da circa un mese ho iniziato ad avere problemi con dei crash random e schermata blu che mi indica come causa errore "WHEA UNCORRECTABLE ERROR".
Questa schermata indica che è in corso la creazione del dump...ma questo dump NON viene creato. La percentuale rimane ferma sullo 0% anche se lo lascio stare per ore (ho provato).
Temendo che il problema potesse essere l'ssd principale (il Sabrent), ho spostato la cartella di creazione Dump su uno degli ssd secondari, ma la situazione non è cambiata. Non genera alcun file di dump.
Nel visualizzatore eventi vedo gli ovvi errori sul fatto che " è avvenuto un arresto improvviso del sistema e bla bla bla" e un errore "volmgr" ID 161, "Creazione del file di dump non riuscita a causa di un errore durante la creazione del dump."
Niente altro.
La mia cpu aveva un underclock tramite curve optimizer. Nelle mie prove ho riportato a default, ma gli errori continuano ad esserci. La ram era in DOCP a 3200Mhz, riportata a default (2400MHZ). Ancora crash.
Viste velocemente le condizioni degli ssd, sembrano ok anche loro.
Era da qualche giorno che non avevo crash, mentre oggi, che sto lavorando da casa, ne avrò avuti almeno 5 o 6.
Quando succede, non sto facendo qualcosa di particolare. Un paio di volte mentre navigavo. Una volta almeno mentre giocavo (ma poi non è più successo). Oggi diverse volte mentre ero in Desktop Remoto. Almeno una volta mentre scrivevo questo messaggio e una volta mentre il pc era in idle e io ero a pranzo.
Ammetto di non aver ancora testato le ram, perchè non ho avuto materialmente tempo.
Ma la cosa che mi preme di più è capire perchè non mi genera un dump. Magari con quelle informazioni riuscirei a capire più dettagliatamente quale è il problema invece di andare alla cieca e testare a caso i componenti.
Da quello che ho visto in giro, il problema potrebbe essere dovuto ad una failure hardware magari legata alle temperature. E certamente in questi giorni ci potrebbe pure stare. Però mi sentirei di escludere il problema termico. L'impianto funziona bene. Tengo monitorate le temperature e la cpu varia tra i 40 e 50 gradi. La gpu, in questo momento è a 32 gradi e i crash sono avvenuti in momenti di non particolare sforzo. Il liquido in questo momento è a 36 gradi, mentre la temp ambiente in camera è 31 gradi (lasciamo stare...).
Quindi si, è caldo, ma l'impianto mi pare funzioni correttamente.
Però se non riesco a lavorare, questo è un problema. E se è come oggi, non riesco a lavorare, perchè questi continui crash mi hanno fatto perdere un sacco di lavoro e tempo.
Idee?
ho onestamente bisogno di una mano perchè qui sto impazzendo.
Da circa un mese sono comparsi questi crash improvvisi e che non riesco a comprendere.
La macchina è:
Main: Asus Rog Strix X570- E
CPU: AMD 5900X
GPU: Nvidia 3080
Ram: Crucial Ballistix Sport LT 16gb (8x2)
Power: Seasonic Focus+ 750W (dal 2020)
SSD: Sabrent NVME (primario con installazione OS)
Samsung 830 Pro (dati)
Samsung 850 Pro (dati)
Il tutto è raffreddato da un impianto a liquido (Cpu e Gpu in realtà).
La macchina è in funziona con questa configurazione da dicembre 2020. Mai più toccata. Mai avuto un problema. Da circa un mese ho iniziato ad avere problemi con dei crash random e schermata blu che mi indica come causa errore "WHEA UNCORRECTABLE ERROR".
Questa schermata indica che è in corso la creazione del dump...ma questo dump NON viene creato. La percentuale rimane ferma sullo 0% anche se lo lascio stare per ore (ho provato).
Temendo che il problema potesse essere l'ssd principale (il Sabrent), ho spostato la cartella di creazione Dump su uno degli ssd secondari, ma la situazione non è cambiata. Non genera alcun file di dump.
Nel visualizzatore eventi vedo gli ovvi errori sul fatto che " è avvenuto un arresto improvviso del sistema e bla bla bla" e un errore "volmgr" ID 161, "Creazione del file di dump non riuscita a causa di un errore durante la creazione del dump."
Niente altro.
La mia cpu aveva un underclock tramite curve optimizer. Nelle mie prove ho riportato a default, ma gli errori continuano ad esserci. La ram era in DOCP a 3200Mhz, riportata a default (2400MHZ). Ancora crash.
Viste velocemente le condizioni degli ssd, sembrano ok anche loro.
Era da qualche giorno che non avevo crash, mentre oggi, che sto lavorando da casa, ne avrò avuti almeno 5 o 6.
Quando succede, non sto facendo qualcosa di particolare. Un paio di volte mentre navigavo. Una volta almeno mentre giocavo (ma poi non è più successo). Oggi diverse volte mentre ero in Desktop Remoto. Almeno una volta mentre scrivevo questo messaggio e una volta mentre il pc era in idle e io ero a pranzo.
Ammetto di non aver ancora testato le ram, perchè non ho avuto materialmente tempo.
Ma la cosa che mi preme di più è capire perchè non mi genera un dump. Magari con quelle informazioni riuscirei a capire più dettagliatamente quale è il problema invece di andare alla cieca e testare a caso i componenti.
Da quello che ho visto in giro, il problema potrebbe essere dovuto ad una failure hardware magari legata alle temperature. E certamente in questi giorni ci potrebbe pure stare. Però mi sentirei di escludere il problema termico. L'impianto funziona bene. Tengo monitorate le temperature e la cpu varia tra i 40 e 50 gradi. La gpu, in questo momento è a 32 gradi e i crash sono avvenuti in momenti di non particolare sforzo. Il liquido in questo momento è a 36 gradi, mentre la temp ambiente in camera è 31 gradi (lasciamo stare...).
Quindi si, è caldo, ma l'impianto mi pare funzioni correttamente.
Però se non riesco a lavorare, questo è un problema. E se è come oggi, non riesco a lavorare, perchè questi continui crash mi hanno fatto perdere un sacco di lavoro e tempo.
Idee?