View Full Version : WinXP si autodistrugge inspiegabilmente
nicgalla
26-04-2004, 22:44
Ciao ragazzi,
vi sottopongo un curioso problema che disgraziatamente si è presentato al server che ho appena installato a un cliente.
Computer: Epox 85KA2+ (KT333) - Athlon XP 2200+ - 512 Mb PC2700 Twinmos - 2x Samsung 120 Gb ATA100 su controller onboard Highpoint HPT370 - Matrox MGA-G100 - Tv Tuner Lifeview - Windows XP Pro SP1
oggi ci stavo lavorando sopra, senza smanettare, e a un certo punto il Norton dice che l'Autoprotect sarà terminato a causa di un errore interno. Ignoro l'errore, poi decido di riavviare. Quanto mai!
Ora il pc appena inserita la password dopo qualche secondo dice che Explorer.exe è andato in crash, e chiede se inviare la segnalazione a Microsoft. Qualche secondo dopo, indifferentemente se si clicca sulla finestra o no, esce una Blue Screen 0x0000008E (C0000005, 8060AB13, F11979A0). Ciò si verifica anche con altri account utente.
Se provo la modalità provvisoria il sistema non va in blue screen ma explorer.exe continua a crashare, mentre se apro Task Manager e lo uso per aprire qualche prog va in crash pure lui!
Vado in console di ripristino e faccio un chkdsk, mi corregge qualche errore, riavvio ma niente. Rifaccio il chkdsk, e questa volta mi dice "Rilevati uno o più errori irreversibili nel volume", e non esegue nessun controllo. Le partizioni tuttavia risultano accessibili.
Le mie ipotesi sono:
- registro di configurazione o qualche file di sistema rovinato
- hard disk con settori danneggiati (xò sono nuovi e impostati come RAID1)
- controller RAID che causa corruzione nei dati (può essere utile installare una nuova versione del BIOS? ho controllato cosa correggono le nuove revision e sono solo piccoli cambiamenti)
Vorrei provare l'utility di Samsung per il test degli hard disk, secondo voi richiede qualche driver per il controller RAID? Io di driver DOS sul sito Highpoint non ne trovo.
Aspetto vostri consigli....
nicgalla
27-04-2004, 17:17
hey non accalcatevi, c'è spazio per tutti!
UPDATE: ho deciso di formattare e reinstallare. Ha funzionato tutto per un due-tre ore, poi la solita solfa: prima errore interno di Norton poi pian piano vanno in crash tutti i programmi.
Appena riavviato da questa instabilità dà schermata blu (device irql not less or equal 0xD1).
Non so più dove spaccare la testa, ora ho fatto partire un controllo approfondito degli hd con l'utility Samsung, ci vorrà un paio d'ore, se non sono gli HD danneggiati non so più che fare.
Può essere il controller RAID? io ho installato gli ultimi driver dal sito Epox, e corrispondono al BIOS installato (2.32).
ma cosa dice la sk blu?
comunque potrebbe essere ram o cpu..
però senza sapere cosa dice la sk blu... mette male..
nicgalla
27-04-2004, 18:57
Ciao Naso,
ho scritto cosa dice la schermata blu in entrambi i casi.
Prima s'era verificato l'errore 0x8E e ora l'errore 0xD1.
La ram era già stata collaudata senza problemi in precedenza, il processore ha fatto più di 36 ore di prime95 senza errori e con temperature <45°C, i timings sono impostati a default.
Ho fatto il test di un hard disk e non ha riportato errori, ora sto facendo il test del secondo e non ha ancora riportato errori, però potrebbe essere quello.
L'unica cosa che mi insospettisce è il controller RAID (un Highpoint HPT370 integrato nella mobo), ma non saprei come verificarne il buon funzionamento. Oppure potrebbero essere inteferenze, onde radio ecc...?
disturbi sulla tensione nn possono esserci xkè c'è l'UPS (un Microdowell da ben 1000VA) mentre l'ali è un affidabile Chieftec 360W.
spero che tu capisca perchè continuo a :muro:
ma normalmente la sk blu da delle serie di codici del tipo 0x0000005 x 4 o 5 volte.. e dice anche quale file ha causato il problema... (anche se nn sempre)
strano...
nicgalla
27-04-2004, 20:38
io ho riportato l'errore per esteso, ad esempio
0x0000008E (C0000005, 8060AB13, F11979A0)
di cui quelli tra parentesi sono dei parametri, però non è detto che a provocare una schermata blu sia stato un file.
In microsoft si usa abbreviare riportando 0x e le ultime due cifre perchè tanto gli altri sono sempre zero.
Originariamente inviato da nicgalla
......
Appena riavviato da questa instabilità dà schermata blu (device irql not less or equal 0xD1).
...............
Davvero curioso, ho letto poco fa un post che menziona lo stesso errore (di interrupt?) che non avevo mai sentito.
Vedi http://forum.hwupgrade.it/showthread.php?s=&threadid=673200
Non so cosa possa essere, anche se farebbe pensare ad un problema hardware o di conflitto IRQ.
Forse qualche indicazione in system information - risorse hardware, conflitti e condivisioni o anche IRQ?
Ciao
nicgalla
28-04-2004, 00:38
UPDATE: gli hard disk risultano perfetti anche alla scansione dell'intera superficie, quindi non è corruzione dei dati, almeno a livello di hd.
La temperatura del southbridge è di 44°C, non è che percaso è quello a sbarellare?
Conflitti di IRQ? cavolo è dai tempi del DOS che non me ne preoccupo, le schede PCI condividono gli IRQ e le specifiche ACPI credo abbiano aumentato gli IRQ a 32..... però provo a guardare.
Cmq nel Gestione periferiche non vi erano punti esclamativi gialli....
Ora provo a formattare x la terza volta e a installare un driver per volta
naturalmente hai tutti i drivers aggiornati sia del controller raid che del resto?
il bios della skeda madre è l'ultimo? di solito con il bios della scheda madre aggiornano anche il bios dei controller Raid integrati...
potresti provare a fare un installazione su un solo hd collegato al controller del southbridge...
ad ogni modo visto che ti è capitato così all'improvviso io direi che è la ram andata... i programmi di test di solito non sono poi così infallibili...
:)
Forse c'è qualche spiegazione qui: http://support.microsoft.com/default.aspx?scid=http://support.microsoft.com:80/support/kb/articles/q165/8/63.asp&NoWebContent=1
Ciao
prova a fare un goldmemory.
a me è successa una roba simile a questa ma con tutti componenti nuovi, monto tutto bene e inizio a installare windows: schermate blu, errori assurdi mai visti, etc. etc.
sono andato in negozio, ho cambiato la ram: tutto ok.
io farei un tentativo...
a proposito anche io ho una epox con raid integrato e non ho mai avuto problemi. l'aggiornamento del bios del raid lo metti dentro il dischetto di boot con il bios per la mobo... c'è un programmino mi sembra che ti aggiorna direttamente il .bin per la mobo con l'ultimo bios per il raid.
l'ho fatto molto tempo fa per cui non mi ricordo perfettamente, comunque ci sono le istruzioni sul sito e anche qui sul forum.
prova a cambiare ram poi ci dici...
nicgalla
28-04-2004, 15:05
Ora provo a fare il goldmemory e a cambiare la ram. Intanto ho reinstallato per la terza volta windows, questa volta evito di installare i driver VIA Hyperion 4.51... e ho messo un dissy sul southbridge ma 44°C mi sembra sopportabile.
Un mio amico mi ha detto che magari sono gli hard disk ad avere problemi nel mantenere gli orientamenti magnetici e quindi a un test eseguito nell'immediato non vengono riportati errori mentre a lungo termine si verifica corruzione nei dati.
Certo che se è così ce ne vuole di tempo per fare delle prove e a trovare risultati certi.. ke palle....
Originariamente inviato da nicgalla
Ora provo a fare il goldmemory e a cambiare la ram. Intanto ho reinstallato per la terza volta windows, questa volta evito di installare i driver VIA Hyperion 4.51... e ho messo un dissy sul southbridge ma 44°C mi sembra sopportabile.
Un mio amico mi ha detto che magari sono gli hard disk ad avere problemi nel mantenere gli orientamenti magnetici e quindi a un test eseguito nell'immediato non vengono riportati errori mentre a lungo termine si verifica corruzione nei dati.
Certo che se è così ce ne vuole di tempo per fare delle prove e a trovare risultati certi.. ke palle....
intanto potresti fare come ti ho detto e installare windows su un solo HD non in raid e collegato al controller normale... così escludi almeno che possa essere un problema del controller raid
:)
nicgalla
28-04-2004, 19:59
la scheda madre, la ram e la cpu hanno due mesi di vita e non hanno manifestato alcun problema con utilizzo videoludico e professionale, solo il controller raid non era mai stato usato prima però se è quello è strano che non inizi a corrompere i dati da subito, no?
Figuriamoci che il mio server casalingo è un vecchio dual PII con controller RAID su scheda. Questo di tanto in tanto blocca il sistema x qualche secondo mentre compie una sorta di "sincronizzazione" (si vedono le luci degli hd lampeggiare alternativamente) eppure non ho mai perso un byte nè si è rovinato il sistema operativo.
ora sto copiando un po' di divx e file zippati, file grossi che si vede subito se si danneggiano. E contemporaneamente un bel Prime95!
Attualmente il pc si trova a casa mia, lo stresso un po' e se va tutto faccio un'immagine di sistema e lo porto la, poi vediamo. Prima di portarlo dal cliente l'avevo provato un po' e non aveva mostrato alcuna incertezza. Magari è qualche interferenza sulle connessioni o disturbi radio... improbabile ma non impossibile.
nicgalla
29-04-2004, 12:34
Su problemi di corruzione dati e controller HPT372 ho trovato info interessanti ma non utili per risolvere il problema, ammesso che sia dovuto a questo.
link1 (http://forums.sudhian.com/messageview.cfm?catid=73&threadid=34021)
link2 (http://www.aoaforums.com/forum/showthread.php?t=11491)
(nota che non ho schede audio pci su questo pc e quella integrata non ha ancora il driver installato)
link3 (http://www.aoaforums.com/forum/showthread.php?t=23103)
UPDATE:
il sistema non è diventato ancora instabile però quando provo a decomprimere dei file compressi creati poco prima mi dà sempre "errore durante la lettura del file".
nicgalla
29-04-2004, 14:45
Ho modificato il BIOS della mobo e ho installato l'ultima versione del BIOS Highpoint, la 2.351, così come per i driver in windows.
Ora vediamo se cambia qualcosa....
A me la schermata blu ha dato il seguente errore:
IRQL_MOT_LESS_OR_EQUAL
***stop: 0x0000000a (0x00DFBCA8, 000000002, 0X00000000, 0X804E411D
Qualcuno è così cortese da potermi dare una risposta? il pc lo uso in hotel..
Ho provato a cambiare sheda video, ma il problema persiste.
Il pc ha tutti gli aggiornamenti microsoft..
non ho idea, forse la ram? boh ora provo..
l'errore normalmente è dovuto a problemi di ram...
nicgalla
29-04-2004, 15:39
Sono giunto alla conclusione che al 99% la causa di corruzione è dovuta al controller RAID perciò lo disabilito e uso gli hard disk normalmente, eventualmente creando uno script di backup automatico sull'hd secondario....
Attenzione quando comprate mobo col RAID integrato!!!!!
non è sempre colpa di Windows... anzi, imho, quasi ma lo è...
ad ogni modo se la skeda madre è in garanzia potresti provare a fartela cambiare e a vedere se si tratta di un pezzo difettoso... mha...
io ho avuto l'HPT 370 sulla KT7 e funzionava benone... hai provato magari a cambiare i cavi degli hd (magari ce n'è uno difettoso e al RAID non piace... oppure sono troppo lunghi, che io sappia le specifiche parlano di max 45 cm ma li vendono anche di lunghezze assurde :D)?
:)
nicgalla
29-04-2004, 21:47
Certo potrei farmela sostituire ma ciò significherebbe rimandare tutto per il tempo necessario alla sostituzione. Rinuncerò al RAID e userò il secondo HD come backup... peccato però che abbia perso tre giorni per niente. :rolleyes:
Ora ho provato a usare il controller ide normale e non ho riscontrato alcun problema, ho compresso e decompresso un gruppo di Divx da svariati giga senza errori. E tutto questo con gli stessi cavi che ho usato per il RAID, da 45 cm flat ATA100.
Grazie cmq per i validi consigli!
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.