PDA

View Full Version : Inspiegabili e MISTERIOSI Accessi all'HD


Chef
04-01-2006, 19:15
Da un po' di tempo ho notato che il led dell'HD si accende con la frequenza di una volta al secondo ininterrottamente. Questo accade anche quando il sistema è lasciato inattivo per molto tempo.
Il rumore di fondo della ventola di raffredamento purtroppo non consente di discernere se in corrispondenza del lampo rosso della spia ci sia anche il rumore tipico del movimento delle testine. In altre parole, se questo rumore c'è, non è sicuramente netto e prolungato come quello udibile all'apertura di un file.

Ho liberato la ram da tutti i processi in background superflui, oltre che dall'antivirus (AVG) e dal firewall (Sygate) ovviamente.

Devo preoccuparmi ?



Configurazione di Sistema
----------------------------
cpu: AMD K6-2 500Mhz
mobo: MSI - MS 5169 (ALADDiN 5 chipset by Ali)
gpu: Matrox G400
ram: 128+256 Mb


HD: IBM-DPTA-372050 20Gb - 2Mbcache

2 partizioni NTFS

Windows XP Sp2
----------------------------

TEST e PROVE EFFETTUATI
Scansione Antivirus (AVG) .................. ok
Scansione AntiSpyware (ADware) ........ ok
Deframmentazione (NortonUtilities) ...... ok
Controllo errori (NortonU, HD tune) ...... ok
Modalità provvisoria........................... *
Servizio di indicizzazione disattivato ..... ok

*il problema persiste

Chef
04-01-2006, 21:11
@avafabio
Grazie per i consigli, al + presto effettuerò i test in modalità provvisoria, da te consigliati.
(scansioni antivirus (AVG) e spyware (ADware), deframmetazione e controllo errori (NortonU) già EFFETTUATE: esito negativo)

Chef
05-01-2006, 22:47
@avafabio
In modalità provvisoria il problema persiste. :(
Nel TaskManager non mi sembra ci sia niente di sospetto:

System
explorer.exe
svchost.exe
svchost.exe
svchost.exe
lsass.exe
services.exe
winlogon.exe
csrss.exe
smss.exe

"svchost.exe" compare 3 volte, boh?

Hai qualche idea?

Chef
06-01-2006, 20:53
Non abbandonatemi :cry:

Marco71
07-01-2006, 09:00
...ogni hard disk moderno oltre alla attività richiesta dall'host (dal sistema in cui è utilizzato) effettua attività interne che vanno dall'aggiornamento on-line dei parametri S.M.A.R.T, alle eventuali ricalibrazioni sul primo cilindro (cumulativamente ogni 24 ore per gli Hitachi/I.B.M con sistema load/unload) ecc.
Se poi trattasi di unità S.C.S.I/S.A.S allora sì ce l'attività non cessa mai: si può avere il backgorund scan proattivo dopo qualche centinaio di ms di stato idle, oltre all'aggiornamento della pagina log per gli attributi S.M.A.R.T/P.F.A ecc.
Sia per le unità A.T.A (E.I.D.E) sia per quelle S.C.S.I/P.F.A c'è poi da mettere in conto che sempre le attività "interne" all'unità vengono effettuate (portate a termine) con accessi alla host protected area la cui locazione è conosciuta solo dal microcontrollore dell'hard disk ed è totalmente (si potrebbe accedervi ma non è consigliato) invisibile al mondo ad esso esterno.
Questo per quanto concerne il punto di vista prettamente tecnico, escludo cioè apriori che si tratti di accessi dovuti ad attività "maligne"...
Grazie.

Marco71.

Chef
07-01-2006, 11:06
@Marco71
Grazie per l'attenzione.
Molto interessante oltre che istruttivo il tuo intervento.

C'è un dubbio che m'attanaglia ancora:
possibile che in 6 anni d'utilizzo non mi sia mai accorto del "bizzarro" fenomeno?

A onor del vero c'è anche un altro fatto da considerare (che spero possa tornare utile per confermare la diagnosi):
il lampo del led (debolissimo) è visibile solo appostandosi con lo sguardo perpendicolarmenta alla spia stessa. Osservando di sbieco, con angolo obliquo il led appare sempre spento (ma in realtà lampeggia 1 volta al min senza tregua).
Per gli accessi normali (apertura file, copia, ecc.) la vista laterale invece non compromette assolutamente la visione del lampo rosso che evidentemente è più intenso.

:confused:

Marco71
07-01-2006, 12:05
...è un I.B.M famiglia 34GXP (gloriosa) !
La prima cosa che dovresti verificare con ad esempio Smartmontools (che ti posso "mandare" con piccione viaggiatore tramite e-mail) è la presenza di settori che avendo fallito tutti i livelli di retry e correzione hardware E.C.C degli errori, siano stati marcati come da riallocare (tramite la defect flagging strategy interna).
Dalla mia esperienza gli hard disk I.B.M/Hitachi P/S-A.T.A posso evincere una certa tendenza oltrepassate le 5000 ore di funzionamento alla comparsa di settori riallocati (cosa perfettamente prevista dal progetto dell'hard disk e non patologica).
La presenza di settori riallocati in condizione di "and" logico con uno o più attributi S.M.A.R.T oltre la soglia di normale funzionamento allora è condizione patologica (per capitolato la segnalazione del sottosistema S.M.A.R.T avviene con almeno 24 ore di preavviso prima di avere un prognosi infausta).
E' capitato proprio a me con un I.B.M 120GXP da 82.3 GBytes che ha tenuto per lunghissimo tempo (delle oltre 8200 ore totali di vita) ad un settore riallocato il relativo contatore.
Al tempo t0 poi è sopravvenuto il superamento della soglia per uno dei parametri definiti da S.M.A.R.T "old age" con progressivo aumento del numero di eventi di riallocazione che nel giro di poco meno di un giorno ha condotto a non avere più possibilità di avvio del sistema operativo.
Thanks.

Marco71.

Chef
08-01-2006, 11:30
@Marco71
Seguirò il tuo consiglio. Ho scaricato l'utility (smartmontools-5.33-1.win32.zip).
Avrei bisogno di qualche dritta: installazione, configurazione, interpretazione dei risultati.
La storia dei settori "da riallocare", confesso, mi ha messo un po' d'ansia...

Marco71
08-01-2006, 11:51
Ciao...
Non hai bisogno di installazione per utilizzare il programma smartctl...
Il suo utilizzo è da shell di sistema operativo (si capisce che deriva dall'ambiente Unix).
Io mi sono "costruito" dei semplici files batch...
Ad esempio per il controllo dell'hard disk con lettera "G" e scrittura del risultato in un file testo puoi impartire la seguente sequenza...

"smartctl -a /dev/hda > resG.log"
Se magari mi puoi mandare il risultato dell'esecuzione del programma potrei dirti qualche cosa in più.
A presto.

Marco71.

3Dfx4ever
08-01-2006, 12:01
Ciao Chef,

potrebbe anche essere il servizio di indicizzazione dei file di windows...
...prova a disattivarlo tra le opzioni del comando "cerca"...

Chef
08-01-2006, 20:13
@3Dfx4ever
Avevo dimenticato di annotare nel post d'apertura che avevo già pensato a disattivare il servizio di indicizzazione. Perdonami la dimenticanza. Grazie comunque del suggerimento. Molto pertinente.

Chef
08-01-2006, 20:48
@Marco71
Ecco il report.
Tra le altre cose, si legge che l'attività di raccolta dati offline non è stata mai avviata, boh?

Old_age o Pre-fail, this is the question, per dirla con Shakespeare

Qual'è la diagnosi?

Chef
11-01-2006, 19:27
Qualke suggerimento ?

Marco71
11-01-2006, 19:38
Mi sembra tutto okay.
Data "l'età" dell'unità manda in esecuzione anche il long self test (definito espressamente anche dalle specifiche S.M.A.R.T).
Un esempio di sintassi di esecuzione:

smartctl -t long /dev/hda > resG.log

Ti ho consigliato anche questo test interno dato che dal file di log che mi hai "rimandato" non risulta che sia mai stato eseguito dall'hard disk per tutta la sua vita di funzionamento, ad oggi.
La attività di raccolta offline per le unità A.T.A può essere abilitata tramite smartctl ma tieni presente che in una unità specialmente dove risiede il s.o o che comunque viene utilizzata ed è appunto on-line nel sistema, l'host può impartire il reset immediato di tutte le attività interne di self-test S.M.A.R.T.
Thanks.

Marco71.

Chef
12-01-2006, 01:11
Ho eseguito anche il Self-test esteso.
Potresti dare un'occhiata?
Sembra essere tutto ok.

Come avrai capito, non sono molto ferrato sull'argomento, ma visto che oramai mi sono addentrato...
potresti delucidarmi su alcune questioni tecniche (troppo tecniche per le mie scarse conoscenze)

1. come interpretare le informazioni del rapporto SMART:
Gli stati "Pre-fail" e "Old_age", precisamente come sono da indendersi? (scusa la banalità, ma vorrei essere sicuro d'aver capito bene)

2. in merito al self-test:
Cosa si idente con l'acronimo "LBA_of_first_error" ?
Il valore percentuale 00% che appare nel report a cosa è riferito?

GRAZIE per l'assistenza "passo passo", obligato !
..e anche per il supporto didattico ;)

Marco71
12-01-2006, 09:12
..."Pre_fail" ed "Old_age" sono solo le caratterizzazioni degli attributi secondo le definizioni S.M.A.R.T.
Tutti gli attributi appartenenti alla classe "Pre_fail" se superanti la relativa soglia definita dal costruttore per il particolare hard disk, possono dar luogo ad una segnalazione di guasto "imminente"...
Per "immininente" intendo entro le successive 24 ore...
L'L.B.A del primo errore è il blocco "logico" di indirizzamento corrispondente a quello in cui si è verificato il primo errore durante l'esecuzione off od on line del self-test di "lunga durata".
Tieni d'occhio i parametri "Old_age" che anche se non direttamente correlati con segnalazioni di guasto "imminente" da parte dello S.M.A.R.T, possono dar luogo a tutta una serie di guasti non predicibili...ad esempio rottura di una sfera del cuscinetto che supporta la rotazione del motore spindle oppure fuoriuscita del fluido nei motori F.D.B ecc.
A presto.

Marco71.

Chef
13-01-2006, 21:00
Se ho ben capito nella colonna "THRESH" figurano i valori soglia definiti dal produttore al di sotto dei quali l'attributo S.M.A.R.T. ricade in "zona d'allarme" e determina il segnale da bios di guasto imminente.
Il valore da tenere sottocchio dovrebbe esser posizionato nella colonna "VALUE" (con il passar del tempo dovrebbe tendere a decrementarsi). La colonna etichetteta con "WORST" mi è di significato oscuro.

Ho notato che dopo l'esecuzione del self-test uno dei valori degli attributi (Raw_Read_Error_Rate) si è modificato, passando da 89 a 100. Strano. La mia ipotesi è che in qualche modo il sel-test "forzi" il dispositivo ad aggiornare i valori degli attributi. Mi sarei aspettato però un valore + basso.
Qualcosa non mi torna.

Marco71
13-01-2006, 21:30
Dunque...
Il valore dell'attributo "WORST" è il valore "peggiore" che il sistema S.M.A.R.T ha rilevato.
Il valore di "Raw_Read_Error_Rate" riguarda il tasso di errori rilevati sul flusso di bit provenienti direttamente dal sistema di rilevazione a risposta parziale e massima verosimiglianza che li riceve dopo "campionamento" del segnale rilevato dagli elementi magnetoresistivi sulle testine (in lettura).
Di norma esprime la "rumorosità" del canale di trasferimento lettura/scrittura.
A meno di una sua costante diminuzione monotona nel tempo, può subire nell'arco della vita dell'unità, anche oscillazioni molto forti.
Se vuoi approfondire il carattere tecnico scientifico della possibilità di previsione dei guasti in un hard disk, quando ho un poco più di tempo ti potrei mandare ad un tuo indirizzo e-mail qualche documento .pdf.
A presto.

Marco71.

Life bringer
14-01-2006, 06:35
Salve, scusate se mi intrometto, io ho 2 hard disk, un hitachi 120gb e un maxtor da 60gb. Ogni tanto l'hd maxtor emette dei clack, quest'estate ad esempio dopo un "clack", sono stato costretto a formattare perchè si era corrotto qualche file di windows, mentre una settimana fa circa l'hd ha emesso nuovamente un clack e il sistema si è bloccato, in questi giorni, almeno un volta al giorno lo sento fare quel rumore, c'è da dire xò che se prima quewsti clack erano segno di un imminente crash, ora non provocano alcun effetto, sento il clack ma la sessione di lavoro continua normalmente...
SpeedFan analizzando lo smart nella voce salute mi da la barra piena al 50%...
Con hdtune ho rilevato i seguenti valori (allego quelli di entrambi gli hd):
http://img380.imageshack.us/img380/6109/hdtunehealthmaxtor6l060j35yi.th.png (http://img380.imageshack.us/my.php?image=hdtunehealthmaxtor6l060j35yi.png)
http://img380.imageshack.us/img380/329/hdtunehealthhds722512vlat202dr.th.png (http://img380.imageshack.us/my.php?image=hdtunehealthhds722512vlat202dr.png)
Che dite, mi conviene cambiare il maxtor il prima possibile (ho in programma l'acquisto di un raptor da 74gb) o posso permettermi di aspettare?
Grazie in anticipo :)