View Single Post
Old 19-07-2009, 16:29   #1
Gimli[2BV!2B]
Senior Member
 
L'Avatar di Gimli[2BV!2B]
 
Iscritto dal: Feb 2006
Città: Parma
Messaggi: 3010
Sfortunato Seagate Momentus 5400.2 diventato capriccioso

Salve a tutti, non conosco molto questa sezione di HwUpgrade forum.

I giorni scorsi sono stati particolarmente caldi.
L'altroieri mi sono accorto che, nonostante il caldo, il mio pc Epia si era congelato .
Tra l'altro me ne sono accorto dopo circa 36 ore, visto che continuava tranquillamente a fornire i servizi di rete con i dati che aveva in RAM.
  1. Smontato il disco e collegato ad un altro pc: il sistema che contiene si è avviato senza *nessun* problema (nessun warning, nessun errore, fsck concluso con successo).
  2. Ricollegato al suo pc non funzionava.
  3. Sostituito il cavo IDE con uno nuovo ma più lungo ed inadatto al case: il sistema si è avviato perfettamente.
  4. L'ho lasciato in funzione per circa 16 ore in condizioni molto precarie: il disco, avvitato alla piastra adattatrice (PA-HD25B2 Rev.B), penzolava verticale nel vuoto; di solito è posizionato in orizzontale, avvitato ad una piastra metallica che è a poco meno di 1mm dai contatti dell'adattatore.
  5. Ho fatto qualche test per stressarlo: tutto bene.
  6. Riassemblo adattatore pistra di supporto e cavo nuovo: NON si avvia .
  7. Provo a mettere del cartoncino tra adattatore e piastra metallica: NON si avvia.
  8. Ripristino la situazione ultra precaria: funzionamento perfetto.
  9. Sono 25 ore che funziona perfettamente.

Non so che pesci pigliare.
  • E' possibile che il disco stia per morire e funzioni solo in posizione verticale?
  • Sono due anni che è assemblato e acceso, c'era pochissima polvere, adesso spunta un contatto?
  • Ho sbagliato a considerare del cartoncino da imballaggio grezzo un sufficiente isolante elettrico?
  • Ora che ci penso quando non funziona è avvitato con quattro viti, mentre ora con le sole due più distanti dall'IDE e dal molex dell'adattatore, eventualmente approfondirò questa cosa...

smartctl -a
Tabella s.m.a.r.t. appena acceso:
Codice:
Local Time is:    Sat Jul 18 15:49:20 2009 CEST
[...]

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   059   046   034    Pre-fail  Always       -       430
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1468
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   084   060   030    Pre-fail  Always       -       314482294
  9 Power_On_Hours          0x0032   092   092   000    Old_age   Always       -       7734
 10 Spin_Retry_Count        0x0013   100   100   034    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       855
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       856
193 Load_Cycle_Count        0x0032   088   088   000    Old_age   Always       -       25668
194 Temperature_Celsius     0x0022   034   051   000    Old_age   Always       -       34 (0 11 0 0)
195 Hardware_ECC_Recovered  0x001a   059   046   000    Old_age   Always       -       430
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   198   000    Old_age   Always       -       13
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0
Dopo circa 25 ore (per lui 13... sembrerebbe un errore di un fattore 2: bitshift errato?):
Codice:
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/                        

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Momentus 5400.2 series
Device Model:     ST9808211A                    
Serial Number:    XXXXXXXX                      
Firmware Version: 3.02                          
User Capacity:    80,026,361,856 bytes          
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6                                              
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 2               
Local Time is:    Sun Jul 19 17:22:01 2009 CEST                  
SMART support is: Available - device has SMART capability.       
SMART support is: Enabled                                        

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.    
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever  
                                        been run.                               
Total time to complete Offline                                                  
data collection:                 ( 426) seconds.                                
Offline data collection                                                         
capabilities:                    (0x5b) SMART execute Offline immediate.        
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new         
                                        command.                                    
                                        Offline surface scan supported.             
                                        Self-test supported.                        
                                        No Conveyance Self-test supported.          
                                        Selective Self-test supported.              
SMART capabilities:            (0x0003) Saves SMART data before entering            
                                        power-saving mode.                          
                                        Supports SMART auto save timer.             
Error logging capability:        (0x01) Error logging supported.                    
                                        No General Purpose Logging support.         
Short self-test routine                                                             
recommended polling time:        (   1) minutes.                                    
Extended self-test routine                                                          
recommended polling time:        (  84) minutes.                                    

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:  
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   050   046   034    Pre-fail  Always       -       155517051
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0        
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1468     
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0        
  7 Seek_Error_Rate         0x000f   084   060   030    Pre-fail  Always       -       315077882
  9 Power_On_Hours          0x0032   092   092   000    Old_age   Always       -       7747     
 10 Spin_Retry_Count        0x0013   100   100   034    Pre-fail  Always       -       0        
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       855      
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       857      
193 Load_Cycle_Count        0x0032   088   088   000    Old_age   Always       -       25669    
194 Temperature_Celsius     0x0022   034   051   000    Old_age   Always       -       34 (0 11 0 0)
195 Hardware_ECC_Recovered  0x001a   050   046   000    Old_age   Always       -       155517051    
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   198   000    Old_age   Always       -       13
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      7747         -
# 2  Short offline       Completed without error       00%      7746         -
# 3  Short offline       Completed without error       00%      1663         -
# 4  Short offline       Completed without error       00%      1642         -
# 5  Short offline       Completed without error       00%      1618         -
# 6  Short offline       Completed without error       00%      1595         -
# 7  Short offline       Completed without error       00%      1571         -
# 8  Short offline       Completed without error       00%      1548         -
# 9  Short offline       Completed without error       00%      1524         -
#10  Extended offline    Completed without error       00%      1502         -
#11  Short offline       Completed without error       00%      1500         -
#12  Short offline       Completed without error       00%      1476         -
#13  Short offline       Completed without error       00%      1453         -
#14  Short offline       Completed without error       00%      1430         -
#15  Short offline       Completed without error       00%      1406         -
#16  Short offline       Completed without error       00%      1383         -
#17  Short offline       Completed without error       00%      1359         -
#18  Extended offline    Completed without error       00%      1337         -
#19  Short offline       Completed without error       00%      1335         -
#20  Short offline       Completed without error       00%      1312         -
#21  Short offline       Completed without error       00%      1288         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
  • Raw_Read_Error_Rate & Hardware_ECC_Recovered, da sempre, si incrementano contemporaneamente, a ritmi pari all'intensità di utilizzo: i valori normalizzati sono superiori ai peggiori registrati e distanti dalla soglia. Il valore normalizzato sta scendendo abbastanza velocemente...
  • UDMA_CRC_Error_Count è su quel valore da quando posseggo il disco, che proviene da un portatile con scheda madre fulminata e da un adattatore USB2 che funzionava malissimo.
  • Seek_Error_Rate ha valore raw altissimo, ma è ben distante dal peggiore normalizzato, a sua volta lontanissimo dalla soglia.
  • Power_On_Hours è errato, stando ai log in mio possesso dovrebbe essere superiore a 11000.
  • tentando un test offline (-t offline) non vengono riportati errori ma succede questo:
    Codice:
    hda: dma_timer_expiry: dma status == 0x21
    hda: DMA timeout error
    hda: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest }
    ide: failed opcode was: unknown
    hda: DMA disabled
    ide0: reset: success
  • I test short e long si concludono correttamente, nulla in dmesg.

Temperature, carico e voltaggi ultimo giorno memorizzato prima del problema.


A qualcuno è mai capitato qualcosa di simile?
__________________
~Breve riferimento ai comandi GNU/Linux (ormai non molto breve...)

Ultima modifica di Gimli[2BV!2B] : 19-07-2009 alle 16:47.
Gimli[2BV!2B] è offline   Rispondi citando il messaggio o parte di esso