Salve a tutti, non conosco molto questa sezione di HwUpgrade forum.
I giorni scorsi sono stati particolarmente caldi.
L'altroieri mi sono accorto che, nonostante il caldo, il mio pc Epia si era
congelato 
.
Tra l'altro me ne sono accorto dopo circa 36 ore, visto che continuava tranquillamente a fornire i servizi di rete con i dati che aveva in RAM.
- Smontato il disco e collegato ad un altro pc: il sistema che contiene si è avviato senza *nessun* problema (nessun warning, nessun errore, fsck concluso con successo).
- Ricollegato al suo pc non funzionava.
- Sostituito il cavo IDE con uno nuovo ma più lungo ed inadatto al case: il sistema si è avviato perfettamente.
- L'ho lasciato in funzione per circa 16 ore in condizioni molto precarie: il disco, avvitato alla piastra adattatrice (PA-HD25B2 Rev.B), penzolava verticale nel vuoto; di solito è posizionato in orizzontale, avvitato ad una piastra metallica che è a poco meno di 1mm dai contatti dell'adattatore.
- Ho fatto qualche test per stressarlo: tutto bene.
- Riassemblo adattatore pistra di supporto e cavo nuovo: NON si avvia
. - Provo a mettere del cartoncino tra adattatore e piastra metallica: NON si avvia.
- Ripristino la situazione ultra precaria: funzionamento perfetto.
- Sono 25 ore che funziona perfettamente.
Non so che pesci pigliare.
- E' possibile che il disco stia per morire e funzioni solo in posizione verticale?
- Sono due anni che è assemblato e acceso, c'era pochissima polvere, adesso spunta un contatto?
- Ho sbagliato a considerare del cartoncino da imballaggio grezzo un sufficiente isolante elettrico?
- Ora che ci penso quando non funziona è avvitato con quattro viti, mentre ora con le sole due più distanti dall'IDE e dal molex dell'adattatore, eventualmente approfondirò questa cosa...
smartctl -a
Tabella s.m.a.r.t. appena acceso:
Codice:
Local Time is: Sat Jul 18 15:49:20 2009 CEST
[...]
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 059 046 034 Pre-fail Always - 430
3 Spin_Up_Time 0x0003 095 094 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 099 099 020 Old_age Always - 1468
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 314482294
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 7734
10 Spin_Retry_Count 0x0013 100 100 034 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 855
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 856
193 Load_Cycle_Count 0x0032 088 088 000 Old_age Always - 25668
194 Temperature_Celsius 0x0022 034 051 000 Old_age Always - 34 (0 11 0 0)
195 Hardware_ECC_Recovered 0x001a 059 046 000 Old_age Always - 430
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 198 000 Old_age Always - 13
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
Dopo circa 25 ore (per lui 13... sembrerebbe un errore di un fattore 2: bitshift errato?):
Codice:
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Seagate Momentus 5400.2 series
Device Model: ST9808211A
Serial Number: XXXXXXXX
Firmware Version: 3.02
User Capacity: 80,026,361,856 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 2
Local Time is: Sun Jul 19 17:22:01 2009 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 426) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 84) minutes.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 050 046 034 Pre-fail Always - 155517051
3 Spin_Up_Time 0x0003 095 094 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 099 099 020 Old_age Always - 1468
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 315077882
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 7747
10 Spin_Retry_Count 0x0013 100 100 034 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 855
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 857
193 Load_Cycle_Count 0x0032 088 088 000 Old_age Always - 25669
194 Temperature_Celsius 0x0022 034 051 000 Old_age Always - 34 (0 11 0 0)
195 Hardware_ECC_Recovered 0x001a 050 046 000 Old_age Always - 155517051
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 198 000 Old_age Always - 13
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 7747 -
# 2 Short offline Completed without error 00% 7746 -
# 3 Short offline Completed without error 00% 1663 -
# 4 Short offline Completed without error 00% 1642 -
# 5 Short offline Completed without error 00% 1618 -
# 6 Short offline Completed without error 00% 1595 -
# 7 Short offline Completed without error 00% 1571 -
# 8 Short offline Completed without error 00% 1548 -
# 9 Short offline Completed without error 00% 1524 -
#10 Extended offline Completed without error 00% 1502 -
#11 Short offline Completed without error 00% 1500 -
#12 Short offline Completed without error 00% 1476 -
#13 Short offline Completed without error 00% 1453 -
#14 Short offline Completed without error 00% 1430 -
#15 Short offline Completed without error 00% 1406 -
#16 Short offline Completed without error 00% 1383 -
#17 Short offline Completed without error 00% 1359 -
#18 Extended offline Completed without error 00% 1337 -
#19 Short offline Completed without error 00% 1335 -
#20 Short offline Completed without error 00% 1312 -
#21 Short offline Completed without error 00% 1288 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
- Raw_Read_Error_Rate & Hardware_ECC_Recovered, da sempre, si incrementano contemporaneamente, a ritmi pari all'intensità di utilizzo: i valori normalizzati sono superiori ai peggiori registrati e distanti dalla soglia. Il valore normalizzato sta scendendo abbastanza velocemente...
- UDMA_CRC_Error_Count è su quel valore da quando posseggo il disco, che proviene da un portatile con scheda madre fulminata e da un adattatore USB2 che funzionava malissimo.
- Seek_Error_Rate ha valore raw altissimo, ma è ben distante dal peggiore normalizzato, a sua volta lontanissimo dalla soglia.
- Power_On_Hours è errato, stando ai log in mio possesso dovrebbe essere superiore a 11000.
- tentando un test offline (-t offline) non vengono riportati errori ma succede questo:
Codice:
hda: dma_timer_expiry: dma status == 0x21
hda: DMA timeout error
hda: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest }
ide: failed opcode was: unknown
hda: DMA disabled
ide0: reset: success
- I test short e long si concludono correttamente, nulla in dmesg.
Temperature, carico e voltaggi ultimo giorno memorizzato prima del problema.

A qualcuno è mai capitato qualcosa di simile?