PDA

View Full Version : "problemino" con xfs


/\/\@®¢Ø
15-01-2004, 11:56
riassunto:
per motivi sconosciuti mi si pianta il computer durante una compilazione intensiva.
Riavvio e mi trovo col seguente messaggio durante il boot


XFS mounting filesystem ide0(3,2)
Starting XFS recovery on filesystem: ide0(3,2) (dev: 3/2)
Unable to handle kernel NULL pointer dereference at virtual address 00000008
printing eip:
c0233e01
*pde = 00000000
Oops: 0000
CPU: 0
EIP: 0010:[<c0233e01>] Tainted: P
EFLAGS: 00010202
eax: 00000003 ebx: 00000000 ecx: c1f59cdc edx: c1dfd960
esi: 00000001 edi: c2135410 ebp: c21da400 esp: c1ebdbf0
ds: 0018 es: 0018 ss: 0018
Process mount (pid: 367, stackpage=c1ebd000)
Stack: c1dfd960 00000000 00000000 c1f59c20 c2135410 c024f260 c2135410 00000001
00000005 00000000 00000000 00000001 00000000 c2135430 c2135410 c23f6360
c024f5c2 c2135410 c1ebdc58 c1ebdc54 00000000 00000000 00000001 00000000
Call Trace: [<c024f260>] [<c024f5c2>] [<c0262b76>] [<c02613f8>] [<c01d5062>]
[<c01d5b9e>] [<c024045e>] [<c0241739>] [<c023040e>] [<c02383cc>] [<c0242fc9>]
[<c026118d>] [<c0235b4e>] [<c024b0be>] [<c0261e53>] [<c0261cdd>] [<c01c1999>]
[<c01c28c2>] [<c01c18fa>] [<c01c2c91>] [<c01d87a0>] [<c01d8b0f>] [<c01d902f>]
[<c018415b>]

Code: 8b 43 08 85 c0 0f 85 94 00 00 00 85 f6 0f 85 7f 00 00 00 80


In effetti la partizione /dev/hda2 risulta non montata.
Se provo a montarla mount si pianta (non un errore, non un messaggio, non un segfault)
Idem se profo a fare un check sulla partizione.
Ora, a parte il riformattare da zero la partizione (viste le esperienze positive, direi ne' xfs, ne' reiserfs :rolleyes: ), c'e' qualcos'altro che posso fare ?

ilsensine
15-01-2004, 12:00
Se provo a montarla mount si pianta (non un errore, non un messaggio, non un segfault)
Idem se profo a fare un check sulla partizione.
E' avvenuto un oops, quindi forse è rimasto bloccato qualche mutex nel layer vfs.

Avvia il computer senza montare quella partizione, quindi senza procurare oops. Fai quindi un check della partizione.

Visti i sintomi, anche un check della memoria con memtest86 non sarebbe male.

/\/\@®¢Ø
15-01-2004, 12:20
hai ragione... in questo modo ho sistemato, ora provo col memtest86, ma e' strano, windows stava su diverse settimane di fila senza un problema (che e' tutto dire :D)

/\/\@®¢Ø
15-01-2004, 14:45
mah, il test della memoria sembra ok :confused:
La temperatura della cpu sembra entro i parametri normali.

Visto che lo tengo sempre sotto stress ( tra compilazioni,kde, amule e compagnia e' generalmente tra 4-5 di load :D), e' possibile che questo abbia portato alla luce qualche bug strano in uno dei driver ?!
(mi vengono in mente quelli del modem adsl, ma dovrebbe lavorare in usermode...)

Grazie mille per la dritta comunque :)

ilsensine
15-01-2004, 14:53
EIP: 0010:[<c0233e01>] Tainted: P

Che spazz...ehm driver proprietario stai usando?

/\/\@®¢Ø
15-01-2004, 15:04
i driver Kyro sono loro vero ? :D :muro:

ilsensine
15-01-2004, 15:27
Dovresti cercare di riprodurre il problema con il kernel Not Tainted per poterlo escludere.
In ogni caso, non è bello che l'xfs va in oops se il fs è corrotto.

lovaz
15-01-2004, 15:28
Hai overclock?

Jøhñ Ðøë
15-01-2004, 15:30
xfs è una bestia delicata... io l'uso sulla tmp finchè non mi procaccio un UPS....

/\/\@®¢Ø
15-01-2004, 15:39
Faro' un paio di prove, ma e' possibile che abbia combinato qualche
problema io durante l'installazione iniziale, ci sono anche altre cose che non mi quadrano (tipo amule e xmule che mi mandano la percentuale di occupazione della cpu da parte del sistema (voce system su top) anche a 30%-40% :confused:, mldonkey non me lo fa )
Non e' un sistema overcloccato; e' un Duron 800, tra l'altro con settaggi da bios abbastanza conservativi (memoria a 100 Mhz ad esempio).
Pur non avendo bisogno di grafica 3D tengo la Kyro perche' l'alternativa a' una Rage Pro con soli 4 MB di ram, troppo pochi per avere colori e risoluzioni sufficientemente elevati.
Il kernel e' quello "standard" (ovvero patchato all'inverosimile :D) di gentoo, adesso ne ho uno ricompilato, ma a parte il supporto xfs e un'altra cosa praticamente tutte le funzionalita' "sperimentali" sono disabilitate. Quando ho un po' di tempo provo a vedere se con il 2.6.x il problema si ripresenta.

/\/\@®¢Ø
15-01-2004, 15:43
Originariamente inviato da Jøhñ Ðøë
xfs è una bestia delicata... io l'uso sulla tmp finchè non mi procaccio un UPS....
Sara' pure delicato, ma secondo me un filesystem non dovrebbe fare scherzi del genere; perdere dati e' un conto, ma far uscire errori di segmentazione durante il boot (e costringermi a cancellare il file di journal per sistemarlo, tanto vale tenersi l'ext2 :p )...

ilsensine
15-01-2004, 15:46
Originariamente inviato da /\/\@®¢Ø
Pur non avendo bisogno di grafica 3D tengo la Kyro perche' l'alternativa a' una Rage Pro con soli 4 MB di ram
Parti con il driver vesa per fare i test, poi rimetti il driver normale.
Ricorda che per avere il kernel "not tainted" non devi mai caricare il driver DRI della kyro (non basta caricarlo e scaricarlo).

/\/\@®¢Ø
20-01-2004, 16:15
Piccolo aggiornamento: il driver vesa causa meno problemi (che pure ogni tanto ci sono ancora). Il problema piu' grosso ora e' il seguente: ci sono alcuni files che mi danno un errore "990" anche solo a cercare di visualizzarne il nome con ls.
Io ho riavviato il sistema da cd, e ho eseguito xfs_repair sulla partizione incriminata. Ad un certo punto xfs_repair mi dice che ha trovato un errore "990", e che per proseguire devo prima correggerlo... eseguendo xfs_repair sulla partizione ! ( doh ! :D ).
Che faccio :confused: ?

maxithron
20-01-2004, 16:33
Prova questo nel file xfs_mount.c:


/*
* Get and sanity-check the root inode.
* Save the pointer to it in the mount structure.
*/
error = xfs_iget(mp, NULL, sbp->sb_rootino, XFS_ILOCK_EXCL, &rip, 0);
if (error) {
cmn_err(CE_WARN, "XFS: failed to read root inode");
goto error3;
}



e prova a cambiare la linea in neretto con:


cmn_err(CE_WARN, "XFS: failed to read root inode (%d)", error);

ilsensine
20-01-2004, 16:36
Originariamente inviato da maxithron
Prova questo nel file xfs_mount.c:

Quale sarebbe il significato metafisico di quella patch? (ovvero: in pratica cosa cambia a parte cambiare il messaggio?)

maxithron
20-01-2004, 16:41
Originariamente inviato da ilsensine
Quale sarebbe il significato metafisico di quella patch? (ovvero: in pratica cosa cambia a parte cambiare il messaggio?)

Semplicemente che attraverso il "%d" di ottenere un identificativo di errore (se possibile) più preciso.

ilsensine
20-01-2004, 17:04
Originariamente inviato da maxithron
Semplicemente che attraverso il "%d" di ottenere un identificativo di errore (se possibile) più preciso.
Bè il codice d'errore viene comunque restituito dalla funzione e dovrebbe arrivare infine al programma che ha causato l'esecuzione della funzione...

/\/\@®¢Ø
20-01-2004, 18:25
Originariamente inviato da maxithron
Semplicemente che attraverso il "%d" di ottenere un identificativo di errore (se possibile) più preciso.
Il problema non e' il messaggio in se' (a quanto sembra indica "filesystem corrotto"), il problema e' che non me lo corregge nemmeno il tool che dovrebbe farlo con partizione non montata

HenryTheFirst
20-01-2004, 18:59
IO una volta ho avuto un problema del genere, ma la partizione era ext3. Praticamente ho avuto un crash di sistema e al boot al momento del montaggio della partizione incriminata si è bloccato tutto di nuovo con un messaggio "oops". Al successivo boot è partito fsck, al 25% di nuovo un blocco, e questo capitava ad ogni boot sempre alla stessa percentuale. Ho avviato col cd di debian e ho provato fsck da lì: di nuovo in crash. Alla fine era il cavo ide rotto, sostituito quello è tornato tutto a funzionale alla perfezione. Non credo sia il tuo caso però :(

maxithron
20-01-2004, 23:38
Ho trovato questi post di utenti che hanno avuto il tuo stesso identico problema:

http://article.gmane.org/gmane.comp.file-systems.xfs.general/8959

http://linux-xfs.sgi.com/projects/xfs/mail_archive/200208/msg00297.html

ed, almeno in apparenza, attualmente è senza soluzione.

Leggi un pò più approfonditamente perchè io non l'ho fatto e quindo spero di sbagliarmi.

EDIT: prova anche qui: http://oss.sgi.com/archives/linux-xfs/2003-03/

/\/\@®¢Ø
21-01-2004, 00:30
Grazie mille per l'interessamento. :)
Vedro' cosa riesco a fare.

maxithron
21-01-2004, 00:33
Originariamente inviato da /\/\@®¢Ø
Grazie mille per l'interessamento. :)
Vedro' cosa riesco a fare.

E magari se riesci facci sapere perchè sarebbe utile (almeno per me) capire qualcosa in +.