|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Nov 2005
Messaggi: 1868
|
kernel: BUG: warning at kernel/cpu.c:51/unlock_cpu_hotplug()
Ciao a tutti,
come da titolo ho un problema. Ho un server che mi logga quell'errore nel kern.log, mi sto documentando in rete ma non ho trovato ste gran chè, a parte un documento dove si accenna al fatto che, secondo gli sviluppatori, quel warning non può accadere... La CPU è un "Intel(R) Xeon(R) CPU E5320 @ 1.86GHz" dovrebbe essere un 2 core HT. Distro debian4.0 (stable) kernel 2.6.18-4-686. il log di un warning è: Codice:
Sep 28 07:43:12 XXXX kernel: BUG: warning at kernel/cpu.c:51/unlock_cpu_hotplug() Sep 28 07:43:12 XXXX kernel: [<c0132a7c>] unlock_cpu_hotplug+0x2c/0x54 Sep 28 07:43:12 XXXX kernel: [<c01187a3>] sched_getaffinity+0x67/0x6e Sep 28 07:43:12 XXXX kernel: [<c01187c9>] sys_sched_getaffinity+0x1f/0x41 Sep 28 07:43:12 XXXX kernel: [<c0102c11>] sysenter_past_esp+0x56/0x79 Potrei aggiornare il kernel ma siccome è in produzione son disposto a farlo solo quando sarò abbastanza sicuro che risolverebbe il problema... Consigli? Grazie a tutti!
__________________
[ W.S. ] Ultima modifica di W.S. : 28-09-2007 alle 11:09. |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Roma
Messaggi: 15625
|
Sì quel warning NON può accadere.
Possibili cause, in ordine decrescente di probabilità: - usi qualche driver proprietario - problema di memoria (una botta di memtest ogni tanto sulle macchine di produzione non fa male) - qualche oscura corruzione della memoria occorsa in altre parti del kernel
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12 |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Nov 2005
Messaggi: 1868
|
Ok, driver proprietari non ne uso, l'unica cosa non libera sono i pacchetti sun-java5 necessari ad alcuni servizi.
Appena posso vado di memtest (intendi il memtest di sysutils vero? Non memtest86, per quello andrebbe riavviata la macchina o sbaglio?). Cmq, memtest appesantisce molto la macchina? Ci metterà parecchio giusto? Memoria corrotta per altri motivi spero di no, inizialmente sospettavo qualche rootkit ma visto che l'installazione è tutto sommato recente, macchina poco esposta, segnali sospetti non ne ho visti e chkrootkit non segnala problemi son abbastanza tranquillo. (cmq nn si sa mai) Grazie mille!
__________________
[ W.S. ] |
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Roma
Messaggi: 15625
|
intendevo proprio memtest86...
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12 |
|
|
|
|
|
#5 |
|
Senior Member
Iscritto dal: Nov 2005
Messaggi: 1868
|
azz.. quindi devo riavviare e (soprattutto) accedere fisicamente alla macchina? Questo è un grosso problema...
__________________
[ W.S. ] |
|
|
|
|
|
#6 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Roma
Messaggi: 15625
|
già, inoltre con la possibilità che memtest86 non riporti nulla...non becca tutti gli errori hw possibili...
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12 |
|
|
|
|
|
#7 |
|
Senior Member
Iscritto dal: Nov 2005
Messaggi: 1868
|
ok, grazie mille per i suggerimenti!
__________________
[ W.S. ] |
|
|
|
|
|
#8 |
|
Registered User
Iscritto dal: Feb 2005
Messaggi: 1856
|
non è che magari cè qualche problemino con quel kernel e il supporto di una piattaforma core 2 duo, visto che a me quel procio non mi sembra tanto un HT ma uno con tecnologia appunto core (o negli xeon Core 2 cè anche l'HT :o, io non lo so).
cmq che chipset hai, magari è un problema lì e visto che gli Intel hanno il controller di memoria nel chipset chissa (io sto solo ipotizzando cmq anche a me quel kernel sul mio laptop core due (yonah , no merom) non andava propio bene, ora invece con il 2.6.22 và da dio speriamo risolvi |
|
|
|
|
|
#9 |
|
Senior Member
Iscritto dal: Nov 2005
Messaggi: 1868
|
Son abbastanza sicuro si tratti di un 2 core + HT (vedo 4 cpu in /proc/cpuinfo e tra i flag c'è ht). Inoltre m'han sempre detto che son dual core.
Cmq, a prescindere dal numero di core Cmq, potresti aver ragione
__________________
[ W.S. ] |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 11:37.




















