PDA

View Full Version : Help, consiglio distribuzione x server troooppo recente.


Pigna
12-08-2005, 17:06
Ciao a tutti, avrei bisogno di un consiglio.

Devo installare Linux su due server HP ProLiant ML110 G2 che utilizzano un controller RAID SATA Adaptec 2610SA.

Questi server svolgeranno il compito di 2 fw in cluster e quindi hanno 3 schede di rete:
1 OnBorad Intel 82541GI/PI Gigabit
1 PCI 32bit Dlink RTL8139
1 PCI 64bit Dlink DL-2000

Ora i problemi sono 2.

1) Il controller essendo abbastanza recente viene riconosciuto da kernel > 2.6.10 e quindi per installare linux devo trovare una distro che di base utilizzi il suddeto kernel. Per il momento stavo testando Fedora RC4, ma anche ubuntu funziona.

2) Sembra che ci sia un problema con il driver della scheda di rete DL2000 poiche' dopo un po' che lavora si blocca e nel log appare il seguente errore:

[code]
Aug 10 14:44:28 fw1 kernel: NETDEV WATCHDOG: eth2: transmit timed out
Aug 10 14:44:28 fw1 kernel: eth2: Tx timed out (0000), is buffer full?
[code]

Come mi hanno suggerito e' un errore che si verifica quando, pur essendo presente il link e non essendoci collisioni, il driver della scheda di rete non riceve interrupt di "trasmesso" dalla scheda di rete entro un certo tempo.

Ho provato a cambiare il cavo, a cambiare la porta dello switch, perfino a cambiare la lan sulla quale la scheda lavora ma niente da fare, in'oltre il problema me lo danno tutte e due i server, quindi che siano rotte 2 schede su 2 (che fino a ieri andavano) mi sembra un po' strano.
Penso che sia + un problema di driver.

Ho provato il kernel 2.6.10, 2.6.11, 2.6.12 ma niente da fare il problema persiste.
Ho provato a cambiare distro e ho fatto le prove con Ubuntu (live CD 5.0.4), ma niente.

E come se nn bastasse la scheda non la posso cambiare poiche' e' l'unica che ho a 64bit.

Cosa posso fare?

WebWolf
13-08-2005, 07:42
Con tutto il rispetto per le distribuzioni che hai citato, ma, per esperienza personale, sui server io ci vedo solo la debian.

La versione sid sta lavorando molto sul riconoscimento hardware, ma una instable su un server non è la soluzione migliore, a meno che non siano prove.

Io proverei con la 3.1.

l.golinelli
13-08-2005, 09:00
Quali sono le distro certificate su quel server? Usa una di quelle, è un server non un gioco, deve essere stabile...

airon
13-08-2005, 09:29
Provato con gentoo stable??? Io ci proverei ;)

Ma Sara
13-08-2005, 12:17
Slackware, FreeBSD.

Herod2k
13-08-2005, 12:35
Debian Sarge o Trustix
http://www.trustix.org/

Pigna
17-08-2005, 08:16
Con tutto il rispetto per le distribuzioni che hai citato, ma, per esperienza personale, sui server io ci vedo solo la debian.

La versione sid sta lavorando molto sul riconoscimento hardware, ma una instable su un server non è la soluzione migliore, a meno che non siano prove.

Io proverei con la 3.1.

Si, ci avevo pensato ma il problema e' che nella 3.1 il cd di installazione utilizza il kernel 2.6.8 che non mi riesce a riconscere il controller SATA e di conseguenza non riesco ad installarla :(

Pigna
17-08-2005, 08:19
Quali sono le distro certificate su quel server? Usa una di quelle, è un server non un gioco, deve essere stabile...

Le distro certificate sono la RHES e la SUSE SLES.

Ma non e' un problema di certificazione poiche' la scheda di rete che mi da' dei problemi e' stata aggiunta dopo l'acquisto del server.

Probabilmente combiando scheda risolverei il problema, peccato che non ho schede a 64bit in casa.

Pigna
17-08-2005, 08:20
Provato con gentoo stable??? Io ci proverei ;)


Questa non l'ho ancora provata, quasi quasi... :)

Ci faro' un pensierino.

Pigna
18-08-2005, 15:45
Ok, sono riuscito a installare Debian 3.1. Pero' il problema della skeda di rete rimane, avete soluzioni?

WebWolf
18-08-2005, 20:22
Su un altro forum ho incontrato lo stesso tipo di problema, ma la soluzione proposta non credo piacerà: suggersicono di 'tornare' al kernel 2.4.

Qui la risposta completa:

It seems to me the cause of the tx timeouts is the "HostError", which
is a PCI bus error. This most likely caused the adapter to hang and
then the transmits started timing out.

As far as I can tell, the dl2k driver code is common between 2.4 and
2.6. So, some other change in the kernel is causing the driver to
behave differently and expose this problem.

I am not the maintainer, but I can try to assist you. However, it will
require running debug drivers (as I am not able to find any
documentation on this adapter). If you are not willing or able to do
this, then I would suggest going back to the 2.4 kernel.


Qui il link:

http://www.ussg.iu.edu/hypermail/linux/kernel/0412.2/0407.html


Poi spiegano cosa intendono per 'debug drivers'.

Pigna
19-08-2005, 09:18
Su un altro forum ho incontrato lo stesso tipo di problema, ma la soluzione proposta non credo piacerà: suggersicono di 'tornare' al kernel 2.4.

Qui la risposta completa:

It seems to me the cause of the tx timeouts is the "HostError", which
is a PCI bus error. This most likely caused the adapter to hang and
then the transmits started timing out.

As far as I can tell, the dl2k driver code is common between 2.4 and
2.6. So, some other change in the kernel is causing the driver to
behave differently and expose this problem.

I am not the maintainer, but I can try to assist you. However, it will
require running debug drivers (as I am not able to find any
documentation on this adapter). If you are not willing or able to do
this, then I would suggest going back to the 2.4 kernel.


Qui il link:

http://www.ussg.iu.edu/hypermail/linux/kernel/0412.2/0407.html


Poi spiegano cosa intendono per 'debug drivers'.

Si, l'avevo trovato anchio grazie a google.

Ho provato propio oggi con il 2.4.27 e (a parte la tribolata per l'installazione del controller RAID SATA) il problema della skeda di rete persiste :(

Ho provato a installare la patch che suggeriscono ma mi da' un errore

patch -p0 < patch1
patching file dl2k.c
patch: **** malformed patch at line 4: return 0;

e la patch nn si installa :(