PDA

View Full Version : Problema serio Server HP-Switch Netgear-WS2003-XP


progineer
11-09-2006, 20:51
Ciao a tutti. Mi scuso anticipatamente se non è questo il posto giusto per porre il mio problema, ma non ho trovato una discussione più adatta.
Ho un grave problema che non riesco a risolvere: Lan piccolo ufficio composta da Server HP Proliant 380DL G4 (1 Gb ram, 2 Schede di rete in teaming, 3x300Gb Uwscsi in raid 5), Switch Netgear GS724Tv1 (24 porte 10/100/1000) + n.6 client di varia composizione (tutti con almeno Hd SATA da 120 Gb, 2 Gb Ram, Sk. rete integrate di diversa velocità, da 10/100 a 1 Gb). La rete è cablata con cavi e plug schermati cat.6 (per i client a 1 Gb) e cat. 5e (per i client a max 100 M).
Il sistema funziona (credo) discretamente per quanto concerne le velocità di trasferimento, con punte max di 350 Mbit/sec.
Il problema di cui parlavo è uno strano blocco che ripetutamente avviene, nel momento in cui si clicca per accedere ad una risorsa condivisa sul server (ad esempio una cartella). Il client che richiede l'accesso si pianta anche per 10-20 secondi e contemporaneamente il blocco si trasmette a TUTTI gli altri client collegati al momento. Come per magia, superati questi secondi, tutto riprende a funzionare e anche abbastanza velocemente.
Ho provato decine di modifiche alle configurazioni delle schede client e del server (disattivando ad esempio il team), ma senza ottenere risultati.
Ho dei dubbi che possa trattarsi del WS2003sp1 oppure del raid 5 con soli 3 dischi.
Ne all'HP, ne alla Netgear hanno trovato soluzioni al problema: l'ultimo loro suggerimento era che lo stesso poteva risiedere nell'adapter timing che gestisce le due schede sul server (non so esattamente di cosa si tratti). Mi hanno consigliato anche di usare il teaming o "port aggregation" solo se fossi stato sicuro che lo switch lo supportava (ma questo Netgear non è riuscita a dirmelo...). Con gli stessi cavi e un serverino (XP o 2000) con n.1 disco 72 Gb e controller SCSI Adaptec andavo più veloce e senza blocchi!
Aiuto! Sono disperato!!

stepvr
11-09-2006, 21:15
Visto che hai un sistema HP e se non lo hai ancora fatto, insieme al computer e' arrivato anche un CD con lo smartstart. Su quel CD ci sono sono tutti gli agenti per il monitor del sistema DL380 (cerca il setup.exe per W2k3). Installali e poi vedi cosa ti dicono; se c'e' un problema hardware ti verra' segnalato immediatamente attrverso i log HP e di sistema.

progineer
11-09-2006, 21:40
Si, tutti i test sono stati eseguiti più volte nella fase iniziale, quando ero convinto che fosse il server. A dire il vero, risultava un errore di perfomance su un HD, prontamente sostituito da HP: ma nulla è migliorato.
Il forte dubbio è che possa essere un problema di compatibilità swicth-server, oppure scarse perfomance di quest'ultimo, magari dovute al SO, oppure anche al solo Gb di ram (ma osservando le risorse di sistema, questa non viene utilizzata granchè), oppure (cosa forse più probabile) al sistema raid 5 con soli 3 Hd... Bò?! :cry:

stepvr
11-09-2006, 22:57
Si, tutti i test sono stati eseguiti più volte nella fase iniziale quando ero convinto che fosse il server. A dire il vero, risultava un errore di perfomance su un HD, prontamente sostituito da HP

Perfetto. Pero' installa gli agenti anche per il funzionamento normale. Ti mantengono il sistema sempre in monitor. Scarica da internet l'ultima versione di smartstart per w2k3.


Il forte dubbio è che possa essere un problema di compatibilità swicth-server

Puo' essere. Fissa la velocita' della scheda rete del server a 1000 (il full duplex e' gia' obbligatorio, a questa velocita'). Lascia il teaming in automatico. Se lo switch lo supporta, aggrega 2 porte in modo da portare la velocita' a 2 Gbps.


oppure scarse perfomance di quest'ultimo ...

difficile con 48 Gbps di banda passante. Casomai controlla se ci sono aggiornamenti del firmware.


magari dovute al SO, oppure anche al solo Gb di ram (ma osservando le risorse di sistema, questa non viene utilizzata granchè)

No.


oppure (cosa forse più probabile) al sistema raid 5 con soli 3 Hd... Bò?!
Neppure. L'accesso alla rete non ha nulla a che fare con i dischi. Casomai con la velocita' di trasferimento. Poi darebbero problemi ben piu' gravi di un blocco di qualche secondo.

Penso che il tuo problema potrebbe invece derivare da un crash del firmware dello switch (controlla se c'e' relazione tra il tempo del blocco e il tempo di avvio dello switch) o dalla risoluzione dei nomi in rete associata con l'autenticazione degli utenti. Da Windows 2k in su' e' privilegiato l'uso del DNS. Se conosci l'argomento installa sul server il DNS interno facendolo puntare da tutti i computer della rete, server compreso.

Edit: Quando hai acquistato il server (mm/aaaa)? Per l'hardware restringerei la cerchia solo sul firmware e sui parametri di configurazione delle schede di rete e sullo switch Netgear che essendo management via browser dovrebbe offrirti un monitor e le statiche sulle varie porte, compresi gli errori.

progineer
12-09-2006, 14:18
Ok, grazie e vediamo come puoi aiutarmi ulteriormente...
1) mi dai una dritta su dove trovare smartstart?
2) per la velocità e per il teaming, già tutto fatto da tempo. Ho anche provato le diverse modalità supportate, ma senza risultati;
3) per quanto riguarda i firmware e driver, tutto aggiornato;
4) purtroppo non sono espertissimo e quindi non conosco l'uso del DNS: come posso eseguire tutto quanto mi hai suggerito?
5) il server e lo switch sono di ottobre 2005: è vero, quest'ultimo offre il management, ma ripeto non sono esperto. Vedo però che sulle porte del server, vi sono errori di una certa importanza (in termini di numero): non ve ne dovrebbero essere?
Grazie!

stepvr
12-09-2006, 16:58
1) mi dai una dritta su dove trovare smartstart?

Solo driver e agenti (Support Pack) per:
Windows 2k3 32 bit: qui. (http://h18000.www1.hp.com/support/files/server/us/download/24537.html)
Windows 2k3 64 bit: qui. (http://h18000.www1.hp.com/support/files/server/us/download/24538.html)

Immagine ISO SmartStart 7.51: qui. (http://h18000.www1.hp.com/support/files/server/us/download/24733.html)

Supporto completo software e driver per:
Windows 2k3 32 bit: qui. (http://h18000.www1.hp.com/support/files/server/us/locate/69_5561.html)
Windows 2k3 64 bit: qui. (http://h18000.www1.hp.com/support/files/server/us/locate/1111_5561.html)


2) per la velocità e per il teaming, già tutto fatto da tempo. Ho anche provato le diverse modalità supportate, ma senza risultati;
3) per quanto riguarda i firmware e driver, tutto aggiornato;

Con gli ultimi 2 link sopra puoi controllare tutte le versioni del firmware del DL380 G4.


4) purtroppo non sono espertissimo e quindi non conosco l'uso del DNS: come posso eseguire tutto quanto mi hai suggerito?

E' dura senza un minimo di conoscenza e forse inutile visto il punto 5).


5) il server e lo switch sono di ottobre 2005: è vero, quest'ultimo offre il management, ma ripeto non sono esperto. Vedo però che sulle porte del server, vi sono errori di una certa importanza (in termini di numero): non ve ne dovrebbero essere?
Grazie!
Assolutamente no. Errori non devono essercene di nessun tipo!
Su quante porte dello switch ci sono errori?
Che tipo di errori?
I cavi e il cablaggio sono in ordine?

progineer
12-09-2006, 20:09
Innanzitutto grazie per il tuo aiuto e precisione.
Collegandomi ai link, ho avuto conferma che si trattava dei drivers e degli aggiornamenti rom: tutte cose già fatte.
Non ho ben capito però come potrei monitorare in continuo il sistema e con quali utility.
Riguardo gli errori, eccoti una videata tipica: la porta 21 è una delle due del server, mentre quella 10, serve un computer molto distante (circa 70 metri di cavo) che è quasi sempre spento.
Questi errori (o almeno quelli del server) non dovrebbero esserci?? :confused:
Il sistema operativo, non centra nulla?
Non so se mi sono spiegato: vedi questi blocchi totali della rete per 10-20 secondi e poi tutto riprende istantaneamente a funzionare...

stepvr
12-09-2006, 20:43
Non ho ben capito però come potrei monitorare in continuo il sistema e con quali utility.

Nel pacchetto di supporto del server HP sono compresi gli agenti dell'Insight Manager di cui hai il CD. Questi agenti tengono costantemente in monitor tutto il computer segnalando sugli eventi le anomalie. Se vuoi ti spediscono anche un e-mail di allarme.


Riguardo gli errori, eccoti una videata tipica: la porta 21 è una delle due del server, mentre quella 10, serve un computer molto distante (circa 70 metri di cavo) che è quasi sempre spento.

Non e' obbligatorio lavorare con entrambre le schede ethernet collegate allo switch.
Prova a staccare il cavo di rete dalla porta 21 (server) lasciando il teaming. Se tutte le configurazioni sono giuste, il server continuera' a lavorare tranquillamente con una sola scheda..
Se per qualche giorno non rilevi blocchi il problema si restringe al solo switch che potrebbe non supportare correttamente il protocollo del teaming.


Questi errori (o almeno quelli del server) non dovrebbero esserci?? :confused:

No.


Il sistema operativo, non centra nulla?

Una volta tanto non c'entra. :sperem:

progineer
13-09-2006, 11:55
Presumo siano quelli raggiungibili dal "System Management Homepage for Server", come ad esempio "Hp Insight Diagnostic".
Sono dei test che effettuo periodicamente: il risultato è stato sempre "no failed/degraded items".
Non so come si fa a tenerli sempre attivi ne a farmi spedire la mail (che comunque non potrei attivare, vista l'assenza di connessione adsl).
Comunque ho già staccato la porta 21 (tutto continua a funzionare) e resettato la pagina per vedere se si verificano altri errori: nel caso la tua ipotesi fosse quella giusta, dovrei buttare lo switch? :muro:
Grazie comunque!

stepvr
13-09-2006, 12:59
Presumo siano quelli raggiungibili dal "System Management Homepage for Server", come ad esempio "Hp Insight Diagnostic".
Sono dei test che effettuo periodicamente: il risultato è stato sempre "no failed/degraded items".
Non so come si fa a tenerli sempre attivi ne a farmi spedire la mail (che comunque non potrei attivare, vista l'assenza di connessione adsl).

Esatto, quindi sono gia' installati e attivi. Non c'e' bisogno di altro.
Ora che hai staccato il link a una delle 2 schede rete vedrai, nei log di sistema del server, un allarme per l'evento. Lo vedrai anche utilizzando "System Management Homepage for Server".


nel caso la tua ipotesi fosse quella giusta, dovrei buttare lo switch? :muro:

Eh no, troppo facile! Se per qualche giorno non ci sono problemi :sperem:, segnala a Netgear il problema (con molta calma :ahahah: ) riportando esattamente l'hardware HP e la configurazione in teaming.

progineer
13-09-2006, 17:03
Confermo l'evento e ti dico pure che da stamattina non ho più blocchi! forse ho perso leggermente in velocità, ma niente blocchi!! Grazie!
Attendo qualche giorno, ma per quanto riguarda Netgear mi sembra che da quell'orecchio non ci sentano: ho segnalato il problema da tempo e non mi hanno mai risposto! L'ultima volta che li ho chiamati, mi hanno quasi fatto capire che prima di "accusare" il loro swicht dovevo avere la rete completamente a posto! Bè la rete lo era, ma avevo alcuni dubbi sul server e sul s.o.... e quelli me li hai fugati del tutto! Va a finire che gli restituisco il prodotto e me ne compro uno Hp....!
Ti faccio ovviamente sapere, e.. accetto altri consigli su come imbrigliare Netgear!
Ciao e grazie ancora.