View Full Version : [INFO] Server down poi riavviato, cos'è successo ???
Il problema è tanto semplice quanto problematico (forse) :
Ieri pom il mio server è andato down completamente (anke via ssh nn riuscivo a collegarmi)...
Questa mattina i tecnici della web-farm dove risiede hanno attaccatto 1 monitor ed hanno trovato 1 triste skermata nera.
Hanno riavviato la macchina ed ora è tutto OK ma ovviamente nn è OK x me xkè nn deve accadere ke un webserver linux su 1 woody si blokki totalmente (potrei concepire ke si blocca apache ma nn tutto il server)...
Visto ke dopo la posta i log (et simili) è la cosa ke conosco d- Quello ke vi chiedo è "semplicemente" questo :
Da dove parto x fare il "debug" della macchina x capire cos'è accaduto ieri ?
Grazie mille a tutti
l.golinelli
21-07-2004, 12:18
/var/log/message
/var/log/syslog
/var/log/apache/access.log
/var/log/maillog
Cosa fa il server?
Possibili problemi hardware?
Non è che sia gran che da fare, ma non credo fosse un DoS se era proprio nero lo schermo, a volte capita che vada in DoS e ci voglia parecchio a rispondere ai comandi...
Originariamente inviato da l.golinelli
/var/log/message
IERI sera mi si è bloccata 1 altra volta !!!
L'ultima cosa ke mi ha segnato LA PRIMA VOLTA KE MI SI E' BLOCCATA E' QUESTOè stata questa...:cry:
Jul 21 20:43:55 webserver -- MARK --
A parte questo nel message l'unica cosa ke c'è d "NON-normale" è questa :
kernel: PCI: Found IRQ 4 for device 00:10.2
kernel: IRQ routing conflict for 00:0f.0, have irq 7, want irq 4
kernel: IRQ routing conflict for 00:10.2, have irq 7, want irq 4
kernel: IRQ routing conflict for 00:10.3, have irq 7, want irq 4
Originariamente inviato da l.golinelli
/var/log/syslog
Ogni 5 minuti mi segnala questo
/USR/SBIN/CRON[13840]: (www-data) CMD (php4 /usr/share/cacti/cmd.php > /dev/null 2>&1)
Ogni 15 min circa mi segnala questo (ke è poi l'ultima cosa ke mi ha segnato dopo il SECONDO blocco)
/USR/SBIN/CRON[16376]: (mail) CMD ( if [ -x /usr/sbin/exim -a -f /etc/exim/exim.conf ];
then /usr$n /usr/sbin/exim -q ; fi)
Mentre c sono 1 marea d questi messaggi :
qmail: 1090344372.597714 alert: cannot start: qmail-send is already running
Originariamente inviato da l.golinelli
/var/log/apache/access.log
A parte ke è enorme, tant'è ke lo devo ruotare ogni giorno, per il resto è pieno d soli GET ecc ecc
Originariamente inviato da l.golinelli
/var/log/maillog
In mail.info mail.err e mail.log ho sempre e solo 1 marea d questi messaggi :
qmail: 1090344372.597714 alert: cannot start: qmail-send is already running
Originariamente inviato da l.golinelli
Cosa fa il server?
Non risponde più.... via ssh mi da impossibile connettersi, il sito risulta down.....
NOTA : Attualmente mi si è bloccata x la terza volta.... :(
Il fatto particolare è ke la prima e la terza volta mi si è bloccata proprio quando ho dato il comando
./configure
per cercare d installare qmailadmin....
Mi si è bloccato in un passo ke diceva tipo "checking usign c (o gcc) compiler...."
l.golinelli
22-07-2004, 13:11
Sembrano prob. hardware...
Cmq anche i logs non sembrano normali... Sei sicuro di aver fatto delle installazioni pulite?
Cosa c'entra exim? E quell'errore di qmail-send poi...
Originariamente inviato da l.golinelli
Sembrano prob. hardware...
Cmq anche i logs non sembrano normali... Sei sicuro di aver fatto delle installazioni pulite?
Cosa c'entra exim? E quell'errore di qmail-send poi...
Sono partito da una Debian Woody ed ho installato i vari servizi via apt-get.... mail-server a parte...
Exim me lo kiedevo ank'io cosa c'entrasse MA nn lo conosco... ke è ? Serve x qlc altro servizio ?
La posta l'ho installata tramite qmail-run+courier-pop(via apt) x quello ke riguarda qmail mentre vqadmin e vpopmail li ho installati dai sorgenti....
Indubbiamente c'è qlc ke nn va nella posta MA nn riesco a capire dove....
E poi possibile ke un ./configure impalli una macchina ?
tnk
l.golinelli
22-07-2004, 13:27
Un ./configure non impalla una macchina ma un prob. hardware sì...
Io consiglio -> memtest
exim è un server di posta...
Originariamente inviato da l.golinelli
Un ./configure non impalla una macchina ma un prob. hardware sì...
Io consiglio -> memtest
exim è un server di posta...
2 volte su 3 mi si è impiantata la macchina facendo
./configure cgidirpath=/usr/lib/cgi-bin
del pacchetto qmailadmin....
Si è bloccato sempre nello stesso punto....
Domanda :
1) Il prob. hardware viene eseguito dal configure ?
2) Azzo c fa sto exim sulla mia woody ? IO nn ce l'ho, volontariamente, installato.. Possibile ke c'era d default nell'installazione della woody 3.0rc2 ? Sai x caso se qmail lo usa ?
tnk
l.golinelli
22-07-2004, 15:05
qmail non lo usa di certo!
exim c'è per risolvere delle dipendenze... Per esempio se lo cavi ti toglie anche logrotate... Chissà poi perchè
Io debian l'ho cavata dappetutto, da oggi anche da http://imolug.no-ip.org
Hai modo di lanciare un memtest?
Originariamente inviato da l.golinelli
qmail non lo usa di certo!
exim c'è per risolvere delle dipendenze... Per esempio se lo cavi ti toglie anche logrotate... Chissà poi perchè
Ecco forse xkè l'ho tenuto....
Originariamente inviato da l.golinelli
Io debian l'ho cavata dappetutto, da oggi anche da http://imolug.no-ip.org
Come mai ? ^_^
Originariamente inviato da l.golinelli
Hai modo di lanciare un memtest?
Adesso lo lancio e t farò sapere :)
l.golinelli
22-07-2004, 15:16
Mi piace moto di più Slackware... :)
Per fare memtest devi partire col CD della gentoo e al boot digitare memtest [INVIO]
Originariamente inviato da l.golinelli
Mi piace moto di più Slackware... :)
Per fare memtest devi partire col CD della gentoo e al boot digitare memtest [INVIO]
ah.. questo nn lo posso fare.. il server è montato fuori-sede in 1 web-farm... ora io c accedo solo via ssh...
Come pacchetto debian ho trovato però
memtest86 - A thorough real-mode memory tester.
Penso ke possa andare bene =.. o no ? ^_^
l.golinelli
22-07-2004, 15:31
Prova, al massimo si blocca... :D :D :D
Originariamente inviato da l.golinelli
Prova, al massimo si blocca... :D :D :D
eh eh.. già ^_^
Cmq ho trovato ke eiste il pakketto chiamato sysutils ke ha questi tool :
SYSUTILS :
This is a package incorporating various small utilities which are:
* procinfo - Displays system information from /proc (v17).
* memtest - Test system memory for errors (v2.93.1).
* bogomips - Shows the current bogomips rating without rebooting (v1.2).
* tofromdos - Converts DOS <-> Unix text files (v1.4).
Quasi quasi lo installo e vedo se riesce a farmi questo test memory :P
diabolicus
22-07-2004, 16:58
/USR/SBIN/CRON[16376]: (mail) CMD ( if [ -x /usr/sbin/exim -a -f /etc/exim/exim.conf ];
then /usr$n /usr/sbin/exim -q ; fi)
questo deve essere rimasto dall'installazione di exim, che avendo messo qmail non c'è più. come tutto quello che fa cron, rimane nel log. soluzione: cercare il comando nel crontab o nelle varie /etc/cron.* e rimuoverlo. non è niente di dannoso comunque, "sporca" i log e basta.
anche io credo si tratti di un prob. hardware e probabilmente di ram MA per verificarlo, visto che la macchina te la mettono a disposizione, devi chiederlo a quelli della farm.. per esempio memtest quando lo installi ti trovi un'immagine di un floppy da scrivere con dd, e poi devi riavviare la macchina e fare il boot da floppy per eseguire il test e chiaramente non puoi farlo tu.
qmail: 1090344372.597714 alert: cannot start: qmail-send is already running
questo non va bene, ma i motivi possono essere tanti...
ti consiglio di cercare un pò nell'archivio di alt.comp.mail.qmail
Originariamente inviato da diabolicus
questo deve essere rimasto dall'installazione di exim, che avendo messo qmail non c'è più. come tutto quello che fa cron, rimane nel log. soluzione: cercare il comando nel crontab o nelle varie /etc/cron.* e rimuoverlo. non è niente di dannoso comunque, "sporca" i log e basta.
Toglierò dal cron exim MA è vero, come ha detto goli, che exim rimane x 1 strana dipendenza con logrotate ? Se sì, ke soluzioni c sono ? Togliere exim dal avvio automatico oppure rimuoverlo brutalmente ?
Originariamente inviato da diabolicus
anche io credo si tratti di un prob. hardware e probabilmente di ram MA per verificarlo, visto che la macchina te la mettono a disposizione, devi chiederlo a quelli della farm.. per esempio memtest quando lo installi ti trovi un'immagine di un floppy da scrivere con dd, e poi devi riavviare la macchina e fare il boot da floppy per eseguire il test e chiaramente non puoi farlo tu.
Manco se si installano le sysutil si può fare un memtest al volo ?
Originariamente inviato da diabolicus
questo non va bene, ma i motivi possono essere tanti...
ti consiglio di cercare un pò nell'archivio di alt.comp.mail.qmail
Più ke altro hai 1 qlc idea d cosa signifiki quel errore ? 1 "qualcosa" ke tenta d rilanciare qmail ?
TNK
edivad82
22-07-2004, 19:40
Originariamente inviato da l.golinelli
Io consiglio -> memtest
quoto...
di solito questi problemi sono di
ram
disco
kernel panic
edivad82
22-07-2004, 19:43
Originariamente inviato da The X
Manco se si installano le sysutil si può fare un memtest al volo ?
no ;)
Originariamente inviato da edivad82
quoto...
di solito questi problemi sono di
ram
disco
kernel panic
Allora penso (e spero) ke sia la ram visto ke il kernel è il 2.4.18-k7 scaricato da woody mentre i diski sono in raid 1 su un ctrl promise fast trak 100 tx4.....
Lunedì verrà cmq sostiuito al server MB+cpu+ram+alimentatore....
Speriamo bene :P
diabolicus
23-07-2004, 13:30
Originariamente inviato da The X
Toglierò dal cron exim MA è vero, come ha detto goli, che exim rimane x 1 strana dipendenza con logrotate ? Se sì, ke soluzioni c sono ? Togliere exim dal avvio automatico oppure rimuoverlo brutalmente ?
logrotate dipende da mailx, il quale a sua volta dipende da un mail-transport-agent, e in debian il default è exim. avendo tu installato qmail come pacchetto deb, adesso è qmail il mail-transport-agent, quindi le dipendenze di logrotate e mailx sono comunque soddisfatte.
non c'è bisogno di togliere exim dall'avvio perché exim non c'è.. prova un "dpkg -l exim" e guarda che ti dice.
l'errore su qmail, se sta sotto il controllo di daemontools allora supervise forse cerca di avviare o riavviare il servizio ma lo trova già in esecuzione... il perché di questo comportamento però non saprei proprio da cosa può dipendere.
/USR/SBIN/CRON[13840]: (www-data) CMD (php4 /usr/share/cacti/cmd.php > /dev/null 2>&1)
Non mi risulta che l'utenza www-data (usata di default per lanciare i child di apache) abbia automaticamente dei programmi in cron.
Ti consiglio di controllare quel file, sopratutto se non hai mai aggiunto a mano quella riga nel crontab e se non hai installato il software cacti (con apt-get ho visto che é un frontend di rrdtool che serve per monitorare servizi e sistemi).
Ciao
ma e' sempre quel famoso server web che si piantava per i semafori???
SZ
Originariamente inviato da Maestro
/USR/SBIN/CRON[13840]: (www-data) CMD (php4 /usr/share/cacti/cmd.php > /dev/null 2>&1)
Non mi risulta che l'utenza www-data (usata di default per lanciare i child di apache) abbia automaticamente dei programmi in cron.
Ti consiglio di controllare quel file, sopratutto se non hai mai aggiunto a mano quella riga nel crontab e se non hai installato il software cacti (con apt-get ho visto che é un frontend di rrdtool che serve per monitorare servizi e sistemi).
Ciao
L'avevo installato io cacti MA visto ke nn mi funzionava l'ho tolto...
Originariamente inviato da sanxius
ma e' sempre quel famoso server web che si piantava per i semafori???
SZ
SI, è sempre lui.... cmq il pc a causa dei semafori nn si bloccava MA nn si riavviava (ovvero apache continua a funzionare se lo si lasciava stare MA se io lanciavo il restart o lo stop dava quel famoso errore...)
Originariamente inviato da The X
L'avevo installato io cacti MA visto ke nn mi funzionava l'ho tolto...
su - www-data
crontab -l (vedi la lista)
crontab -r
così cancelli tutti i suoi entry nel crond ;)
Ciao
Originariamente inviato da Maestro
su - www-data
crontab -l (vedi la lista)
crontab -r
così cancelli tutti i suoi entry nel crond ;)
Ciao
Ok, deve averlo già fatto l'apt-get in fase d rimozione perchè se faccio crontab -l mi mostra solo
40 * * * * /home/vpopmail/bin/clearopensmtp 2>&1 > /dev/null
si se mostra solo quella entry è ok :)
l.golinelli
26-07-2004, 18:57
Ma il server poi aveva un prob. hardware?
Originariamente inviato da l.golinelli
Ma il server poi aveva un prob. hardware?
Eh... boh... in settimana c cambieranno skeda madre, cpu e upgraderanno la ram da pc2100@256mb a pc3200@512mb...
Da quando è successo nn si è + bloccato.... speriamo ke si risolvi con questo cambio....
Più ke altro mi fa strano ke un ./configure inkiodi totalmente una debian woody..
Originariamente inviato da Maestro
si se mostra solo quella entry è ok :)
Ora ho tolto exim e cacti dalle varie parti in cui erano erroneamente presenti...
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.