PDA

View Full Version : Monitoring?


Shinobi
27-05-2013, 19:40
Salve a tutti, in questo periodo sto pensando alla creazione di uno strumento di reportistica che possa monitorare il buon andamento di operazioni eseguite dai vai software attualmente in uso.
L'ambiente da monitorare sarebbe eterogeneo e comprenderebbe tra gli altri:

-Arcserve e Symantec Backup Exec per il salvataggio su tape
-Prodotti Acronis per il backup di VM (Acronis backup and recovery, Acronis VMProtect)
-Scheduled task di windows (per esempio per il backup su disco di db MsSQL)

Attualmente per i primi due vengono utilizzate le notifiche via mail, ma penso che sia fattibile (oppure esista qualche prodotto) che permetta di monitorare lo stato dei lavoro da un unico pannello, magari tenendo anche uno storico dei job passati con il relativo esito. Avete qualche idea?
Attualmente per monitorare i vari host e apparati di rete a livello base usiamo NagiosCore (che se non sbaglio ha dei plugin per gli scheduled task ad esempio).

Grazie in anticipo.

Tasslehoff
27-05-2013, 23:35
Salve a tutti, in questo periodo sto pensando alla creazione di uno strumento di reportistica che possa monitorare il buon andamento di operazioni eseguite dai vai software attualmente in uso.
L'ambiente da monitorare sarebbe eterogeneo e comprenderebbe tra gli altri:

-Arcserve e Symantec Backup Exec per il salvataggio su tape
-Prodotti Acronis per il backup di VM (Acronis backup and recovery, Acronis VMProtect)
-Scheduled task di windows (per esempio per il backup su disco di db MsSQL)

Attualmente per i primi due vengono utilizzate le notifiche via mail, ma penso che sia fattibile (oppure esista qualche prodotto) che permetta di monitorare lo stato dei lavoro da un unico pannello, magari tenendo anche uno storico dei job passati con il relativo esito. Avete qualche idea?
Attualmente per monitorare i vari host e apparati di rete a livello base usiamo NagiosCore (che se non sbaglio ha dei plugin per gli scheduled task ad esempio).

Grazie in anticipo.Se avete già un'istanza Nagios funzionante siete a cavallo.

Non conosco Arcserve e ho usato pochissimo BackupExec però vedo che su NagiosExchange c'è un plugin per il primo (http://exchange.nagios.org/directory/Plugins/Backup-and-Recovery/ArcServe/CA-ARCserve-Backup-r12-Number-of-Job-Error-Check/details) e una pagina intera di plugin per il secondo (http://exchange.nagios.org/directory/Plugins/Backup-and-Recovery/BackupExec).

Per i prodotti Acronis, se genera un log testuale puoi usare un plugin di verifica log per cercare i pattern corrispondenti a errori, su linux c'è l'ottimo check_logwarn (http://exchange.nagios.org/directory/Plugins/Log-Files/check_logwarn/details), su Windows c'è CheckLogFile (http://www.nsclient.org/nscp/wiki/CheckLogFile) di NSClient++.
Fai attenzione però ad un dettaglio, generalmente i plugin che controllano i log si parsano il file di log che gli indichi nella definizione del service, in caso di pattern trovato rilevano l'errore e proseguono il controllo del log da quel punto in poi. Per questo motivo se hai settato il parametro max_check_attempts al valore di default (4) non riceverai mai notifiche (o meglio cambi di stato del service) a meno che Nagios non rilevi 4 pattern di errore nella stessa passata.
Per ricevere notifiche puntuali su ciascun errore presente nei log devi configurare il parametro max_check_attempts a 1 nel service (solo in quello, generalmente il valore di 4 va benissimo per evitare mille notifiche non significative).

Per gli scheduled tasks di Windows c'è l'apposito pluing di NSClient++, sia in versione per Win2k3 (http://www.nsclient.org/nscp/wiki/CheckTaskSched) che per Win2k8 e successivi (http://www.nsclient.org/nscp/wiki/CheckTaskSched2).

Shinobi
28-05-2013, 14:55
Se avete già un'istanza Nagios funzionante siete a cavallo.

Non conosco Arcserve e ho usato pochissimo BackupExec però vedo che su NagiosExchange c'è un plugin per il primo (http://exchange.nagios.org/directory/Plugins/Backup-and-Recovery/ArcServe/CA-ARCserve-Backup-r12-Number-of-Job-Error-Check/details) e una pagina intera di plugin per il secondo (http://exchange.nagios.org/directory/Plugins/Backup-and-Recovery/BackupExec).

Per i prodotti Acronis, se genera un log testuale puoi usare un plugin di verifica log per cercare i pattern corrispondenti a errori, su linux c'è l'ottimo check_logwarn (http://exchange.nagios.org/directory/Plugins/Log-Files/check_logwarn/details), su Windows c'è CheckLogFile (http://www.nsclient.org/nscp/wiki/CheckLogFile) di NSClient++.
Fai attenzione però ad un dettaglio, generalmente i plugin che controllano i log si parsano il file di log che gli indichi nella definizione del service, in caso di pattern trovato rilevano l'errore e proseguono il controllo del log da quel punto in poi. Per questo motivo se hai settato il parametro max_check_attempts al valore di default (4) non riceverai mai notifiche (o meglio cambi di stato del service) a meno che Nagios non rilevi 4 pattern di errore nella stessa passata.
Per ricevere notifiche puntuali su ciascun errore presente nei log devi configurare il parametro max_check_attempts a 1 nel service (solo in quello, generalmente il valore di 4 va benissimo per evitare mille notifiche non significative).

Per gli scheduled tasks di Windows c'è l'apposito pluing di NSClient++, sia in versione per Win2k3 (http://www.nsclient.org/nscp/wiki/CheckTaskSched) che per Win2k8 e successivi (http://www.nsclient.org/nscp/wiki/CheckTaskSched2).


Grazie mille per gli spunti, nei prossimi giorni vedo di mettermi d'impegno :)