Controlli con il Glue Validator
E' stata creata una sonda di nagios che controlla, sito per sito, se lo strumento Glue Validator riporta degli errori relativi alle informazioni pubblicate. Per la fine di Novembre, gli allarmi generati da questa sonda diverranno critici, con conseguente apertura di ticket (l'availability di sito non verrà però intaccata)
Ad ogni sito che al momento sta fallendo questo
controllo di nagiosm viene richiesto di sistemare per tempo ogni errore, con l'aiuto dello script Glue Validator da lanciare sul site-bdii, e di riferire alla propria NGI qualunque incongruenza.
Le informazioni sullo script sono curate dagli sviluppatori:
http://gridinfo.web.cern.ch/glue/glue-validator-guide
I vari codici d'errore sono riportati in quest'altra pagina:
https://twiki.cern.ch/twiki/bin/view/EGEE/GLUEValidatorErrorCodes
E' importante usare l'opzione
-k in modo che verranno ignorati i known issue che non sono dovuti a problemi di configurazione
Esempio
Esempio di un sito in cui non ci sono errori (usare il livello di verbosità 3 per avere maggiori dettagli):
# ./glue-validator -H localhost -p 2170 -b o=glue -k -v 2
OK - errors 0, warnings 0, info 93 | errors=0;warnings=0;info=93
Summary per type of error, warning and info message:
I032 - Default value published (GLUE2ComputingShareMaxTotalJobs): 16
I033 - Default value published (GLUE2ComputingShareMaxRunningJobs): 10
I034 - Default value published (GLUE2ComputingShareMaxWaitingJobs): 16
I043 - Memory higher than 100,000 MB (GLUE2ComputingShareMaxMainMemory): 16
I045 - Memory higher than 100,000 MB (GLUE2ComputingShareMaxVirtualMemory): 16
I063 - Total instances less than 10 (GLUE2ExecutionEnvironmentTotalInstances): 2
I067 - Number of physical CPUs greater than 10 (GLUE2ExecutionEnvironmentPhysicalCPUs): 1
I086 - Total capacity size less than 1000 GB (GLUE2StorageServiceCapacityTotalSize): 3
I091 - Total share capacity size less than 1000 GB (GLUE2StorageShareCapacityTotalSize): 13
Situazione
--
AlessandroPaolini - 2013-10-28