Check PBS

From Atlmiwiki

per controllare il (buon ) funzionamento del batch system bisogana collegarsi come root a t2-ce-01 ed eseguire i seguenti comandi:

showq

tipico output

........
255791             atlasprd       Idle     1  3:00:00:00  Wed Jan 24 14:59:25
Total Jobs: 754   Active Jobs: 55   Idle Jobs: 64   Blocked Jobs: 635


se il comando non risponde, provare con:

qstat |grep R|wc


se i due comandi vann in timeout bisogna riavvare pbs e maui

/etc/init.d/pbs_server restart
/etc/init.d/maui restart

a tal proposito c'e' un script nella home di root /root per uccidere e riavviare i servizi

/root/restart_torquemaui.sh


rieseguire i comandi di controllo (showq / qstat) aspettando 1/2 minuti per il refresh del batch system


altri comandi utili sono

qstat
pbsnodes -a 
qmgr -c 'l q @t2-ce-01'
diagnose 

Comandi utente

showq

Show job status and some job info


showbf [-v]

Check for immediately available CPUs and nodes


checkjob [-v] <job_id>

Check job status


canceljob <job_id>

Cancel a job, sending essentially a qdel to the pbs_server


showstart [-h] <job_id>

Show when job is scheduled to start