Pool PBS

From Atlmiwiki

Sulla macchina t2-ce-01 risiede il batch system PBS-Torque. L'architettura consiste nel CE (server pbs) e un certo numero di worker nodes. L'installazione dei servizi si effettua come specificato nella guida I files di configurazione da utilizzare con Yaim sono i seguenti:

vanno scaricati in un'apposita directory /root/siteinfo/ cui fanno riferimento durante le operazioni di configurazione

Nuovo nodo WN

  • Da qmgr sul server ce
    • create node <nodename> np=<num cpu>
    • set node properties=lcgpro
    • set node ntype=cluster
  • sul WN controllare che un utente standard mappato possa effettuare scp verso il CE:
   su - atlas001
   scp <testfile> $SITE_GIIS_URL:                   [variabile configurata da yaim col nome del CE]
  • sul WN controllare che il file /var/spool/pbs/mom_priv/config contenga il nome corretto del CE
  • sul CE il file /etc/ssh/ssh_known_hosts deve contenere l'id corretto del WN:
    • nel dubbio, eseguire sul CE:
   /opt/edg/sbin/edg-pbs-knownhosts
   /opt/edg/sbin/edg-pbs-shostsequiv

questi due comandi sono anche in crontab

  • Da 'qmgr, impostare lo stato a "disponibile":
    • set node <nodename> state=free

Stato nodi

  • digitare il comando pbsnodes per vedere lo stato attuale dei WN
  • pbsnodes -o <nodename> mette un nodo offline, per esigenze di manutenzione
  • pbsnodes -c <nodename> ripristina il nodo come disponibile
  • checknode <nodename> mostra i dati relativi a un nodo