Jak počítat/Správa úloh

From MetaCentrum
Jump to: navigation, search

(English version)

Důležité odkazy
Video tutoriál


Sledování stavu úlohy

Sledovat vaše úlohy můžete pomocí online aplikace PBSmon:


Úlohu je také možné sledovat pomocí jejího ID (jobID) a terminálu. Například:

qstat -u <login> vypíše běžící a čekající úlohy uživatele
qstat -x -u <login> vypíše dokončené úlohy uživatele
qstat -f <jobID> vypíše detaily čekající nebo běžící úlohy
qstat -x -f <jobID> vypíše detaily ukončené úlohy

Sledování stavu probíhající úlohy

Pokud chce sledovat výstupy úlohy, která ještě neskočila, následujte tyto kroky:

1.Nalezněte stroj, na kterém úloha běží -> použijte např. PBSmon

2. Přihlaste se cílový stroj z jakéhokoliv čelního uzlu pomocí příkazu ssh cílový_stroj. Např. ssh zapat112.cerit-sc.cz

3. Přejděte do adresáře /var/spool/torque/spool/, kde najdete dva soubory:

  • $PBS_JOBID.OU pro standardní výstup (stdout – např., “1234.arien.ics.muni.cz.OU”)
  • $PBS_JOBID.ER pro standardní chybový výstup (stderr – např., “1234.arien.ics.muni.cz.ER”)

Prohlížení standardního výstupu a standardního chybové výstupu

ZarovkaMala.png Note: Pokud použijete parametr -m abe, tak budete automaticky upozornění, že vaše úloha skončila

Když vaše úloha skončí (nezáleží jak), tak se automaticky vytvoří dva soubory v adresáři, ze které byla úloha odeslána. Jeden reprezentuje standardní výstup a druhý standardní chybový výstup:

 <job_name>.o<jobID> # contains job's output data
 <job_name>.e<jobID> # contains job's standard error output

Tyto soubory můžete prozkoumat, abyste našli vaše výsledky, chyby a podobně:

 cat ./myjob.sh.o12345   # shows job's standard output
 cat ./myjob.sh.e12345   # shows job's standard error output

Ukončení úlohy

Nucené ukončení úlohy je možné pomocí terminálu, příkazu qdel a jobID. Například:

qdel 12345 # terminates the job with ID 12345