Uzdevumu pārvaldība

Instrukcija sniedz pamatkomandas darbam ar klasteri – uzdevumu nosūtīšanai, rindas pārraudzībai un rezultātu saņemšanai. Instrukcija paredz, ka lietotājs ir veiksmīgi pieslēdzies piekļuves serverim.

Lietotāja mijiedarbe ar klasteri notiek, izmantojot piekļuves serveri, kurā ir instalēta Linux vide ar speciāliem Torque/Moab klastera klienta rīkiem (izstrādātāja dokumentācija http://docs.adaptivecomputing.com/torque/help.htm). RTU HPC klastera arhitektūra parādīta attēlā

RTU HPC klastera arhitektūra

  1. Katram HPC lietotājam ir izveidots darba apgabals, kur var glabāt ar uzdevumiem saistītos failus. Pieslēdzoties piekļuves servera komandrindai, automātiski nonāksiet savā darba direktorijā:

/home/<lietotāja vārds>

Failu sistēma starp klastera mezgliem un piekļuves serveri ir koplietota, tāpēc nav nepieciešama failu kopēšana uz un no izpildes mezgla un starp mezgliem.

  1. Komanda vienkārša uzdevuma nosūtīšanai:

qsub test.sh

test.sh ir bash valodas (Linux komandrindas) skripts, kurā lietotājs ieraksta secīgi izpildāmās komandas, uzdevumam nonākot skaitļošanas mezglā. Tas nodrošina pakešuzdevuma (batch) izpildi bez lietotāja līdzdalības. Skripts var saturēt, piemēram, šādu rindu:

__________________

echo “Sveiciens no nodes `/bin/hostname`”

__________________

Komanda izdrukā skaitļošanas mezgla vārdu. Varat izpildīt to arī lokāli. Skripta paraugs ir iekopēts Jūsu darba direktorijā.

Uzdevuma izpildes rezultāti tiks ierakstīti failos, kas parādīsies darba direktorijā ar nosaukumiem, piemēram, test.sh.o82 un test.sh.e82 (pirmajā būs standarta izvade, bet otrajā – kļūdas izvade).

Alternatīvi pakešuzdevumam var izmantot interaktīvu uzdevumu veidu:

qsub –I

Vairāk par qsub komandu varat iegūt informāciju, izpildot: man qsub

  1. Komanda, lai pārbaudītu uzdevuma izpildes gaitu:

qstat

R – running, C – completed, Q – queued

vai lai pārbaudītu uzdevumu rindu (par visiem lietotājiem):

showq

  1. Komanda, lai noskaidrotu pieejamos skaitļošanas resursus:

showbf

vai detalizētākai informācijai:

pbsnodes

  1. Paralēla uzdevuma izpilde:

Izpildīt uzdevumu uz 48 kodoliem (4 serveri · 12 kodoli katrā serverī)

$ qsub –q batch -l nodes=4:ppn=12 mpi.sh

vai nenorādot konkrētu mezglu skaitu

$ qsub –q batch -l procs=48 mpi.sh

  1. Uzdevuma prasības var pievienot palaišanas skripta sākumā:

#PBS -N gamess_job
#PBS -l walltime=24:00:00
#PBS -l nodes=4:ppn=12
#PBS -q batch
#PBS -j oe

  1. Uzdevuma pārtraukšana:

qdel >

  1. Failu kopēšana starp savu datoru un piekļuves serveri:
  • Windows lietotāji var izmantot WinScp vai Far failu menedžeri;

WinScp pieslēgšana līdzīgi kā PuTTY.

Kreisajā pusē būs redzami Jūsu datora faili, labajā – darba apgabals klastera pieejas serverī.

  • unix vidē – komandrindas scp vai kādu grafisko rīku.

N.B. LŪGUMS NEIZPILDĪT UZDEVUMUS LOKĀLI PIEKĻUVES SERVERĪ. To atļauts izmantot tikai uzdevumu palaišanai, programmu kompilēšanai un īsu uzdevumu testēšanai.