IT wiki

VU MIF STSC

User Tools

Site Tools


en:hpc

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Next revisionBoth sides next revision
en:hpc [2022/04/19 12:52] – [Login] grikieteen:hpc [2022/07/04 08:17] grikiete
Line 66: Line 66:
   * **For other users (non-members of the VU community)** - you must fill in the [[https://forms.office.com/Pages/ResponsePage.aspx?id=ghrFgo1UykO8-b9LfrHQEidLsh79nRJAvOP_wV9sgmdUMDE1QUo3Slo3UVYwTjM4TDMyTEdZT0tSNi4u|ITOAC service request form]] to get access to MIF HPC. After the confirmation of your request, you must come to VU MIF Didlaukio str. 47, Room 302/304 to receive your login credentials. Please arranged the exact time by phone + 370 5219 5005. With these credentials you are able to create an account in [[https://hpc.mif.vu.lt|Waldur portal]]. More details read [[waldur|here]].   * **For other users (non-members of the VU community)** - you must fill in the [[https://forms.office.com/Pages/ResponsePage.aspx?id=ghrFgo1UykO8-b9LfrHQEidLsh79nRJAvOP_wV9sgmdUMDE1QUo3Slo3UVYwTjM4TDMyTEdZT0tSNi4u|ITOAC service request form]] to get access to MIF HPC. After the confirmation of your request, you must come to VU MIF Didlaukio str. 47, Room 302/304 to receive your login credentials. Please arranged the exact time by phone + 370 5219 5005. With these credentials you are able to create an account in [[https://hpc.mif.vu.lt|Waldur portal]]. More details read [[waldur|here]].
  
-====== Login ======+====== Connection ======
  
 You need to use SSH applications (ssh, putty, winscp, mobaxterm) and Kerberos or SSH key authentication to connect to **HPC**. You need to use SSH applications (ssh, putty, winscp, mobaxterm) and Kerberos or SSH key authentication to connect to **HPC**.
Line 72: Line 72:
 If **Kerberos** is used: If **Kerberos** is used:
  
-  * Log in to the Linux environment in a VU MIF classroom or public terminal with your VU MIF username and password+  * Log in to the Linux environment in a VU MIF classroom or public terminal with your VU MIF username and password or login to **uosis.mif.vu.lt** with your VU MIF username and password using **ssh** or **putty**.
-  * or login to **uosis.mif.vu.lt** with your VU MIF username and password using ssh or putty.+
   * Check if you have a valid Kerberos key (ticket) with the **klist** command. If the key is not available or has expired, the **kinit** command must be used.   * Check if you have a valid Kerberos key (ticket) with the **klist** command. If the key is not available or has expired, the **kinit** command must be used.
   * Connect to the **hpc** node with the command **ssh hpc** (password must not be required).   * Connect to the **hpc** node with the command **ssh hpc** (password must not be required).
-  * The **first time** you log in, you must wait **5 minutes** and then you can start to use HPC. 
  
-If **SSH keys** are used (e.g. : jei norite kopijuoti didelius failus): +If **SSH keys** are used (e.g. if you need to copy big files): 
-  * Jei neturite SSH raktųinstrukciją kaip juos susikurti Windows aplinkoje rasite **[[duk:ssh_key|čia]]** +  * If you don't have SSH keysyou can find instructions on how to create them in a Windows environment **[[duk:ssh_key|here]]** 
-  *     Prieš naudodami šį būdąreikia bent kartą prisijungti su Kerberos ir PST failų sistemoje susikurti ''~/.ssh'' katalogą ir į jį įdėti savo **ssh viešąjį raktą** (OpenSSH formatuį failą ''~/.ssh/authorized_keys''+  *     Before you can use this methodyou need to log in with Kerberos at least once. Then create a ''~/.ssh'' directory in the HPC file system and put your **ssh public key** (in OpenSSH formatinto the ''~/.ssh/authorized_keys'' file
-  *     Prisijungiate su **ssh**, **sftp**, **scp**, **putty**, **winscp** ar kitomis **ssh** protokolą palaikančiomis programomis į **hpc.mif.vu.lt** su savo **ssh privačiu raktu** nurodydami savo VU MIF naudotojo vardą (turi nereikalauti prisijungimo slaptažodžiobet gali reikalauti jūsų ssh privataus rakto slaptažodžio).+  *     Connect with **ssh**, **sftp**, **scp**, **putty**, **winscp** or any other **ssh** protocol supported software to **hpc.mif.vu.lt** with your **ssh private key**, specifying your VU MIF user name. It should not require a login password, but may require your ssh private key password. 
 + 
 +The **first time** you connect, you **will not** be able to run **SLURM jobs** for the first **5 minutes**. After that, SLURM account will be created. 
 + 
 +====== Lustre - Shared File System ====== 
 + 
 +VU MIF HPC shared file system is available in the directory ''/scratch/lustre''
 + 
 +The system creates directory ''/scratch/lustre/home/username'' for each HPC user, where **username** is the HPC username. 
 + 
 +The files in this file system are equally accessible on all compute nodes and on the **hpc** node. 
 + 
 +Please use these directories only for their purpose and clean them up after calculations. 
 + 
 +====== HPC Partition ====== 
 + 
 +^Partition ^Time limit ^RAM    ^Notes| 
 +^main             ^7d            ^7000MB  ^CPU cluster| 
 +^gpu              ^48h           ^12000MB ^GPU cluster| 
 +^power            ^48h           ^2000MB  ^IBM Power9 cluster| 
 + 
 +The time limit for tasks is **2h** in all partitions if it has not been specified. The table shows the maximum time limit. 
 + 
 +The **RAM** column gives the amount of RAM allocated to each reserved **CPU** core. 
 + 
 +====== Paketinis užduočių vykdymas (SLURM) ====== 
 + 
 +Norint pasinaudoti PST skaičiavimo resursais, reikia formuoti užduočių scenarijus (sh arba csh). 
 + 
 +Pavyzdys: 
 + 
 +<code shell mpi-test-job.sh> 
 +#!/bin/bash 
 +#SBATCH -p main 
 +#SBATCH -n4 
 +module load openmpi 
 +mpicc -o mpi-test mpi-test.c 
 +mpirun mpi-test 
 +</code> 
 + 
 +Pateikus paraišką ITAPC ir gavus teigimą sprendimą, reikia susikurti naudotoją https://hpc.mif.vu.lt/. Sukurtas naudotojas bus įtrauktas į atitinkamą projektą, kuris turės tam tikrą kiekį resursų. Norint naudoti projekto resursus atliekant skaičiavimus reikia nurodyti savo alokacijos numerį. Žemiau pateiktas pavyzdys su nustatytu alokacijos parametru "alloc_xxxx_projektas" (taikomas ne VU MIF naudotojams, VU MIF naudotojai -- account parametro nurodyti neturi). 
 + 
 +<code shell mpi-test-job.sh> 
 +#!/bin/bash 
 +#SBATCH --account=alloc_xxxx_projektas 
 +#SBATCH -p main 
 +#SBATCH -n4 
 +#SBATCH --time=minutes 
 +module load openmpi 
 +mpicc -o mpi-test mpi-test.c 
 +mpirun mpi-test 
 +</code> 
 + 
 + 
 +Jame kaip specialūs komentarai yra nurodymai užduočių vykdytojui. 
 + 
 + -p short - į kokią eilę siųsti (main, gpu, power). 
 + 
 + -n4 - kiek procesorių rezervuoti (**PASTABA:** nustačius naudotinų branduolių skaičių x, tačiau realiai programiškai išnaudojant mažiau, apskaitoje vis tiek bus skaičiuojami visi x "užprašyti" branduoliai, todėl rekomenduojame apsiskaičiuoti iš anksto). 
 + 
 +Užduoties pradinis einamasis katalogas yra dabartinis katalogas (**pwd**) prisijungimo mazge iš kur paleidžiama užduotisnebent parametru -D pakeistas į kitą. Pradiniam einamajam katalogui naudokite PST bendros failų sistemos katalogus **/scratch/lustre**, nes jis turi egzistuoti skaičiavimo mazge ir ten yra kuriamas užduoties išvesties failas **slurm-JOBID.out**, nebent nukreiptas kitur parametrais -o arba -i (jiems irgi patariama naudoti bendrą failų sistemą). 
 + 
 +Suformuotą scenarijų siunčiame su komanda sbatch 
 + 
 +''$ sbatch mpi-test-job'' 
 + 
 +kuri gražina pateiktos užduoties numerį **JOBID**. 
 + 
 +Laukiančios arba vykdomos užduoties būseną galima sužinoti su komanda squeue 
 + 
 +''$ squeue -j JOBID'' 
 + 
 +Su komanda scancel galima nutraukti užduoties vykdymą arba išimti ją iš eilės 
 + 
 +''$ scancel JOBID'' 
 + 
 +Jeigu neatsimenate savo užduočių **JOBID**, tai galite pasižiūrėti su komanda **squeue** 
 + 
 +''$ squeue'' 
 + 
 +Užbaigtų užduočių **squeue** jau neberodo. 
 + 
 +Jeigu nurodytas procesorių kiekis nėra pasiekiamas, tai jūsų užduotis yra įterpiama į eilę. Joje ji bus kol atsilaisvins pakankamas kiekis procesorių arba kol jūs ją pašalinsite su **scancel**. 
 + 
 +Vykdomos užduoties išvestis (**output**yra įrašoma į failą **slurm-JOBID.out**. Jei nenurodyta kitaip, tai ir klaidų (error) išvestis yra įrašoma į tą patį failą. Failų vardus galima pakeisti su komandos **sbatch** parametrais -o (nurodyti išvesties failą) ir -e (nurodyti klaidų failą). 
 + 
 +Daugiau apie SLURM galimybes galite paskaityti [[https://slurm.schedmd.com/quickstart.html|Quick Start User Guide]].
  
-Pirmą kartą prisijungus jūs **negalėsite** paleisti **SLURM užduočių** per pirmąsias **5 minutes**. Po to jums bus automatiškai sukurtas **SLURM naudotojas** ir priskirti **resursų limitai**. 
  
  
en/hpc.txt · Last modified: 2024/02/21 12:50 by rolnas

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki