RTU HPC centra loma CERN Tier-2 projektā

Ar vēl lielāku enerģiju 2022. gada vasarā Eiropas Kodolpētniecības centrā (CERN) sākās jauna fizikas datu vākšanas sezona jeb Run3pēc iepriekš plānotajiem uzlabošanas darbiem trīs gadu garumā atkal tika iedarbināts Lielais hadronu paātrinātājs (LHC). Tas šobrīd darbojas ar lielāko enerģiju, kādu jebkad sasniedzis, un būtiski lielāku iegūto analizējamo daļiņu sadursmju rezultātu datu apjomu.

Daļa no CMS (Compact Muon Solenoid) eksperimenta, (kurā, cita starpā, ar novērojumu pirmoreiz tika pierādīta Higsa bozona esamība), milzīgās daļiņu sadursmju datu savākšanas, apstrādes un uzglabāšanas procesa notiks arī uz RTU HPC centra augstas veiktspējas skaitļošanas klastera. Tam federatīvi tiks pievienoti vairāku Latvijas akadēmisko izglītības iestāžu mākoņskaitļošanas resursi.

CERN CMS eksperimenta datu ievākšana, analīze un uzglabāšana notiek trīs  t.s. Tier līmeņos: Tier-0 (dati tiek apstrādāti CERN piederošajā datu centrā Ženēvā un Budapeštā), Tier-1 (dati tiek apstrādāti dažos ļoti liela apjoma infrastruktūras pētniecības institūtos pasaulē, piemēram, Eiropā, ASV, Dienvidkorejā u.c.) un Tier-2 (dati tiek apstrādāti infrastruktūrā, ar kurām CERN vienojies, ka dati tiks apstrādāti). Kopumā Tier-2 līmenī ar savu skaitļošanas infrastruktūru piedalās ap 50 valstīm un Latvija ir viena no tām. Dalība Tier-2 projektā Latvijai ir viens no vienošanās nosacījumiem, lai no CERN asociētās dalībvalsts kļūtu par pilntiesīgu dalībvalsti.

Latvijas potenciāls sadarbībā ar CERN

Latvijas zinātnes un ekonomikas attīstībai sadarbība ar CERN ir ļoti nozīmīga. Pateicoties dalībvalsts statusam,  labākajiem Latvijas zinātniekiem un studentiem ir iespēja piedalīties CERN zinātniskajā darbā kopā ar pasaules vadošajiem augstas enerģijas fizikas jomas speciālistiem. Savukārt Latvijas uzņēmēji var pretendēt uz augstas pievienotās vērtības specializētu pasūtījumu saņemšanu no CERN. Tādējādi dalība CERN ir stratēģiski svarīga gan Latvijas izglītības un zinātnes, gan ekonomikas attīstībai.

Tā kā viena no CERN pētniecības jomām ir kodolenerģija, tad liela uzmanība tiek pievērsta drošībai. Ņemot vērā politisko situāciju pasaulē, CERN ir liedzis Krievijas Federācijas uzņēmumiem sadarboties ar CERN un ierobežojis arī sadarbību ar šīs valsts zinātniekiem. Atsakoties no sadarbības ar skaitļošanas pakalpojumu sniedzējiem, CERN šobrīd būtiski pieaugusi vajadzība pēc papildus augstas veiktspējas skaitļošanas (High Performance Computing, HPC) resursiem. Pilnībā aizstāt Krievijas līdzšinējo skaitļošanas infrastruktūras ieguldījumu Latvija nevar, bet, pateicoties Izglītības un zinātnes ministrijas sniegtajam finansējumam, RTU HPC centrā ir izveidota mākoņdatošanas vide, lai varētu nodrošināt CERN CMS eksperimenta skaitļošanas vajadzības, un kura uzdevums ir padziļināti pētīt fundamentālās daļiņu fizikas fenomenus.

Akadēmiskā vide sadarbosies visā Latvijā

RTU HPC centrs kopā ar Augstas Enerģijas daļiņu fizikas nodaļu Tier-2 aktivitāšu ietvarā plāno izveidot federatīvas mākoņdatošanas sadarbības modeli vairākām institūcijām, kuras jau pašlaik veiksmīgi strādā augstas veiktspējas skaitļošanas vidē. Pašlaik Tier-2 projektā kopā ar RTU ir piekrituši piedalīties Latvijas Universitāte, Latvijas Nacionālā bibliotēka, Ventspils Augstskolas Starptautiskais radioastronomijas centrs un Rēzeknes Tehnoloģiju augstskola.

Dalība CMS Tier-2 projektā dos iespēju Latvijas akadēmiskajām institūcijām uzsākt sadarbību ar CERN. Pateicoties jau iepriekš izveidotajam Latvijas Akadēmiskajam tīklam, resursu pievienošanu projekta CMS Tier-2 arhitektūrai ir iespējams realizēt visās institūcijās, kurās ir realizēts tā pieslēgums.

RTU HPC centrā atradīsies CMS Tier-2 darba slodžu dalītājs, kurš automātiski novirzīs datus uz institūciju CMS Tier-2 atvēlētajiem skaitļošanas resursiem, atkarībā no tā, kuri no šiem resursiem tobrīd ir pieejami.

CMS Tier-2 skaitļošanas resursu sadarbspēju plānots eksperimentāli pārbaudīt arī plašāk, nekā Latvijas ietvaros, savienojot HPC resursus visās trīs Baltijas valstīs ar starptautiskā akadēmiskā tīkla GEANT starpniecību. Šeit RTU sadarbosies ar Kauņas, Viļņas, Tartu un Tallinas universitātēm.

CERN Lielā hadronu paātrinātāja zinātniskie mērķi

LHC ir 27 kilometrus gara, 100 metru pazemē izvietota ļoti jaudīga zinātniskā iekārta, ar kuras palīdzību CERN zinātnieki milzu ātrumā raida protonu kūļus vienu pret otru un pēta to sadursmes, kurās tiek imitēts Lielais sprādziens un meklētas atbildes uz jautājumiem par Visumu. LHC darbu sāka 2010. gadā un pirmajā datu vākšanas periodā strādāja ar 3,5 teraelektronvoltu (TeV) enerģiju, bet otrajā – ar 6,5 TeV. Šajā trešajā periodā ir plānots, ka jauda sasniegs 6,8 TeV.

CERN LHC CMS eksperimentā daļiņas pirms sadursmes tiek paātrinātas līdz ātrumam 99,9999964 % no gaismas ātruma. Tādēļ katra sadursme detektora sensoros tiek “fotografēta” ar kadru biežumu 80 miljoni reižu sekundē. Datu apjoms, kas tiek saņemts no sensoriem, ir milzīgs – 1 PB jeb 1000 Terabaitu datu sekundē. Salīdzinājumam – visā Latvijas Nacionālās bibliotēkas digitālajā arhīvā pašreiz ir nedaudz vairāk nekā 1 PB datu. Ja visu eksperimentu sadursmju datus vēlētos saglabāt, to nespētu izdarīt neviena pasaules IT infrastruktūra, jo datu uzglabāšanas vieta būtu par maz. Tādēļ jau CERN detektoru aparatūras līmenī ir iestrādāti algoritmi, kas 99 % sadursmes atfiltrē kā tipveida un nelietderīgas tālākiem pētījumiem, saglabājot tikai pietiekami atšķirīgās, kuras būtu interesanti pētīt tālāk.

Tāpat, lai optimizētu datu apjomu, CMS Offline Compute Team ietvaros tiek pastāvīgi attīstīti un uzturēti datu apstrādes programmatūras moduļi, uzlaboti to algoritmi un nodrošināta savietojamība ar dažādas paaudzes un arhitektūras skaitļošanas resursiem, kā arī notiek optimizēšana darbam ar jaunākajām procesoru paaudzēm. Piemēram, šobrīd darba slodžu programmatūra spēj automātiski izmantot grafiskos procesorus (GPU), ja tādi ir pieejami Tier-2 infrastruktūrā.

Zinātnieki visā pasaulē iegulda daudz pūļu un resursu, lai, balstoties uz jaunajiem atklājumiem enerģijas fizikā, pasaule atklātu jaunus enerģijas avotus. Tiek strādāts pie fusion tipa reakcijām (līdzīgi kā tās notiek uz saules), lai stabilā kodoltermiskā procesā spētu ražot lēnu enerģiju, transformējot smago ūdeņradi par hēliju. Šīs vielas ir radioaktīvas un tādējādi, ir mazāk riskantas attiecībā uz vides piesārņojumu. Pavisam nesen eksperimentāli šādā procesā pirmoreiz tika iegūts vairāk enerģijas kā patērēts reakcijas uzturēšanai. Ja zinātniekiem izdotos radīt šo tehnoloģiju šīs enerģijas industriālai izmantošanai, tas mainītu visu pasauli, jo enerģijas avoti, ko pašlaik izmantojam (elektrība, gāze, nafta u.c.), kļūtu ievērojami lētākas, kā arī ļoti iespējams, ka jaunā tipa reaktoru kodoldegvielu, nevarētu izmantot kodolieroču izmantošanai, kas sagaidāmi uzlabotu drošību visā pasaulē.

Tier-2 kā modelis Digital Europe programmas īstenošanai

Digital Europe ir Eiropas Komisijas iniciatīva, kas paredz, ka Eiropas mākoņdatošanai būtu jākļūst neatkarīgākai no šobrīd dominējošajiem privātajiem mākoņdatošanas pakalpojumu sniedzējiem. Eiropas Komisijas vīzija paredz, ka Eiropā sadarbojoties dalībvalstu industrijām, tiek izveidota federatīva ES mākoņdatošanas platforma. Tai būtu digitāli un funkcionāli jāsavieno  un jāveicina sadarbība starp trīs galvenajiem sektoriem: publisko jeb institucionālo (valdības), industriālo (uzņēmēji) un akadēmisko (universitātes un pētniecības institūti). Tier-2 datu apstrādes un uzglabāšanas modelis varētu būt kā pirmie soļi pretī mākoņdatošanas modelim, kuru nākotnē (20 gadu perspektīvā) Latvija varētu izmantot, lai akadēmiskos resursus izmantotu ar institucionālajiem un industriālajiem partneriem.

Konsultēja Jānis Irbe, RTU Augstas enerģijas daļiņu fizikas un paātrinātāju tehnoloģiju centra Informācijas tehnoloģiju projektu vadītājs

Materiālu sagatavoja: Kintija Bulava, HPC centra komunikācijas speciāliste
Foto: Joshua Sortino / Unsplash