Sidebar

Gegužės 28 d., ketvirtadienį, 16 val. savo darbus pristato VU Matematikos ir informatikos fakulteto (VU MIF) programų sistemų studentai. Renginys TEAMS platformoje yra atviras studentams, moksleiviams, STEM būrelių nariams ir visiems, besidomintiems žaidimais bei dirbtinio intelekto (DI) agentų kūrimu.

zaidziantis di agentas mif

Prisijungimas TEAMS platformoje 

Renginio organizatoriaus dėstytojo dr. Roko Astrausko iš VU MIF Informatikos instituto teigimu, trečius metus organizuojamame susitikime studentai pristato dirbtinio intelekto (DI) agentų, skirtų žaisti stalo ir kompiuterinius žaidimus, kūrimą ir tyrimus.

 

Algoritmai ir DI modeliai, kurie leidžia DI agentams žaisti

Programų sistemų magistrantas Dominykas Višnevskis kalbės apie agentus, kurie gali žaisti bet kurį jam duotą stalo žaidimą, o ne konkretų, kaip būna daugeliu atveju. Dominykas pasiruošė specialią žaidimų aprašymo kalbą, kurią suprastų agentas, ir tyrė metodus, kaip agentą apmokyti žaisti žaidimus įvedant atsitiktinumą.

Programų sistemų bakalauro programoje studijuojantis Martynas Jonkus kūrė agentą populiariam kauliukų žaidimui „Liar's dice“ pasinaudodamas panašiu algoritmu, kurį sukūrė „Google DeepMind“ komanda savo garsiam agentui AlphaGo ir AlphaZero. Martynui pavyko parodyti, kaip šį metodą galima pritaikyti žaidimui su dideliu atsitiktinių veiksmų kiekiu, atsirandančiu metant kauliukus.

Augustinas Jarockis nagrinėjo panašų metodą apjungdamas Monte Karlo medžių paieškos algoritmą su neuroniniais tinklais žaidimui „Azul“.

Monte Karlo medžių paieška (MCTS) yra paieškos algoritmas, naudojamas sprendimų priėmimui ir žaidimų teorijoje. Užuot nagrinėjęs visus galimus žingsnius  MCTS atlieka atsitiktines simuliacijas ir kaupia statistiką, kurie keliai dažniausiai veda į pergalę.

Galėtume sakyti, kad neuroniniai tinklai suteikia algoritmui intuiciją, o MCTS – gebėjimą tą intuiciją patikrinti skaičiais

Motiejus Švarlys tyrė realaus laiko gaudynių žaidimą žaidžiančius agentus – gaudytoją ir bėglį –  kurie buvo apmokyti naudojant skatinamąjį mokymą. Jam pavyko realizuoti ganėtinai naują Rainbow DQN algoritmą ir – apmokant agentus žaisti prieš save – pasiekti su jais konsensusą: bėgikas bėga taip efektyviai, kad pasivyti pavyksta tik leidžiant vytys didesniu greičiu.

Studentų darbai – vis sudėtingesni

Studentus pristatyti savo darbus platesnei auditorijai skatinantis dr. R. Astrauskas džiaugiasi, kad kasmet projektai vis sudėtingesni: „Pavyzdžiui, šiemet turėsime net tris darbus, kuriuose skirtingais būdais Monte Karlo medžių paieška jungiama su neuroniniais tinklais. Taip pat džiugina, kad pavyksta kurti agentus, pagrįstus skatinamojo mokymo metodu – jis ganėtinai sudėtingas, ypač nenaudojant specialiai pritaikytų aplinkų, kuriose šis metodas jau realizuotas.“

2026-05-27

 

Naudojame slapukus, kad svetainė veiktų tinkamai, suasmenintų turinį bei skelbimus, teiktų socialinės medijos funkcijas ir analizuotų srautą. Taip pat dalijamės informacija apie tai, kaip naudojatės mūsų svetaine, su savo socialinės medijos, reklamavimo ir analizės partneriais. Privatumo politika