VU Matematikos ir informatikos fakultetas - Roboto nepapirksi, arba kaip dirbtinis intelektas gali tapti šališkas?

2021 11 12 Dirbtinis intelektas 642x410

Dirbtinis intelektas jau spėjo tapti neatskiriamu mūsų kasdienio gyvenimo palydovu. Jis teikia mums pirkinių rekomendacijas, padeda rasti trumpiausią kelionės maršrutą ir netgi gali atsiliepti į telefono skambučius. Viena iš savybių, kurių paprastai tikimės iš šio skaitmeninio pagalbininko – visiškas objektyvumas priimant sprendimus. Vis dėlto mokslinėje ir populiariojoje spaudoje galima rasti straipsnių, aprašančių atvejus, kai dirbtiniu intelektu paremtas įrankis pateikė rekomendacijas, kurios buvo diskriminuojančios rasės, lyties ar įgalumo atžvilgiu.

Apie tai, kodėl kompiuterinė sistema tampa šališka, kalbamės su dirbtinį intelektą tyrinėjančia Vilniaus universiteto Duomenų mokslo ir skaitmeninių technologijų instituto profesore Olga Kurasova.

Dirbtinis intelektas – nuliai ir vienetai, matematinės formulės. Kur slypi jo šališkų sprendimų, aprašomų spaudoje, priežastis?

Kalbant apie dirbtinio intelekto šališkumą, galima išskirti du jo tipus. Pirmasis yra tyčinis šališkumas, kai dirbtinio intelekto kūrėjai kuria sistemą sąmoningai nepaisydami lygybės ir objektyvumo kriterijų. Vis dėlto tikiuosi, kad tokių atvejų pasitaiko retai ir didžioji dalis šališkumo apraiškų yra antrojo – netyčinio šališkumo – tipo. Apskritai dirbtinio intelekto šališkumo priežastis ta, kad jį kuria žmonės. Galvojant apie dirbtinį intelektą, atrodo, kad būdamas „robotas“ jis neturėtų turėti jokių sentimentų nei lyčiai, nei rasei, nei kuriam kitam aspektui, tačiau nereikia pamiršti, kad tas robotas yra žmogaus kūrinys, atspindintis netobulus žmogaus sprendimus.

Gal galėtumėte trumpai papasakoti, kaip veikia dirbtinis intelektas ir kuriuose jo veikimo etapuose atsiranda šališkumas?

Visų pirma kompiuteriui suformuluojamas konkretus uždavinys. Kaip pavyzdį pasirinkime navikų atpažinimą kompiuterinės tomografijos nuotraukose. Tada reikia kompiuteriui pateikti tam tikrą kiekį duomenų, iš kurių jis gali mokytis išspręsti tą uždavinį. Mūsų pavyzdžio atveju tai būtų kompiuterinės tomografijos vaizdai, kuriuose jau yra pažymėti navikai. Šį parengiamąjį žymėjimo darbą atlieka gydytojai radiologai. Gavusi mokomuosius vaizdus, dirbtinio intelekto sistema juose tol ieško ryšio tarp viso vaizdo ir radiologo pažymėto segmento, kol jį nustato, kalbant dalykiniais terminais, sukuria modelį. Vėliau sistema savo sukurtą modelį gali pritaikyti naujiems, radiologo dar neperžiūrėtiems vaizdams ir juose savarankiškai pažymėti įtartinas nuotraukos vietas, kuriose galimai matomas navikas.

Taigi pirma svarbi dirbtinio intelekto sudedamoji dalis yra duomenys. Dirbtinio intelekto sistemos rengiamos darbui naudojant tam tikrus jau egzistuojančius duomenis. Su kokiais duomenimis apmokysime dirbtinio intelekto sistemą, tokiais ji ir remsis prognozuodama, klasifikuodama ar spręsdama kokį nors uždavinį. Reikia, kad mokymo duomenys būtų kuo įvairesni, bet tokius duomenis sunku surinkti, nes įprastai mokymo duomenys renkami vienoje apibrėžtoje grupėje, kur nėra didelės įvairovės. Tad jau duomenų rinkimo etape, dažnai net nesąmoningai, sudaromos prielaidos šališkumui.

Pateiksiu pavyzdį: dirbtinis intelektas apmokomas teikti pasiūlymus eiti tam tikras technikos srities pareigas. Šiuo metu toje srityje dirba mažai moterų. Taigi dirbtiniam intelektui bus pateikta mažai duomenų apie moterų įdarbinimą. Jis išmoks pakartoti jau esamą situaciją, todėl ir jo teikiamose rekomendacijose bus numatyta mažai darbo pasiūlymų moterims.

Kitas dėl mokymo duomenų vienpusiškumo atsirandančio šališkumo pavyzdys galėtų būti dirbtiniu intelektu besiremiančios odos vėžio atpažinimo sistemos. Pateikus joms ant odos esančios dėmelės nuotrauką, tokios sistemos įspės, jei dėmelėje įžvelgs pavojingų pakitimų. Apmokant šias sistemas daugiausia buvo naudoti baltaodžių individų duomenys, todėl jų tikslumas yra daug didesnis taikant jas baltaodžiams nei juodaodžiams ar azijiečių kilmės pacientams. Panaši problema egzistuoja ir naudojant dirbtinį intelektą ligoms identifikuoti. Sistema išmoksta atpažinti dažnai pasitaikančias ligas, tačiau jeigu susiduria su reta liga, kurios buvo „mačiusi“ mažai, bus gana sunku ją atpažinti. Jei vienas atvejis iš dešimties tūkstančių kuo nors išsiskiria, dirbtinis intelektas linkęs jį nurašyti kaip paklaidą.

Svarbi dirbtinio intelekto veikimo proceso dalis – sistemai apmokyti skirtų duomenų ženklinimas, t. y. kai tam tikri duomenys priskiriami tam tikrai kategorijai, vadinamajai „klasei“, arba vaizde pažymimi tam tikri fragmentai. Šališkumas gali atsirasti, jei duomenys buvo paženklinti šališkai. Juk šį darbą atliekantis ekspertas yra žmogus. Mūsų institutas nemažai bendradarbiauja su medikais. Pasitaiko, kad ženklindami mokymo duomenis medikai nesutaria, kur yra vienos ar kitos klasės ribos. Kuo labiau patyręs ekspertas, tuo tiksliau jis sužymės duomenis. Deja, dažniausiai duomenų ženklinimas paliekamas mažiau patyrusiems kolegoms, nes tai yra neįdomus ir daug laiko atimantis darbas.

Kaip dirbtinio intelekto kūrėjai gali padėti jam tapti mažiau šališkam?

Mokymo duomenų paruošimo ir ženklinimo etape svarbų vaidmenį vaidina žmogiškasis faktorius. Dirbtiniam intelektui apmokyti skirti duomenys turi būti kiek galima reprezentatyvesni. Tam reikalingi patikimi ekspertai. Žinoma, egzistuoja ir informatikos metodai, padedantys įvertinti duomenų reprezentatyvumą, tačiau svarbiausias vaidmuo užtikrinant, kad surinkti duomenys nesudarytų pagrindo diskriminacijai, tenka juos pateikusiam ekspertui.

Dirbtinio intelekto kūrėjai jau dabar imasi veiksmų, padedančių sumažinti šališkumą duomenų lygmeniu, nors jie gal ir ne visada įvardija tuos veiksmus kaip kovą su šališkumu. Pavyzdžiui, tobulinamas retesnių pavyzdžių atpažinimas. Jo kokybei pagerinti pasitelkiami specialūs statistikos metodai. Identifikavus netipinius pavyzdžius, galima įvertinti, ar jie duomenyse reprezentuoja klaidą, ar išskirtinį atvejį.

Viena iš šiuo metu aktualių dirbtinio intelekto tyrimų krypčių yra dirbtinių neuroninių tinklų technologija. Ji leis dirbtinio intelekto sistemai „apibendrinti“ iš mokymo duomenų įgytas žinias (angl. generalization) ir taip tapti įvairiapusiškesnei. Kaip pavyzdį pasirinkime dirbtinio intelekto sistemą, skirtą kompiuterinės tomografijos nuotraukoms interpretuoti. Tarkime, ši sistema buvo apmokyta naudojant tam tikro gamintojo tomografu gautus vaizdus. Dabartinio lygio technologija neduos gerų rezultatų, jei bus taikoma kito gamintojo įranga darytiems vaizdams atpažinti, nes skirsis gamintojų įrangos raiškumas, vaizdų gavimo procesai ir taip toliau. Ateities technologija gebės prisitaikyti prie įvairių gamintojų įrangos, nes galės atsiriboti nuo neesminių duomenų ypatybių. Dirbtinio intelekto priklausomybės nuo mokymo duomenų savybių mažinimas padės sumažinti ir šališkumo problemą. Vis dėlto šios krypties tyrimai yra dar labai ankstyvos stadijos ir jų rezultatai dar negali būti plačiai taikomi.

Atsižvelgiant į mūsų aptartą šališkumo problemą, ar paprastas vartotojas vis dar gali pasitikėti dirbtiniu intelektu?

Priklauso nuo to, kur dirbtinis intelektas yra taikomas. Jeigu mums reikalinga rekomendacija, į kokį kurortą skristi atostogauti, tai galbūt nieko nenutiks, jeigu nebus pasiūlytas pats objektyviausias sprendimas. Dirbtinis intelektas padės mums sumažinti sprendimo paieškai skirtas laiko sąnaudas, o jo paklaida bus pateisinama. Bet jeigu dirbtinis intelektas yra taikomas priimant rimtus sprendimus, pavyzdžiui, diagnozuojant ligą, neverta juo aklai pasitikėti. Šiuo metu medicinoje dirbtinis intelektas naudojamas tik atliekant preliminarią diagnostiką. Galutinį sprendimą, ypač kritiniais atvejais, vis dar priima žmogus. Dirbtiniam intelektui dar tikrai yra kur tobulėti. Net jei tam tikrose specifinėse srityse jo sprendimų tikslumas jau yra gana didelis, nė vienas specialistas aklai juo nepasitiki ir patikrina rezultatą remdamasis savo žiniomis bei patirtimi.

Studentams, kurie idealizuoja dirbtinį intelektą, mėgstu duoti tokį pavyzdį: „Mažas vaikas greitai išmoksta skirti kačiuką nuo šuniuko. Jam nereikia parodyti tūkstančio kačiukų ir tūkstančio šuniukų, kad jis žinotų, kur kuris iš jų yra. Tuo tarpu dirbtiniam intelektui vis dar reikia labai daug pavyzdžių, kol jis išmoksta atpažinti skirtumus tarp dviejų objektų.“ Taigi žmogaus, net ir mažo vaiko, smegenys vis dar veikia daug tobuliau nei dirbtinis intelektas.

2021-11-12

Sidebar