Duomenų mokslas – neatsiejama modernaus verslo ir mokslo pasaulio dalis. Tai tarpdisciplininė sritis, apjungianti statistiką, informatiką ir srities, kurioje analizuojami duomenys, žinias. Duomenų mokslo specialistai gali padėti verslui gerinti rinkodaros strategijas ar kurti naujas, analizuoti klientų elgseną, vertinti rizikas, prognozuoti ekonominius/finansinius įmonės, šalies, regiono rodiklius ir pan.
Atsirandant vis daugiau duomenų ne tik versle, bet ir medicinos, biologijos, fizikos, chemijos, sociologijos, ekonomikos ir kt. mokslo srityse, duomenų mokslininkai padeda analizuoti duomenis ir atrasti naujas objektyvias žinias apie gamtą ir žmones. Taip pat kuria dirbtinio intelekto algoritmus, palengvinančius ar pagreitinančius mokslininkų ir verslo atstovų darbą.
Pavyzdžiui, dirbtinio intelekto metodai gali padėti vežinių navikų diagnostikoje. Įtraukdami informaciją apie pacientą: jo amžių, lytį, sveikatos rodiklius, naviko duomenis (forma, dydis ir pan.) bei magnetinio rezonanso vaizdus ir atsižvelgdami į anksčiau nustatytą diagnostinę informaciją, galime su tam tikra tikimybe priskirti naują pacientą piktybinių arba nepiktybinių navikų grupei.
Didėjantis duomenų kiekis
Pasaulyje kasdien sugeneruojami milžiniški kiekiai duomenų, pavyzdžiui, 2020 m. kiekvienas žmogus sugeneruodavo vidutiniškai 1.7 MB duomenų per sekundę. Tačiau šiuo metu mes galime panaudoti vis dar nedidelį kiekį duomenų. Todėl reikalingi duomenų mokslo specialistai ir mokslininkai, kurie kurtų naujus metodus, vystytų esamus ir padėtų kiek įmanoma labiau „įdarbinti“ duomenis.
Cliffordas Stollis yra pasakęs: Duomenys nėra informacija, Informacija nėra žinios, Žinios nėra supratimas, Supratimas nėra išmintis. Šie žodžiai puikiai atskleidžia, kad vien duomenų kaupimas nėra vertingas, nors duomenys ir vadinami „naująja nafta“. Daug svarbiau yra, kaip mes pasinaudosime duomenimis ir kaip iš jų „ištrauksime“ informaciją, žinias ir t.t.
Pavyzdžiui, naudodami duomenų mokslo metodus, mokesčių surinkimo agentūros arba finansinių nusikaltimų tyrėjai nustato mokesčių slėpimo atvejus, įvairias sukčiavimo schemas ar finansinius nusikaltimus. Tam apjungiama skirtingose institucijose esantys oficialūs duomenys, socialiniuose tinkluose pateikiama informacija ir pan.
Reikalingos kompetencijos ir darbas su duomenimis
Atsižvelgiant į darbo specifiką, duomenų mokslo specialistams ir mokslininkams svarbios kelios savybės. Darbas su duomenimis reikalauja didelio kruopštumo, kadangi dideliuose duomenų kiekiuose yra daug klaidingų duomenų, kuriuos reikia „pagauti“; kūrybiškumas būtinas parenkant tinkamus analizės metodus, kuriant naujus algoritmus. Į kiekvieną užduotį reikia mokėti pažvelgti kitu kampu ir pagalvoti, ką galima padaryti geriau. Svarbu ir žingeidumas bei noras nuolat mokytis – ši sritis labai sparčiai keičiasi, todėl mokytis reikės nuolatos ir klaidinga manyti, kad studijos suteiks viską ko reikia darbui. Studijos suteiks stiprų pagrindą ir išugdys gebėjimą mokytis.
Klaidingai manoma, kad statistika tėra „vidurkių ir procentų skaičiavimas“. Iš tikrųjų statistikos metodai labai įvairūs, skirtingi ir sudėtingi. Apjungus juos su šiuolaikinės informatikos metodais bei naujausiomis technologijomis ir taikant įvairiose srityse, kiekviena diena gali atnešti naujas patirtis ir įspūdžius.
Daugiau apie duomenų mokslininko darbą, kokie gali būti skirtingų tipų duomenys ir darbas su jais, sužinosite apsilankę doc. dr. Jurgitos Markevičiūtės paskaitoje „Ką veikia duomenų mokslininkas?“. Paskaita vyks Mokslo festivalio metu rugsėjo 15 d. 14 val. nuotoliniu būdu.
Doc. dr. Jurgita Markevičiūtė, Mokslo festivalis „Erdvėlaivis Žemė 2021“
2021-09-14