Dalyko sando aprašas

 

Dalyko sando kodas

IDTY7114

Dalyko sando pavadinimas

Duomenų tyrimas

Dėstytojo (-jų) pedagoginis vardas, mokslo laipsnis, vardas ir pavardė

Doc. dr. Algirdas Mačiulis

Katedra, centras

Matematinės informatikos katedra

Fakultetas, padalinys

Matematikos ir informatikos fakultetas

Dalyko sando lygis

antrosios pakopos

Semestras

rudens (1)

ECTS kreditai

6

VU kreditai

4

Auditorinės valandos

viso dalyko 64

 

Paskaitų 32

 

seminarų

 

pratybų

 

laboratorinių darbų 32

 

konsultacijų

Reikalavimai

Pakanka žinių, gaunamų išklausius bendruosius algebros, matematinės analizės, tikimybių teorijos ir matematinės statistikos kursus.

Dėstomoji kalba

lietuvių

Dalyko sando tikslai ir numatomi gebėjimai

Dalykas skirtas išsiaiškinti informacijos teorijos, statistinės analizės principus, kuriais remiasi duomenų tyrimas, bei įsisavinti ir išmokti taikyti pagrindinius duomenų tyrimo metodus.

Dalyko sando turinys

Informacija, entropija ir duomenų kompresija. Sąlyginė entropija. Tarpusavio informacija.

Duomenys ir jų atributai. Pradinė duomenų analizė ir jų transformacijos. Pagrindiniai duomenų tyrimo uždaviniai.

Kontroliuojamas mokymas: klasifikavimas (sprendimų medžiai, klasifikavimo taisyklės, artimiausių kaimynų ir Bajeso klasifikatoriai), skaitinė prognozė.

Modelio patikimumo įverčiai: kryžminis patikrinimas,

pakartotinų imčių ("bootstrap") metodas.
Nekontroliuojamas mokymas: asociacijos taisyklės, klasterinė analizė.

Pagrindinės literatūros sąrašas

1. Ian H. Witten and Eibe Frank (2005).  Data Mining: Practical machine learning tools and techniques, 2nd Edition, Morgan Kaufmann, San Francisco,   ISBN 0120884070.
2. Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to Data Mining, Addison Wesley, 2005,  ISBN: 0321321367.
3. David J. C. MacKay (2003).  Information Theory, Inference and Learning Algorithms. Cambridge University Press.

Papildomos literatūros sąrašas

1. Hand D., Manila H., and Smyth P.(2001)  Principles of Data Mining, MIT Press,  ISBN:  026208290X.

2. T.Hastie, R.Tibshirani, J.Friedman (2001).  The Elements of Statistical Learning: Data Mining, Inference  and Prediction, Springer, New York, ISBN: 0387952845. 

3. V.Čekanavičius, G.Murauskas (2000-2002).  Statistika ir jos taikymai, I,II, TEV, Vilnius.

Mokymo metodai

Teorinė kurso dalis pateikiama paskaitose, kur formuluojami ir uždaviniai. Uždaviniai sprendžiami laboratorinių darbų metu. Numatomi studentų grupių projektai konkrečioms problemoms nagrinėti.

Lankomumo reikalavimai

Privaloma lankyti ne mažiau kaip 70% užsiėmimų

Atsiskaitymo reikalavimai

Studentai privalo atsiskaityti už laboratorinius darbus  ir išlaikyti egzaminą raštu.

Vertinimo būdas

Kaupiamasis pažymys: 50% – laboratoriniai darbai, 50% – egzaminas.

Aprobuota katedros

2005 10 20

Patvirtinta Studijų programos komiteto

2005 11 14