Γνωστική Περιοχή: | Υπολογιστικών και Εφαρμοσμένων Μαθηματικών | ||
Εξάμηνο: | 8o | ||
Κωδικός: | 82405 | ||
Τύπος Μαθήματος: | Επιλογής | ||
Ώρες Διδασκαλίας: | Θεωρία: 3 | Άσκηση: 0 | Εργαστήριο: 0 |
ECTS : | 5 | ||
Ιστοσελίδα Eclass: | |||
Διδάσκοντες Μαθήματος: | |||
Περίγραμμα μαθήματος: | Για να δείτε ή να αποθηκεύσετε το αρχείο πατήστε εδώ. |
Περιεχόμενο
- Γραφική απεικόνιση και περίληψη δεδομένων μεγάλου όγκου.
- Η κανονική κατανομή. Γραμμικοί συνδυασμοί τυχαίων μεταβλητών. Γραμμική ανάλυση διακρίσεων. Συζήτηση για τη εκτίμηση του ποσοστού σφάλματος,
- Αλγόριθμοι επιβλεπόμενης μάθησης: naive Bayes, Knn, Support Vector Machines (SVM), συνδυαστικές μέθοδοι.
- Ομαδοποίηση. Ταξινόμηση τεχνικών ομαδοποίησης. Μέθοδοι ομαδοποίησης με βάση το κέντρο βάρους (k-means), ιεραρχική ομαδοποίηση (συγχωνευτική και διχαστική), ομαδοποίηση βασισμένη στην πυκνότητα (DBSCAN).
- Εισαγωγή την ανάλυση πρωτευουσών συνιστωσών και εφαρμογές.
- Μείωση διάστασης σε δεδομένα μεγάλου όγκου (Τυχαίες Προβολές, Παράλληλες μέθοδοι). Μείωση διάστασης και ομαδοποίηση.
- Εξόρυξη προτύπων για την αναγνώριση κοινωνικής συμπεριφοράς στο διαδίκτυο.
- Εξόρυξη προτύπων σε δεδομένα κειμένου μεγάλου όγκου. Κατηγοριοποίηση αρχείων κειμένου και γρήγορη αναζήτηση.
- Εφαρμογές στη Βιοϊατρική, γονιδιακές εκφράσεις πληθυσμών, εξόρυξη σε ακολουθίες.
Βιβλιογραφία
- M.H. Dunham, Data Mining, Εισαγωγικά και Προηγμένα θέματα Εξόρυξης Γνώσης από Δεδομένα, Εκδ. ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ, 1η εκδ., 2004. Κωδικός βιβλίου στον Εύδοξο: 395
- Αλ. Νανόπουλος – Γ. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων. Κωδικός βιβλίου στον Εύδοξο: 3079
- M.J. Zaki, M.JR. Wagner, Εξόρυξη και Ανάλυση Δεδομένων: βασικές έννοιες και αλγόριθμοι. Κωδικός βιβλίου στον Εύδοξο: 68386089
- Tan Pang – Ning, Steinbach Michael, Kumar Vipin, Εισαγωγή στην εξόρυξη δεδομένων. Κωδικός βιβλίου στον Εύδοξο: 18549105
- Hastie, T., Tibshirani, R. and Friedman, J., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, 2nd Edition, 2011.
- J. Gareth, D. Witten, Tr. Hastie and R. Tibshirani, An Introduction to Statistical Learning with Applications in R, Springer, 2013.