| Γνωστική Περιοχή: | Υπολογιστικών και Εφαρμοσμένων Μαθηματικών | ||
| Εξάμηνο: | 8o | ||
| Κωδικός: | 82405 | ||
| Τύπος Μαθήματος: | Επιλογής | ||
| Ώρες Διδασκαλίας: | Θεωρία: 3 | Άσκηση: 0 | Εργαστήριο: 0 | 
| ECTS : | 5 | ||
| Ιστοσελίδα Eclass: | |||
| Διδάσκοντες Μαθήματος: | |||
| Περίγραμμα μαθήματος: | Για να δείτε ή να αποθηκεύσετε το αρχείο πατήστε εδώ. | ||
Περιεχόμενο
					- Γραφική απεικόνιση και περίληψη δεδομένων μεγάλου όγκου.
 - Η κανονική κατανομή. Γραμμικοί συνδυασμοί τυχαίων μεταβλητών. Γραμμική ανάλυση διακρίσεων. Συζήτηση για τη εκτίμηση του ποσοστού σφάλματος,
 - Αλγόριθμοι επιβλεπόμενης μάθησης: naive Bayes, Knn, Support Vector Machines (SVM), συνδυαστικές μέθοδοι.
 - Ομαδοποίηση. Ταξινόμηση τεχνικών ομαδοποίησης. Μέθοδοι ομαδοποίησης με βάση το κέντρο βάρους (k-means), ιεραρχική ομαδοποίηση (συγχωνευτική και διχαστική), ομαδοποίηση βασισμένη στην πυκνότητα (DBSCAN).
 - Εισαγωγή την ανάλυση πρωτευουσών συνιστωσών και εφαρμογές.
 - Μείωση διάστασης σε δεδομένα μεγάλου όγκου (Τυχαίες Προβολές, Παράλληλες μέθοδοι). Μείωση διάστασης και ομαδοποίηση.
 - Εξόρυξη προτύπων για την αναγνώριση κοινωνικής συμπεριφοράς στο διαδίκτυο.
 - Εξόρυξη προτύπων σε δεδομένα κειμένου μεγάλου όγκου. Κατηγοριοποίηση αρχείων κειμένου και γρήγορη αναζήτηση.
 - Εφαρμογές στη Βιοϊατρική, γονιδιακές εκφράσεις πληθυσμών, εξόρυξη σε ακολουθίες.
 
Βιβλιογραφία
					- M.H. Dunham, Data Mining, Εισαγωγικά και Προηγμένα θέματα Εξόρυξης Γνώσης από Δεδομένα, Εκδ. ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ, 1η εκδ., 2004. Κωδικός βιβλίου στον Εύδοξο: 395
 - Αλ. Νανόπουλος – Γ. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων. Κωδικός βιβλίου στον Εύδοξο: 3079
 - M.J. Zaki, M.JR. Wagner, Εξόρυξη και Ανάλυση Δεδομένων: βασικές έννοιες και αλγόριθμοι. Κωδικός βιβλίου στον Εύδοξο: 68386089
 - Tan Pang – Ning, Steinbach Michael, Kumar Vipin, Εισαγωγή στην εξόρυξη δεδομένων. Κωδικός βιβλίου στον Εύδοξο: 18549105
 - Hastie, T., Tibshirani, R. and Friedman, J., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, 2nd Edition, 2011.
 - J. Gareth, D. Witten, Tr. Hastie and R. Tibshirani, An Introduction to Statistical Learning with Applications in R, Springer, 2013.
 
