Μείωση Διάστασης Δεδομένων Πολλαπλών Ετικετών με Χρήση Υποκλάσεων

Μαρία Δημητρίου Οικονόμου
2013
Η μάθηση δεδομένων πολλαπλών ετικετών σχετίζεται με δεδομένα που ανήκουν σε πολλές κλάσεις ταυτόχρονα. Η επεξεργασία των δεδομένων αυτών δυσχεραίνει καθώς αυξάνεται η διάσταση τους. Η μείωση διάστασης δεδομένων έχει μελετηθεί εδώ και πολλά χρόνια παρόλα αυτά η μείωση διάστασης δεδομένων πολλαπλών ετικετών δεν έχει ερευνηθεί σε βάθος. Η Γραμμική Ανάλυση Διακριτότητας Πολλαπλών ετικετών ( Multilabel Linear Discriminant Analysis) είναι μια πρόσφατη μέθοδος η οποία αποτελεί μια τροποποίηση της
more » ... ου LDA έτσι ώστε να μπορεί να εφαρμοστεί σε δεδομένα πολλαπλών ετικετών. Στην παρούσα εργασία προτείνονται τρεις νέες μέθοδοι που αποτελούν τροποποιήσεις της MLDA έτσι ώστε να πετύχουμε μεγαλύτερη ακρίβεια αποτελεσμάτων. Η πρώτη μέθοδος ονομάζεται Ευθεία Ανάλυση Διακριτότητας Πολλαπλών Ετικετών ( Direct Multi-label Discriminant Analysis) η οποία ορίζει ένα bνέο μεταξύ των κλάσεων πίνακα διασποράς ο οποίος επιβάλει ότι τα στοιχεία που δεν ανήκουν στην ίδια κλάση θα πρέπει να απομακρύνονται. Η δεύτερη μέθοδος ονομάζεται Γραμμική Ανάλυση Διακριτότητας Πολλαπλών ετικετών με χρήση υποκλάσεων (Multi-label Clustering based Discriminant Analysis) η οποία αξιοποιεί την πληροφορία των πιθανών ομάδων (cluster) της κάθε κλάσης. Η τρίτη μέθοδος η Ευθεία Ανάλυση Διακριτότητας Πολλαπλών ετικετών με χρήση υποκλάσεων ( Direct Multi-label Clustering based Discriminant Analysis (Direct MCDA)) αποτελεί συνδυασμό των δύο προηγούμενων μεθόδων, η οποία λαμβάνει υπόψη της την ύπαρξη ομάδων σε κάθε κλάση ενώ τροποποιεί τον μεταξύ των κλάσεων πίνακα διασποράς έτσι ώστε να μεγιστοποιείται η απόσταση μεταξύ των δεδομένων που ανήκουν σε διαφορετικές ομάδες και κλάσεις.
doi:10.26262/heal.auth.ir.132764 fatcat:m67nmeaotfcxdcb7aevy2o2tee