Leveraging Social Media For Training Object Detectors

Authors: E. Chatzilari, S. Nikolopoulos, I. Kompatsiaris, E. Giannakidou, A. Vakali

Title: Leveraging Social Media For Training Object Detectors

Appeared in: 16th International Conference on Digital Signal Processing (DSP’09), Special Session on Social Media, 5-7 July 2009, Santorini, Greece

Abstract: The fact that most users tend to tag images emotionally rather than realistically makes social datasets inherently flawed from a computer vision perspective. On the other hand they can be particularly useful due to their social context and their potential to grow arbitrary big. Our work shows how a combination of techniques operating on both tag and visual information spaces, manages to leverage the associated weak annotations and produce region-detail training samples. In this direction we make some theoretical observations relating the robustness of the resulting models, the accuracy of the analysis algorithms and the amount of processed data. Experimental evaluation performed against manually trained object detectors reveals the strengths and weaknesses of our approach.

Περίληψη: Το γεγονός ότι πολλοί χρήστες συνηθίζουν να βάζουν ετικέτες σε ψηφιακούς πόρους με βάση, κυρίως, το συναίσθημα που τους προκαλεί ο εν λόγω πόρος καθιστά τις περιγραφές στις εφαρμογές Web 2.0 όχι απόλυτα αντικειμενικές και, επομένως, όχι αρκετά αξιόπιστες, ειδικά για εφαρμογές στην περιοχή της Επεξεργασίας Εικόνας, Τεχνητής Όρασης, κ.α. Από την άλλη μεριά, οι περιγραφές αυτές αποτελούν χρήσιμη πληροφορία, καθώς εμπεριέχουν μια κοινωνική διάσταση κι ο αριθμός τους αυξάνεται ολοένα. Στη συγκεκριμένη εργασία, εφαρμόζονται τεχνικές που συνδυάζουν τις πληροφορίες που παίρνουμε από δύο διαφορετικούς χώρους, αυτό τον ετικετών κι αυτό των περιγραφέων χαμηλού επιπέδου των πόρων-εικόνων, με στόχο την εξαγωγή περιοχών των εικόνων που αντιστοιχούν σε συγκεκριμένες ετικέτες και τη χρησιμοποίηση αυτών για εκπαίδευση συστημάτων που ανιχνεύουν τις αντίστοιχες έννοιες. Στο πλαίσιο αυτό, παρουσιάζονται κάποιες θεωρητικές προσεγγίσεις, ενώ. Παράλληλα, εξετάζεται η σταθερότητα κι η ακρίβεια των προτεινόμενων αλγορίθμων. Η αξιολόγηση της μεθόδου περιλαμβάνει σύγκρισή της με ανιχνευτές εννοιών σε εικόνες που έχουν υποστεί πρακτική εκπαίδευση κατά την οποία παρουσιάζονται τα συν και τα πλην της κάθε προσέγγισης.

Download paper: ViewPDF

Leave a Reply

You must be logged in to post a comment.