Harvesting Intelligence in Multimedia Social Tagging Systems

Authors: E. Giannakidou, F. Kaklidou, E. Chatzilari, A. Vakali, I. Kompatsiaris

Title: Harvesting Intelligence in Multimedia Social Tagging Systems

Book chapter in the book :Emergent Web Intelligence, Springer Verlag, Series: Advanced Information and Knowledge Processing (accepted for publication in 2009)

Abstract: As more people adopt tagging practices, social tagging systems tend to form rich knowledge repositories that enable the extraction of patterns reflecting the way content semantics is perceived by the web users. This is of particular importance, especially in the case of multimedia content, since the availability of such content in the web is very high and its efficient retrieval using textual annotations or content-based automatically extracted metadata still remains a challenge. It is argued that complementing multimedia analysis techniques with knowledge drawn from web social annotations may facilitate multimedia content management. This chapter focuses on analyzing tagging patterns and combining them with content feature extraction methods, generating, thus, intelligence from multimedia social tagging systems. Emphasis is placed on using all available “tracks” of knowledge, that is tag co-occurrence together with semantic relations among tags and low-level features of the content. Towards this direction, a survey on the theoretical background and the adopted practices for analysis of multimedia social content are presented. A case study from Flickr illustrates the efficiency of the proposed approach.

Περίληψη: Καθώς όλο και περισσότεροι χρήστες αποκτούν πρακτικές ανάθεσης ετικετών σε ψηφιακό περιεχόμενο, τα Συστήματα Πόρων με Ετικέτες Χρηστών αποτελούν πλέον πλούσιες πηγές γνώσης και πληροφορίας και επιτρέπουν την εξαγωγή προτύπων που εκφράζουν τον τρόπο με τον οποίο οι χρήστες αντιλαμβάνονται το εν λόγω περιεχόμενο. Αυτό έχει ιδιαίτερη σημασία στην περίπτωση πολυμεσικού περιεχομένου, καθώς η διαθεσιμότητα τέτοιου υλικού στον Παγκόσμιο Ιστό είναι, πλέον, πολύ μεγάλη, αλλά η ανάκτησή του με βάση τεχνικές ανάλυσης ή λεκτικές περιγραφές αποτελεί ακόμη μια σημαντική πρόκληση για την Επιστήμη. Υποστηρίζεται ότι οι ετικέτες των χρηστών από τα Συστήματα Πόρων με Ετικέτες Χρηστών μπορούν να αποτελέσουν μια εύκολα αποκτούμενη πηγή γνώσης, η οποία συνδυαζόμενη με τεχνικές ανάλυσης μπορεί να βελτιώσει κατά πολύ την ανάκτηση του εν λόγω περιεχομένου. Στα πλαίσια της εργασίας αυτής δίνεται έμφαση στην ανάλυση προτύπων ετικετών και στο συνδυασμό τους με μεθόδους εξαγωγής χαρακτηριστικών από πολυμεσικό υλικό, με στόχο την παραγωγή περεταίρω πληροφορίας (η οποία μπορεί να θεωρηθεί κάποια μορφή ευφυΐας) από πολυμεσικά Συστήματα Πόρων με Ετικέτες Χρηστών. Στη διαδικασία αυτή λαμβάνονται υπόψη όλες οι διαθέσιμες πληροφορίες για το εν λόγω υλικό, ήτοι η συνεύρεση των ετικετών, οι σημασιολογικές σχέσεις μεταξύ τους, καθώς και τα χαμηλού επιπέδου χαρακτηριστικά των πόρων. Στα πλαίσια αυτής της ανάλυσης, παρουσιάζεται, επίσης, μία μελέτη του θεωρητικού υπόβαθρου και των συνήθη πρακτικών στην ανάλυση δεδομένων Web 2.0 και πολυμεσικών αντικειμένων. Τέλος, μία μελέτη περίπτωσης σε δεδομένα του Flickr επιδεικνύει την αποτελεσματικότητα της προτεινόμενης μεθόδου.

