Behrooz Omidvar-Tehrani - Optimization-based User Group Management: Discovery, Analysis, Recommendation

09:30
Vendredi
6
Nov
2015
Organisé par : 
Behrooz Omidvar-Tehrani
Intervenant : 
Behrooz Omidvar-Tehrani
Équipes : 

 

Membres du jury :

 
- M. Divesh Srivastava, directeur de recherche au laboratoire AT&T, rapporteur
- M. Bruno Crémilleux, professeur à l‘université de Caen Normandie, rapporteur
- Mme. Ahlame Douzal, maître de conférences (HDR) à l’université Grenoble Alpes, examinatrice
- M. David Gross Amblard, professeur à l’université de Rennes 1, examinateur
- Mme. Elisa Fromont, maître de conférences à l'université Jean Monnet, examinatrice
- Mme. Sihem Amer-Yahia, directrice de recherche (DR1) au CNRS, directrice de thèse
- M. Alexandre Termier, professeur à l’université de Rennes 1, co-directeur de thèse
 

 

Réalisation technique : Antoine Orlandi | Tous droits réservés

Les données utilisateurs sont devenue de plus en plus disponibles dans plusieurs domaines tels que les traces d’usage des smartphones et le Web social. Les données utilisateurs, sont un type particulier de données qui sont décrites par des informations socio-démographiques (ex., âge, sexe, métier, etc.) et leurs activités (ex., donner un avis sur un restaurant, voter, critiquer un film, etc.). L’analyse des données utilisateurs intéresse beaucoup les scientifiques qui travaillent sur les études de la population, le marketing en-ligne, les recommandations et l’analyse des données à grande échelle. Cependant, les outils d’analyse des données utilisateurs sont encore très limités.

 
Dans cette thèse, nous exploitons cette opportunité et proposons d’analyser les données utilisateurs en formant des groupes d’utilisateurs. Cela diffère de l’analyse des utilisateurs individuels et aussi des analyses statistiques sur une population entière. Un groupe utilisateur est défini par un ensemble des utilisateurs dont les membres partagent des données socio-démographiques et ont des activités en commun. L’analyse au niveau d’un groupe a pour objectif de mieux gérer les données creuses et le bruit dans les données. Dans cette thèse, nous proposons un cadre de gestion de groupes d’utilisateurs qui contient les composantes suivantes: découverte de groupes, analyse de groupes, et recommandation aux groupes.
 
La première composante concerne la découverte des groupes d’utilisateurs, c.-à-d., compte tenu des données utilisateurs brutes, obtenir les groupes d’utilisateurs en optimisant une ou plusieurs dimensions de qualité. Le deuxième composant (c.-à-d., l’analyse) est nécessaire pour aborder le problème de la surcharge de l’information: le résultat d’une étape découverte des groupes d’utilisateurs peut contenir des millions de groupes. C’est une tache fastidieuse pour un analyste à écumer tous les groupes trouvés. Nous proposons une approche interactive pour faciliter cette analyse. La question finale est comment utiliser les groupes trouvés. Dans cette thèse, nous étudions une application particulière qui est la recommandation aux groupes d’utilisateurs, en considérant les affinités entre les membres du groupe et son évolution dans le temps.
 
Toutes nos contributions sont évaluées au travers d’un grand nombre d’expérimentations à la fois pour tester la qualité et la performance (le temps de réponse).