Adaptive Methods for User-Centric Information Access Applications - CentraleSupélec Accéder directement au contenu
Thèse Année : 2017

Adaptive Methods for User-Centric Information Access Applications

Méthodes Adaptatives pour les Applications d’Accès à l’Information Centrées sur l’Utilisateur

Résumé

In the last two decades, data management has become a user-centric subject: users have gradually transformed themselves from simple content consumers into producers and judges of the content. We have seen the emergence of a plethora of systems, especially on the Web, on which users contribute, access information, evaluate, and interact in complex environments, either explicitly or implicitly. When users interact on these systems, they let numerous footprints which we propose to exploit so as to develop better applications for information access. We study a family of techniques centered on users, which take advantage of the many types of feedback to adapt and improve services provided to users. We focus on applications like recommendation and influencer marketing in which users generate \emph{discrete} feedback (e.g. clicks, ``likes'', reposts, etc.) and we incorporate them in our algorithms in order to deliver strongly contextualized services. Importantly, in the applications considered in this dissertation, our algorithms have to face uncertainty regarding either the user it proposes content to or the content itself, and sometimes both. The first part of this dissertation is dedicated to an approach for as-you-type search on social media. The problem consists in retrieving a set of k search results in a social-aware environment under the constraint that the query may be incomplete (e.g., if the last term is a prefix). This problem is addressed through the prism of adaptive contextual recommendation. Every time the user updates his / her query, the system updates the set of search results accordingly, so as to improve the user experience on the social platform. We adopt a “network-aware” interpretation of information relevance, by which information produced by users who are closer to the user issuing a request is considered more relevant. This query model raises challenges for effectiveness and efficiency in online search. In the second part of the dissertation, we study a generic version of influence maximization, in which we want to maximize the influence of information or marketing campaigns (e.g., on social media) by adaptively selecting ``spread seeds'' from a small subset of the population. Influencer marketing is a straightforward application of this, in which the focus of a campaign is placed on precise key individuals -- the influencers -- who are typically able to reach millions of consumers through their blog or social platform's personal page. This represents an unprecedented tool for online marketing that we propose to improve using an adaptive approach. Notably, we make no assumptions on the underlying diffusion model and we work in a setting where neither a diffusion network nor historical activation data are available. We choose to address this task using an approach similar to that of multi-armed bandits. Finally, we propose to address the cold start problem: a well-known issue faced by recommender systems when new items are introduced to the pool of items they recommend from. If no information is available regarding the user appreciation of an item, the recommender system needs to gather feedback -- e.g., clicks / non-clicks~-- so as to estimate the value of the item. However, in order to minimize "bad'' recommendations and to maintain the best user experience possible, a well-designed system should not collect feedback carelessly. We introduce a dynamic algorithm that aims to intelligently achieve the balance between "bad'' recommendations -- which are necessary to gather more information so as to have a better understanding of user evaluations of items -- and "good'' recommendations. Our multi-armed bandit approach proposes to exploit available information regarding the display bias under the so-called position-based click model.
Au cours des deux dernières décennies, la gestion des données est devenue un sujet centré sur l'utilisateur : les utilisateurs se sont progressivement transformés de simples consommateurs de contenu en producteurs et juges du contenu. Nous avons assisté à l'émergence d'une pléthore de systèmes, en particulier sur le Web, sur lesquels les utilisateurs contribuent, accèdent à l'information, évaluent et interagissent dans des environnements complexes, explicitement ou implicitement. Lorsque les utilisateurs interagissent sur ces systèmes, ils laissent de nombreuses empreintes que nous nous proposons d'exploiter pour développer de meilleures applications d'accès à l'information. Nous étudions une famille de techniques centrées sur les utilisateurs, qui tirent parti des nombreux types de rétroaction pour adapter et améliorer les services offerts aux utilisateurs. Nous nous concentrons sur des applications telles que la recommandation et le marketing d'influence dans lesquelles les utilisateurs génèrent des feedbacks réguliers (par ex. des clics, des likes, etc.) et nous les intégrons dans nos algorithmes afin de fournir des services fortement contextualisés aux utilisateurs. Il est important de noter que, dans les applications considérées, nos algorithmes doivent faire face à l'incertitude concernant soit l'utilisateur à qui ils proposent le contenu, soit le contenu lui-même, et parfois les deux à la fois. La première partie de cette thèse est consacrée à une approche de recherche à la carte sur les médias sociaux. Le problème consiste à récupérer un ensemble de k résultats de recherche dans un environnement social sous la contrainte que la requête peut être incomplète (par exemple, si le dernier terme est un préfixe). Ce problème est abordé à travers le prisme de la recommandation. Chaque fois que l'utilisateur met à jour sa requête, le système met à jour l'ensemble des résultats de recherche en conséquence, afin d'améliorer l'expérience utilisateur sur la plate-forme sociale. Nous adoptons une interprétation de la pertinence de l'information qui tient compte du réseau, selon laquelle l'information produite par les utilisateurs qui sont plus proches de l'utilisateur qui fait une demande est jugée plus pertinente. Ce modèle de recherche soulève des défis pour l'efficacité et l'efficience de la recherche en ligne. Dans la deuxième partie de la thèse, nous étudions une version générique de la maximisation de l'influence, dans laquelle nous voulons maximiser l'influence des campagnes d'information ou de marketing en sélectionnant de manière adaptative les utilisateurs initiant la propagation de l'information parmi un petit sous-ensemble de la population. Notre approche ne fait aucune hypothèse sur le modèle de diffusion sous-jacent ni même sur la structure du réseau de diffusion. Notre méthode a d'importantes applications dans le marketing d’influence qui vise à s’appuyer sur les influenceurs de réseaux sociaux pour promouvoir des produits ou des idées. Enfin, nous abordons le problème bien connu du démarrage à froid auquel sont confrontés les systèmes de recommandation par une approche adaptative. Si aucune information n’est disponible concernant l'appréciation d’un article, le système de recommandation doit recueillir des signaux (clics, etc.) afin d'estimer la valeur de l'article. Cependant, afin de minimiser les mauvaises recommandations faites aux utilisateurs, le système ne doit pas recueillir ces signaux de façon négligente. Nous introduisons un algorithme dynamique qui vise à alterner intelligemment les recommandations visant à accumuler de l'information et celles s'appuyant sur les données déjà recueillies. Notre approche via les bandits multi-bras se propose d'exploiter les informations disponibles concernant le biais d'affichage sous le modèle de clic dit "position-based".
Fichier principal
Vignette du fichier
fix_MUtAsgfs.pdf (5.88 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01689094 , version 1 (20-01-2018)
tel-01689094 , version 2 (23-01-2018)

Identifiants

  • HAL Id : tel-01689094 , version 1

Citer

Paul Lagrée. Adaptive Methods for User-Centric Information Access Applications. Information Retrieval [cs.IR]. Université paris sud 11, LRI, 2017. English. ⟨NNT : ⟩. ⟨tel-01689094v1⟩
326 Consultations
311 Téléchargements

Partager

Gmail Facebook X LinkedIn More