Optimization of Perron eigenvectors and applications: from web ranking to chronotherapeutics - Centre de mathématiques appliquées (CMAP) Accéder directement au contenu
Thèse Année : 2012

Optimization of Perron eigenvectors and applications: from web ranking to chronotherapeutics

Optimisation de vecteurs propres de Perron et applications : du référencement de pages web à la chronothérapie

Résumé

Search engines play a key role in the World Wide Web. They gather information on the web pages and for each query of a web surfer they give a sorted list of relevant web pages. Internet search engines use a variety of algorithms to sort web pages based on their text content or on the hyperlink structure of the web. Here, we focus on algorithms that use the latter hyperlink structure, called link-based algorithms, and among them PageRank, HITS, SALSA and HOTS. The basic notion for all these algorithms is the web graph, which is a digraph with a node for each web page and an arc between nodes i and j if there is a hyperlink from page i to page j. The original problem considered in the present work is the optimization of the ranking of the pages of a given web site. It consists in finding an optimal outlink strategy maximizing a scalar function of a given ranking subject to design constraints. PageRank, HITS and SALSA are Perron vector rankings, which means that they correspond to the principal eigenvector of a (elementwise) nonnegative matrix. When optimizing the ranking, we thus optimize a scalar utility function of the Perron eigenvector over a set of nonnegative irreducible matrices. The matrix is constructed from the web graph, so controlling the hyperlinks corresponds to controlling the matrix itself. We first study general PageRank optimization problems with a "total income" utility function and design constraints. This case is of particular interest since the value of the PageRank is an acknowledged economic issue. We reduced the PageRank optimization problem to Markov decision problems such that the action sets are implicitly defined as the vertices of polytopes that have a polynomial time separation oracle. We show that such Markov decision problems are solvable in polynomial time and we provide a scalable algorithm for the effective resolution of the PageRank optimization problem on large dataset. Then, we study the general problem of optimizing a scalar utility function of the Perron eigenvector over a set of nonnegative irreducible matrices. This covers all Perron vector rankings, including HITS and SALSA. We show that the matrix of partial derivatives of the objective has a low rank and can be computed by an algorithm with the same convergence properties as the power algorithm used to compute the ranking and so the value of the objective. We give an optimization algorithm that couples power and gradient iterations and prove its convergence to a stationary point of the optimization problem. Considering HOTS as a nonlinear Perron vector, we show that the HOTS algorithm converges with a linear rate of convergence, that the objective of the HOTS optimization problem has a low rank and that the coupled power and gradient algorithm applies. Finally, we extend the domain of application of the Perron eigenvalue and eigenvector optimization methods to the optimization of chemotherapy under the McKendrick model of population dynamics. We consider here that the cells behave differently at an hour of the day or another. We want to take advantage of this feature to minimize the growth rate of cancer cell population while we maintain the growth rate of healthy cell population over a given toxicity threshold. The objective and the constraint can be written as the Floquet eigenvalues of age-structured PDE models with periodic coefficients, and they are approximated by Perron eigenvalues in the discretized problem. We search for locally optimal drug infusion strategies by a method of multipliers, where the unconstrained minimizations are performed using the coupled power and gradient algorithm that we have developed in the context of web ranking optimization.
Les moteurs de recherche jouent un rôle essentiel sur le Web. Ils rassemblent des informations sur les pages web et pour chaque requête d'un internaute, ils donnent une liste ordonnée de pages pertinentes. Ils utilisent divers algorithmes pour classer les pages en fonction de leur contenu textuel ou de la structure d'hyperlien du Web. Ici, nous nous concentrons sur les algorithmes qui utilisent cette structure d'hyperliens, comme le PageRank, HITS, SALSA et HOTS. La notion fondamentale pour tous ces algorithmes est le graphe du web. C'est le graphe orienté qui a un noeud pour chaque page web et un arc entre les noeuds i et j si il y a un hyperlien entre les pages i et j. Le problème original considéré dans cette thèse est l'optimisation du référencement des pages d'un site web donné. Il consiste à trouver une stratégie optimale de liens qui maximise une fonction scalaire d'un classement donné sous des contraintes de design. Le PageRank, HITS et SALSA classent les pages par un vecteur de Perron, c'est-à-dire qu'ils correspondent au vecteur propre principal d'une matrice à coefficients positifs. Quand on optimise le référencement, on optimise donc une fonction scalaire du vecteur propre de Perron sur un ensemble de matrices positives irréductibles. La matrice est construite à partir du graphe du web, donc commander les hyperliens revient à commander la matrice elle-même. Nous étudions d'abord un problème général d'optimisation du PageRank avec une fonction d'utilité correspondant au revenu total du site et des contraintes de design. Ce cas est d'un intérêt particulier car pour de nombreux sites la valeur du PageRank est corrélée au chiffre d'affaires. Nous avons réduit le problème d'optimisation du PageRank à des problèmes de décision markoviens dont les ensembles d'action sont définis implicitement comme étant les points extrêmes de polytopes qui ont un oracle de séparation polynomial. Nous montrons que de tels problèmes de décision markoviens sont solubles en temps polynomial et nous donnons un algorithme qui passe à l'échelle pour la résolution effective du problème d'optimisation du PageRank sur de grandes bases de données. Ensuite, nous étudions le problème général de l'optimisation d'une fonction scalaire du vecteur propre de Perron sur un ensemble de matrices positives irréductibles. Cela couvre tous les classements par vecteur de Perron, HITS et SALSA compris. Nous montrons que la matrice des dérivées partielles de la fonction objectif a un petit rang et peut être calculée par un algorithme qui a les mêmes propriétés de convergence que la méthode de la puissance utilisée pour calculer le classement. Nous donnons un algorithme d'optimisation qui couple les itérations puissance et gradient et nous prouvons sa convergence vers un point stationnaire du problème d'optimisation. En considérant HOTS comme un vecteur de Perron non linéaire, nous montrons que l'algorithme HOTS converge géométriquement et nous résolvons l'optimisation locale de HOTS. Finalement, nous étendons le domaine d'application des méthodes d'optimisation du vecteur propre et de la valeur propre de Perron à l'optimisation de la chimiothérapie, sous l'hypothèse que les cellules se comportent différemment suivant l'heure de la journée. Nous voulons profiter de cette caractéristique pour minimiser le taux de croissance des cellules cancéreuses tout en maintenant le taux de croissance des cellules saines au dessus d'un seuil de toxicité donné. L'objectif et la contrainte peuvent s'écrire comme les valeurs propres de Floquet de modèles d'EDP structurés en âge avec des coefficients périodiques, qui sont approchés par des valeurs propres de Perron dans le problème discrétisé. Nous cherchons des stratégies d'injection de médicament localement optimales par une méthode des multiplicateurs où les minimisations sans contrainte sont faites en utilisant l'algorithme couplant les itérations puissance et gradient développé dans le cadre de l'optimisation du référencement.
Fichier principal
Vignette du fichier
theseFercoq.pdf (2.11 Mo) Télécharger le fichier
Loading...

Dates et versions

pastel-00743187 , version 1 (18-10-2012)

Identifiants

  • HAL Id : pastel-00743187 , version 1

Citer

Olivier Fercoq. Optimization of Perron eigenvectors and applications: from web ranking to chronotherapeutics. Optimization and Control [math.OC]. Ecole Polytechnique X, 2012. English. ⟨NNT : ⟩. ⟨pastel-00743187⟩
1493 Consultations
2514 Téléchargements

Partager

Gmail Facebook X LinkedIn More