Mathématiques et « page ranking » sur Internet

Une application intéressante des mathématiques : les algorithmes de « page ranking » (classement des pages) des moteurs de recherche comme Google. Si l’on cherche à attribuer un classement Xj à une page j, on s’intéresse aux pages i « pointant » vers j : Xj va être une somme des « points » Vij qui sont accordés à j par chacune des pages i, Xj = ∑ Vij, sachant que :

1) plus la page i qui pointe vers j a elle-même un rang élevé, plus le rang de j est élevé : en gros, Vij est proportionnel à Xi. Il est intéressant d’être référencé par des pages qui sont elles mêmes bien classées.

2) Inversement, plus la page i possède de liens vers d’autres pages, plus l’intérêt qu’elle porte à la page j est dilué : Vij est inversement proportionnel au nombre Ni de pages pointées par i.

Proportionnalité à Xi, proportionnalité inverse à Ni, on peut donc écrire de manière approximative : Xj =∑i Xi/Ni.


Or, le moteur de recherche est capable de connaître le Ni, nombre de liens sur chaque page (pointant vers j). Les Ni sont les paramètres, les Xi les inconnues. Un algorithme de page ranking revient, grossièrement, à trouver la solution d’une équation matricielle comme :

X = M X, où M est la matrice des coefficients 1/Ni.


Comme on se l’imagine, la résolution est plus compliquée, faisant intervenir le théorème de Perron-Frobenius sur les éléments propres de certaines matrices, et les chaînes de Markov : mais poser le problème ainsi me paraissait intéressant, comme application des mathématiques dans la vie quotidienne.

(merci à Jacques Bair et à son article dans le magazine TangenteSup de septembre octobre de nous avoir mis sur cette piste)

3 comments for “Mathématiques et « page ranking » sur Internet

Comments are closed.