Le PageRank de Google
Le nom PageRank, qui est pris comme un nom propre par Google, est un jeu de mot entre Page Rank, rang d’une page, et Larry Page, un des deux fondateurs de la compagnie, laquelle doit son succès initial à l’implémentation d’un algorithme de même nom. Celui-ci classe les pages Web selon leur popularité sur le Web, donc selon le nombre de lien pointant sur elles.
Le rôle du PageRank
Le PageRank intervient dans un second temps: lors d’une recherche, les pages sont sélectionnées selon les mots-clés qu’elles contiennent. Ensuite les pages qui contiennent les mêmes mots-clés sont classées selon un ensemble de critère parmi lesquels le PageRank.
Ainsi il est possible de parvenir en tête des résultats avec un PR nul, pour peu que l’on soit seul à évoquer certains mots-clés.
Par contre sur les recherches concurrentielles, le PR est très important.
Le PR est pris en compte également par le robot d'indexation: le nombre de pages qui sont parsées à chaque passage du crawler dépend du PageRank du site (Réf. Matt Cutts).
Liens entrants et liens sortants
L’algorithme du PageRank prend en compte les liens entrants, les backlinks, et les liens du site vers d’autres pages.
Cela ne prouve pas que les liens que l’on fait sur d’autres sites améliore le PageRank, car l’algorithme initial n’est plus utilisé depuis longtemps (selon Google). Par contre il est confirmé par les sites des moteurs que les liens sortants, s’ils sont pertinents et s’ils pointent sur des sites de références, contribuent à sélectionner une page lors d’une recherche.
L’effet sandbox
On s’accorde généralement à considérer que l’effet sandbox se constate chez Google et non sur d’autres moteurs de recherche.
La sandbox est une zone de stockage temporaire supposée ou Google placerait les sites nouveaux en attendant de leur attribuer un PageRank.
On parle d’effet sandbox lorsqu’un site perd son classement dans les résultats de recherche, et sans être pour autant désindexé, devient introuvable parce que placé en fin de liste (cela ne l’affecte pas quand il est seul à contenir des mot-clés donnés).
Il s’agirait là d’une sanction infligée par Google aux sites qui créent arbitrairement des backlinks en quantité par l’emploi de sites satellites et autres artifices, comme on le verra plus loin.
Certaines affaires récentes (bmw.de par exemple) ont officialisé l’existence de l’effet sandbox. ll existerait depuis mars 2004.
On constate aussi un effet sandbox dans le fait que les pages nouvelles mettent plus longtemps à être indexées par Google que par les autres moteurs de recherche. Les avis divergent, certains estimant que l’algorithme de Google intègre plus lentement les pages, d’autres que c’est une mesure délibérée pour combattre le spamming provenant de pages satellites créées de façon périodique et rapprochée.
Vue simplifiée de l’algorithme du PageRank
Il s’agit de l’algorithme initial décrit par Larry Page et Sergey Brin et qui est à l’origine de Google.
Un meilleur PageRank sera obtenu par une page avec un plus grand nombre de liens pointant sur elle mais en fonction aussi du PageRank qu’ont ces pages elles-mêmes. Si une page pointe sur plusieurs autres, le poids qu’elle apporte est divisé par le nombre de lien. Mais le poids qui est acquis par des liens de qualité étant intégré à la page, il sera transmis aux pages sur lesquelles pointe cette page.
Cela fonctionne à l’intérieur d’un même site.
Les artifices interdits pour tenter d’améliorer le PageRank
Ces artifices sont généralement détecté par Google, qui d’ailleurs demande que l’on dénonce les sites employant ces pratiques, ce que font volontiers les professionnels quand leurs concurrents y ont recours. Ces sites peuvent être placés sur une liste noire et être désindexés.
- Le cloaking
On place des liens invisibles à l’internaute, par exemple avec une couleur blanche sur fond blanc, mais que les robots des moteurs de recherches prennent en compte puisqu’ils ignorent les attributs de présentations comme les couleurs. - Le spamming
Consiste à créer des pages non visibles par l’internaute contenant des quantités de liens vers un site que l’on veut promouvoir. - Le spoofing
C’est l’emploi de méta-tag de type « refresh ». La page prise en compte par les robots est une autre page de PR plus élevé, et non celle que voir le lecteur.
Les techniques recommandées pour augmenter le PageRank
Il y a pourtant des techniques honnêtes pour augmenter le PR d’un site… On appelle cela l’optimisation pour les moteurs de recherche, ou SEO, en anglais Search Engine Optimization. (Cela va au-delà du PageRank.)
- Ayez un sujet bien défini pour chaque page. Elle contiendra un maximum de mot-clés concernant ce sujet, avec tous les synonymes possibles. Il va de soi que ces mots sont intégrés dans des phrases car le texte s’adresse avant tout aux lecteurs.
- Ne pas placer trop de liens sortants. Placer uniquement des liens très pertinents sur des pages utiles aux visiteurs.
- Placer des liens entre les pages d’un même site.
- Obtenir des backlinks: créer un contenu original, avec une présentation attirante. Bien référencer le site, le faire connaître.
- Ne pas oublier la balise <title>, et soignez la description, soit dans la balise description, soit par le texte en début de page ou la phrase contenant un mot-clé que vous estimez essentiel. Il faut que l’on ait envie de choisir votre lien dans la page de résultats des moteurs de recherche (cela est pris en compte pour la position ultérieure dans les résultats).
- Le texte des ancres est important pour le score d’un page. Il doit contenir des mots significatifs et en rapport avec le contenu du paragraphe.
Plus d’informations
- Comment Google détermine le score d’une page. Tous les critères pris en compte selon un brevet déposé en Avril 2007 par Google.
- Le nouvel algorithme de Google. Une journée dans le secret du labo de Google.
- Questions sur le PageRank.
|
|
|
