Critères des algorithmes de moteurs de recherche: pertinence et positionnement

Comment sont déterminés les résultats des recherches par les moteurs, notamment Google, Yahoo! et Bing? En fait les SERPs (Search Engine Result Pages) sont souvent mal comprises, sujettes à des interprétations erronées et des conclusions hâtives fondées sur des éléments partiels.

Cet étude basée sur les documents fournis par Google et analyses par des experts décrit tous les facteurs et les place en deux catégores: la pertinence et le positionnement. Beaucoup de webmasters concentrent tous leurs efforts sur le positionnement et délaissent l'essentiel, la pertinence. Mais les résultats sont définis en deux étapes:

  1. Les pages sont d'abord sélectionnées selon leur pertinence par rapport à la recherche.
  2. Puis les résultats choisis sont positionnés selon le score de la page.
    Lequel score inclut le PageRank mais aussi d'autres critères.

Cette hiérarchie des critères explique qu'une page avec un PageRank élevé puisse être placée après d'autres pages de PR plus faible dans les SERP.

Critères de pertinence

Dans un premier temps, les moteurs sélectionnent les pages qui répondent à la recherche de l'internaute, donc qui contienne les mots-clés donnés.

Les mot-clés du contenu

Les mots-clés contenus dans la page sont utilisés pour déterminer la pertinence par rapport à une requête faite par un internaute. Certains mots ont plus de poids que d'autres: ceux qui sont placés dans les balises de titres <h1>, <h2>, etc. ceux qui sont mis en relief par la balise <strong> et ceux qui sont au début de la page.

Les ancres

L'ancre est le texte d'un lien sur une page. Les mots-clés contenus dans l'ancre sont utilisés pour déterminer la pertinence d'une page tout autant que les mots-clés contenus dans la page.

Les ancres fournissent souvent des descriptions de pages web plus justes que les pages elles-mêmes.
Ref: The Anatomy of a Large-Scale Hypertextual Web Search Engine.

La langue

La langue de la page est un critère essentiel, les pages en français sont choisies d'abord par Google.fr, mais à défaut de résultats, des pages en anglais peuvent apparaître également.
Le TLD, l'extension du nom de domaine favorise un site pour les recherches faites par les internautes de ce pays. Cela est précisé dans les réponses de Google aux webmasters.

La géolocalisation

Le fait qu’un nom de domaine soit associé à une adresse IP dans un pays donné améliore le positionnement en raison de proximité, ce qui joue surtout sur les ventes d'articles. Certains hébergeurs proposent la géolocalisation du nom de domaine, pour les hébergements professionnels.

Domaine, répertoires et noms de fichiers

Les mots-clés du nom de domaine et du chemin complet du fichier sont utilisés pour juger de la pertinence d'une page autant que son contenu et que les ancres. Le sujet du site est présumé selon son nom de domaine.
Goggle donne peut-être trop d'importance au nom de domaine. Si l'on tape par exemple BlogSmith dans la barre de recherche, on a droit à une page vide sur le site blogsmith.com. Il faut aller en deuxième page de résultats pour obtenir des informations sur ce qu'est ce site.

Liens externes

Faut-il réduire le nombre de liens externes pour transmettre le PR aux pages internes?
Ce n'est pas une bonne idée, avant tout parce que les liens externes participent au contenu, donc à la pertinence de la page et que cela passe avant le PR qui n'est qu'un critère de positionnement. Il n'est pas difficile de trouver des exemples de pages avec beaucoup de liens externes et qui arrivent en tête des résultats de recherche.
Il ne faut donc pas hésiter à mettre de nombreux liens externes mais éviter toute forme d'échanges qui sont préjudiciables àla confiance accordée à votre site. Les liens vers de mauvais sites aussi dévaluent la page, pour les moteurs comme pour les utilisateurs.
Il est certain que les liens externes doivent être évités sur la page d'accueil pour conserver les visiteurs qui découvrent le site.

Critères de positionnement

Après avoir choisi un certains nombre de pages comme pouvant répondre à la requête d'un internaute, les moteurs s'efforcent de classer au mieux les résultats. Ce classement est évidemment essentiel, la plupart des internautes se bornant à regarder les premiers résultats et souvent la première page de résultats seulement.

Pour cette phase de positionnement, les moteurs utilisent des critères de popularité et de confiance.

La confiance, le "TrustRank"

Certains sites sont jugés de confiance et sont très favorisés par les moteurs de recherche, plus d'ailleurs par les moteurs mineurs qui manquent de contenu dans leurs bases de données que par Google. Vous verrez souvent ces sites apparaître en tête de résultats, quelquefois même avec des pages vides!

On a parlé d'un lien sur le profil de l'auteur sur Google+ comme un facteur de confiance, mais cela a été dénié par MC au SMX 2014. Ce n'est pas un facteur dans l'algorithme.

Le PageRank

Le PageRank d'une page est attribué en fonction du poids des liens pointant sur cette page. Donc en fonction du nombre de liens et du PR de chacun. C'est à la fois un critère de popularité et de confiance. Une page populaire attribue sa confiance aux pages qu'elle lie.

On dit souvent que le PageRank n'a plus beaucoup d'importance, mais Google déconseille fortement aux webmasters les pratiques de monétisation de liens qui visent à l'augmenter, au risque d'être pénalisé, il faut donc croire que ce critère est toujours essentiel pour le moteur.

Les liens entrants, les backlinks, sont un critère de positionnement. Mais les liens externes sortants sont eux un critère de pertinence. La pertinence prédomine toujours sur le positionnement. D'une part ils enrichissent le contenu, d'autre part, ils sont utilisés pour juger de la valeur de la page. Les liens externes pertinents sur des articles ayant un bon contenu font partie de la qualité d'une page.

Le PR est l'objet de polémiques, d'erreurs, de fausses interprétation qu'il conviendrait de corriger. "Le PR ne compte pas" est ce que l'on lit souvent dans les forums.

Nous nous basons sur l'article The Anatomy of a Large-Scale Hypertextual Web Search Engine écrit par les fondateurs de Google et inventeurs de l'algorithme du PageRank.

Le nombre de liens externes divise le PageRank transmis.

Il se trouve que si une page ayant un PR de départ de 4 contient deux liens sortants, nous savons que le poids du PR qu'elle transmet est divisé également entre tous les liens sortants. Dans ce cas, 4 / 2 = 2 unités de PR sont transmis à chacune des deux pages.
Ref: The Anatomy of a Large-Scale Hypertextual Web Search Engine.

Une page obtient un PageRank élevé avec peu de backlinks.

Une page peut avoir un PageRank élevé s'il y a de nombreuses pages qui pointent sur elle, ou s'il y a quelques pages qui pointent sur elle et ont un PageRank élevé.
Ref: The Anatomy of a Large-Scale Hypertextual Web Search Engine.

La qualité des liens vendant d'une page compte plus que leur nombre.

Les clics dans les résultats

Cela est dit dans le brevet du PageRank de Google, les clics dans les pages de résultat sont pris en compte.

Le nombre de fois ou une page est choisie dans les résultats des recherches compte, ainsi que le temps mis pour accéder à la page.

Sachant que le clic sur un résultat se fonde sur le titre et le snipper (la description), il va de soi qu'ils doivent être pertinents et attractifs.

Le temps passé sur le document

Si l'internaute choisi une page, mais revient aussitôt sur la liste des résultats, cela est su par les moteurs. Cette page sera jugée comme non pertinente.
Le temps passé sur une page, (sauf si on revient à la liste des résultat de recherche), n'est pas pris en considération (Ref: MC SMX 2014).

Le taux de rebond

Le taux de rebond est le pourcentage de visites qui ne conduisent pas le visiteur à regarder une seconde page sur le site.
En temps que critère de qualité, il est très controversé, car si un visiteur trouve exactement ce qu'il cherche, il n'a pas besoin de regarder d'autres pages donc un taux haut indique que la page répond à la question. Mais Google considère que l'engagement sur le site est un facteur plus important aussi le taux de rebond est donné par les communiquants de Google comme un critère à surveiller.

Panda et backlinks

Panda est le critère de positionnement le plus important, car il peut faire perdre 90% de son trafic à un site. Il dépend essentiellement du nombre de liens retours et du nombre de pages indexées. Le ratio du premier sur le second doit être maximisé. En sachant qu'un seul lien entrant par site est pris en compte.

Penguin et liens entrants

Depuis l'algorithme Penguin, de nombreux liens entrants jugés comme artificiels peuvent pénaliser un site. Ce sont surtout les liens placés dans des annuaires ou des fils de commentaires ou des pages jugées sans contenu utile.

Plus d'informations