Comprendre l'algorithme Panda

La modification du classement des pages par Google du 24 février 2011, qui prend le nom de l'ingénieur qui l'a dirigée, a impactée 11,8% des sites aux USA en réduisant la présence dans les résultats de pages au contenu jugé pauvre, non original ou peu utile.
Les sites en français ont été impacté en août 2011.

Google panda et la qualité d'un site

"Nous voulons encourager un écosystème sain..." dit Google.

Les critiques que la firme a subie - on se souvient de la blague du premier avril sur le Yacht nommé Adsense du CEO de Demand Media - faisaient du tort au moteur de recherche et il devait réagir.

Panda était un programme lancé manuellement de temps en temps par Google pour évaluer la "qualité" des sites qui a ensuite été intégré à l'algorithme organique en janvier 2012.
Il calcule un facteur de modification pour un site afin d'altérer le classement initial des pages basé sur les autres critères. Aucun autre critère de l'algorithme ne tempère ce score.

Comment l'algorithme Panda modifie les résultats

Théoriquement, Panda fait la différence entre un site de qualité et un site sans intérêt ainsi:

L'algorithme recherche les sites d'autorité: ils offrent fréquemment une information nouvelle et des contenus innovants, au contraire de ceux qui machouillent cinq cent mots sur un sujet dans lequel on n'a pas de connaissances particulières.

Une autre citation plus récente:

Déclasser les sites de mauvaise qualité qui ne fournissent pas un contenu original ou autrement ne lui ajoutent aucune valeur.

Cette sentence est auto-descriptive. C'est elle qui dit ce qu'est un site de mauvaise qualité. Mais les webmasters recherchent des critères plus précis.
Voici comment Google détermine la qualité supposée des sites, en se basant sur le brevet 8,682,892:

Panda a été originellement conçu comme un programme séparé car il demande de vastes ressources pour partitionner le Web en groupe de ressources et pour les comparer.

Avec Panda, Google à voulu changer radicalement le rôle même du moteur de recherche: il ne veut plus que les résultats puissent contribuer à la promotion et au succès d'un site, dorénavant, un site doit obtenir son audience ailleurs, à partir des liens qu'il reçoit et s'il obtient un certain succès, alors seulement le moteur peut le mettre en avant, en fonction d'autres critères de classement.

Le discours qui a été tenu sur la qualité est fallacieux: il s'agit surtout de popularité, car les sites populaires obtiennent toujours de nombreux liens, quoiqu'ils publient, souvent des infos venant d'autres sites. La lecture du brevet montre aussi que Google fait peu de cas de l'originalité: un contenu entièrement copié peut être mieux positionné que l'original s'il obtient plus de liens indépendants.

Comment modifier un site pour Panda

Que faire quand on a été touché par la Panda Update?

Selon Google:

"Un contenu de pauvre qualité sur une partie du site peut affecter le classement global du site, donc supprimer les pages de pauvre qualité, les combiner ou améliorer le contenu de pages individuelles superficielles pour en faire des pages utiles, ou déplacer les pages de pauvre qualité sur un domaine différent pourrait éventuellement aider au classement de votre contenu de plus grande qualité."

Cependant tous les experts s'accordent à dire qu'il n'est pas possible d'annuler la pénalité sans changer les contenus des pages existantes et ajouter un nouveau contenu.
Fusionner deux pages au contenu banal fera une nouvelle page plus grande au contenu banal, cela ne résoudra rien.
L'effort du Webmaster doit être concentré sur l'obtention de liens retour indépendants.

  1. Idéalement un site maximise la formule Panda s'il a beaucoup de backlinks et aucun contenu. Un service peut correspondre à cela. Mais Panda n'est qu'un facteur qui amplifie le score initial, celui-ci dépend du contenu.
  2. Pour les pages dont le moteur ne peut pas comprendre l'intérêt pour l'utilisateur, enrichir leur contenu. Mais si elles ont de nombreux liens retour, changer le contenu peut engendrer d'autres pénalités (à moins que cela ne leur apporte de nouveaux liens retour) .
  3. Supprimer toutes les pages qui n'ont pas de lien retour est assurément un moyen efficace d'améliorer son ratio et donc retourner en grâce. Ou à défaut les sortir de l'index avec une balise meta noindex.
  4. Pour obtenir des backlinks, assurez vous que votre contenu apporte quelque chose d'utile, donc d'inédit (rechercher le contenu similaire sur les moteurs). Demandez vous toujours ce que votre page apporte de plus.
  5. Personnalisez le contenu. Utilisez vos propres mots. Et, je m'adresse aux blogueurs, rappelez-vous vos dissertations, le professeur ne vous demandait pas de recopier le sujet, ni la réponse de quelqu'un d'autre, mais de donner vos propres idées. Prenez en compte des points de vue différents pour faire autorité et ne pas apparaitre subjectif.
  6. Préoccupez vous de l'expérience de l'utilisateur, l'envie de consulter plus de pages ou de revenir sur le site.
  7. Pour les pages qui n'ont aucune chance de recevoir des backlinks, ni de bien figurer dans les SERPs, rendez-les dynamiques et donc invisibles aux moteurs tout en répondant aux questions des visiteurs. C'est ce que nous faisons avec le dictionnaire (bouton en haut de page à droite), grâce à l'emploi d'Ajax.
  8. Regardez le taux de sortie dans Analytics ou autre outil statistique. Les pages qui ont un taux de sortie élevé pénalisent le site. On peut les supprimer ou les rendre dynamiques si elles n'ont aucun backlink.
  9. Encore, ne modifiez pas les pages qui ont de nombreux backlinks.

Il faut savoir que changer le contenu existant ne suffira pas à annuler les effets de Panda parce qu'il n'aura pas de nouveau backlinks. C'est surtout un nouveau contenu unique qui pourra le faire.
Tout cela demandera beaucoup de travail, mais on se consolera en pensant aux fermes de contenu qui ont dix millions de pages à modifier...

Conclusion

Le fait nouveau le plus important et qui rend d'ailleurs le résultats incompréhensibles aux webmasters, qui a été confirmé officiellement par Google, est que si une partie d'un site est pénalisée, l'ensemble du site sera pénalisé. Donc des pages de très bonne qualité seront moins bien positionnées dans les SERPs que des pages d'autres sites, de qualité inférieure!
C'est encore plus difficile à admettre depuis que l'on sait que, même si Google présente son procédé comme un moyen de sélectionner les pages de qualité, son effet principal est de favoriser les sites déjà plus importants et augmenter encore leur audience.

Dates d'envois de Panda

Les deux premières sont officielles, les suivantes sont estimées:

Voir aussi