Ajax HTML 5 JavaScript Création site CMS Comment Design Logiciels Programmation RSS SQL Scripts Mobiles
Forum
SEO & ALGORITHME
Diagnostic de votre site
Critères de l'algorithme
Réduire le rebond
Optimisation Google
Tutoriel SEO
Promouvoir un site
Positionnement
Obtenir des backlinks
Panda
Glossaire
Questions
PAGERANK
PageRank
Brevet du PageRank
OUTILS DU WEBMASTER
Outils et tests
Link checker
Simple Map
Editeur RSS


Comprendre l'algorithme Panda de Google

La modification du classement des pages par Google du 24 février 2011, qui prend le nom de l'ingénieur qui l'a dirigée, a impactée 11,8% des sites aux USA en réduisant la présence dans les résultats de pages au contenu pauvre, non original ou peu utiles.
Les sites en français ont été impacté en août 2011.

Panda enragé

"Nous voulons encourager un écosystème sain..." dit Google.

Panda est un programme lancé manuellement de temps en temps par Google pour évaluer la "qualité" des sites qui s'est intégré à l'algorithme organique en janvier 2012.
Il résulte en un score global assigné au site qui est pris en compte par l'algorithme pour classer les pages. Aucun autre critère de l'algorithme ne tempère ce score.

Google à une vision à long terme. D'abord les webmasters vont réagir et adapter leur site à ces nouvelles conditions. Quitte à le rendre moins pratique pour l'utilisateur.
Et puis les critiques que la firme a subie - on se souvient de la blague du premier avril sur le Yacht nommé Adsense du CEO de Demand Media - lui font du tort et il fallait réagir.

Dates d'envois de Panda, les deux premières sont officielles, les suivantes sont estimées:

  • (1.0) 24 février 2011. Appliqué aux sites aux USA.
  • (2.0) 11 avril. Généralisé à tous les sites an anglais dans le monde, a touché 2% des sites en anglais hors USA.
  • (2.1) 10 mai.
  • (2.2) 16 juin.
  • (2.3) 23 juillet.
  • 5-8 août. Un changement dans l'algorithme général a annulé les effets de Panda sur certains sites. Les dates diffèrent selon les régions.
  • (2.4) 12 août. Généralisé à toutes les langues (sauf asiatiques), dont le français.
  • (2.5) 26-28 septembre. Favorise encore les grands média (Youtube, eBay) et pénalise leurs concurrents. (Ref).
  • 14 octobre. 1 novembre. 18 novembre.
  • En janvier 2012, Google a commencé à intégrer Panda à l'algorithme général, et donc les mises à jour seront effectuées en temps réel quand les sites évoluent.

Les critères de l'algorithme Panda

Les critères utilisés pour renforcer la qualité supposée des sites, en se basant sur les informations données par Google et sur l'expérience des webmasters:

  • Contenu copié sur un autre site. Des citations trop importantes peuvent être prises pour un contenu dupliqué.
  • Ou peu original. Même un article entièrement différent mais reprenant les mêmes idées (mots-clés en fait) est considéré de peu de qualité.
  • Contenu peu utile ou superficiel.
  • Le fait que de nombreux utilisateurs bloquent un site dans les résultats de recherche, est pris en compte comme signal négatif par Panda depuis la seconde itération du mois d'avril 2011. Cela est officiel. (Mais Google s'efforce de séparer le spam de l'authentique).
  • Il est probable que le design d'un site soit pris en compte, en tant que critère de qualité.
  • Plusieurs articles similaires sur le même site. Pire encore s'ils ont le même titre à un ou deux mots près.
  • Des pages de catégories ou étiquettes, de liste de pages, peuvent être considérées comme ayant un contenu dupliqué. Ce n'est pas nouveau, mais maintenant le site est pénalisé dans on entier.
  • Si une partie d'un site est affecté par ces critères, la note globale du site en pâtira, d'autres pages seront déclassées. Une note globale est affectée au site.
  • Les sites liés à un sité déclassé sont pénalisés aussi.

Des facteurs tels que le taux de rebond, le contenu utile hors publicité visible avant scrolling sont des critères que l'algorithme général prend en compte et non pas Panda.
Panda est un programme séparé qui demande de vastes ressources car il analyse le contenu des pages et les compare afin de détecter ce qui original et ce qui est largement répandu.
En outre l'originalité du contenu est confronté aux requêtes et une même page peut répondre à plusieurs requêtes. Il est certain que Google utilise des techniques d'analyse sémantique pour comparer les contenus des pages et aller au-delà de la similitude entre les phrases. Cela à été dévoilé par un membre de l'équipe sur un forum. Le rôle de Panda est de réaliser cette analyse lourde du contenu.

Cela n'empêchera par le moteur d'utiliser différents raccourcis et de donner une prime aux sites les plus populaires, comme il le fait généralement, qui peuvent ainsi éviter d'être pénalisé par Panda. Cela dépend du ratio de contenu utile aussi.

Les pages jugées de qualité moindre seront moins souvent visitées par les robots de moteurs de recherche (dixit Matt Cutts). On peut donc en consultant les logs avoir une information à ce sujet.

Dommages collatéraux

Un effet collatéral de ces deux mises à jour est que les sites dont le contenu est souvent copiés, ont été atteint par ce changement, Google étant souvent incapable de distinguer quel est l'original et quelle est la copie. Cela a choqué les webmasters.

Un mot nouveau est apparu sur les forums, "pandalized", qui s'applique à un site qui a perdu l'essentiel de son trafic à la suite de cette mise à jour.
La francisation "pandalisé" viendra quand la version française de l'algorithme sera aussi mise à jour. On prévoit un tsunami.

Si M. Panda avait voulu combattre efficacement le spam, il aurait pris en compte les pages à faible contenu présentant beaucoup de publicités, mais la publicité sort de l'équation de Google. On comprend pourquoi.
Il en résulte que des sites d'e-commerce et des sites éducatifs sont pénalisés: leur contenu n'est pas assez original! A priori, deux sites d'e-commerce présentant le même produit se valent, mais l'un sera jugé comme étant l'original et l'autre la copie...

Comment modifier un site pour éviter la pénalité Panda ou l'annuler

Que faire quand on a été touché par la Panda Update?

Selon Google:

"Un contenu de pauvre qualité sur une partie du site peut affecter le classement global du site, donc supprimer les pages de pauvre qualité, les combiner ou améliorer le contenu de pages individuelles superficielles pour en faire des pages utiles, ou déplacer les pages de pauvre qualité sur un domaine différent pourrait éventuellement aider au classement de votre contenu de plus grande qualité."

Cependant tous les experts s'accordent à dire qu'il n'est pas possible d'annuler la pénalité, et cela est confirmé par l'expérience, sans changer les contenus des pages existantes et ajouter un nouveau contenu.
Quand un site est pandalisé, ce n'est pas le contenu pauvre qui est déclassé mais l'ensemble du site. Donc supprimer les pages au contenu pauvre ne va rien arranger, au contraire, cela fait perdre des visites (sauf pour les pages de tags ou le contenu partiel repris sur d'autres sites).
Aussi on ne peut restaurer un site qui est pénalisé sans ajouter un contenu nouveau fondé sur de nouvelles bases, créer comme un nouveau site.

  1. Pour les pages dont le moteur ne peut pas comprendre l'intérêt pour l'utilisateur, enrichir leur contenu. Ne pas les supprimer.
  2. Personnalisez le contenu. Utilisez vos propres mots. Et, je m'adresse aux blogueurs, rappelez-vous vos dissertations, le professeur ne vous demandait pas de recopier le sujet, ni la réponse de quelqu'un d'autre, mais de donner vos propres idées.
  3. Ajouter un lien externe vers un article de qualité d'un autre site avec un avis critique et personnel. Un lien différent sur chaque page.
  4. Si le site n'a pas de système de commentaires, ajouter un commentaire ou une analyse qui tentera d'adopter une perspective inattendue.
  5. Préoccupez vous de l'expérience de l'utilisateur, le désir de consulter d'autres pages, de revenir sur le site.
  6. Ajouter une image originale sur chaque page pour améliorer l'expérience de l'utilisateur.
  7. Assurez vous que votre contenu apporte quelque chose d'utile, donc d'inédit (rechercher le contenu similaire sur les moteurs). Demandez vous toujours ce que votre page apporte de plus.

Il faut savoir que changer le contenu existant ne suffira pas à annuler les effets de la pénalisation. C'est surtout un nouveau contenu unique qui pourra le faire. Et une diversification du contenu.
Tout cela demandera beaucoup de travail, mais on se consolera en pensant aux fermes de contenu qui ont dix millions de pages à modifier...

Conclusion

Le fait nouveau le plus important et qui rend d'ailleurs le résultats incompréhensibles aux webmasters, qui a été confirmé officiellement par Google, est que si une partie d'un site est jugé de pauvre qualité, l'ensemble du site sera pénalisé. Donc des pages de très bonne qualité seront moins bien positionnées dans les SERPs que des pages d'autres sites, de qualité inférieure!
C'est difficile à admettre. Cela va en l'encontre de la doctrine affichée jusqu'ici par Google selon laquelle il faut faire des sites pour l'utilisateur, et non pour le moteur de recherche.

Voir aussi

  • Créer un site Web de qualité. Liste de critères de qualité, incluant un liste par Google.
  • Panda Update, faits et mythes. Liste des idées fausses, souvent répandues.
  • Evolution de l'algorithme de Google depuis l'origine. Modifications avant et après Panda.
  • Les critères de l'algorithme de Google. L'algorithme original.
  • Liste des sites pénalisés par la modification de l'algorithme. Fermes de contenu ou autres.

Plus d'informations

  • Finding more quality sites. C'est la vision officielle de Google concernant Panda.
  • Discussion sur ce sujet sur le forum Google (anglais). Cette interview donne une vue historique sur la mise en place de Panda et les raison qui l'on justifiée sans fournir de données précise sur le fonctionnement de l'algorithme.
  • Lessons learned about Panda Update. Cet article confirme le fait qu'un site soit déclassé en entier quand une partie est jugée de pauvre contenu et suggère l'emploi de l'attribut noindex pour les pages au contenu faible (ce n'est pas ce que nous recommandons).
Tweet
© 2011-2012 Scriptol.fr