Panda, faits et mythes
Les modifications de l'algorithme du 11 avril 2011 ont surpris les webmasters et ont suscité des quantité de théories sur ce que Google veut pénaliser effectivement.
Le dernier niveau est atteint
Les faits
Google veut supprimer de la partie visible de l'index les pages à faible contenu
Par faible contenu, on entend un texte sans aucun contenu originel. L'algorithme utilise des signaux pour juger de la qualité d'un texte, basé sur les mot-clés et le comportement des utilisateurs, mais ce n'est qu'un programme et il peut se tromper totalement.
Par exemple il ne prend pas en compte les scripts JavaScript, le contenu dynamique, la qualité pédagogique du texte qui peut être classique mais plus clair que d'autres.
Un site est pénalisé dans son ensemble si une partie des pages est jugée de pauvre contenu
Cela a été confirmé officiellement. La pénalisation peut être légère ou importante selon la proportion de pages à faible contenu. Ainsi des pages qui étaient en tête des résultats, peuvent perdre plusieurs positions et apparaître derrière des liens sur des pages d'interêt moindre ou qui sont à coté de la question, cela parce que le site est pénalisé.
C'est un groupe d'employés de Google qui a défini la qualité d'un site
L'algorithme Panda analyse un site en fonction de critères définis par un groupe d'employés à qui on a présenté un ensemble de sites et qui a décidé lesquels sont de qualité, lesquels n'en sont pas.
Les sites sont ensuite pénalisés quand ils s'écartent de cette norme préétablie, indépendamment de tout autre critère.
La pénalisation remet le compteur à zéro et est quasiment irréversible
Elle n'affecte pas des pages mais attribue un score négatif au site dans son entier. Ainsi si on supprime les pages à contenu pauvre, cela n'annule pas la pénalité, cela réduit même encore le trafic venant de Google.
Pour l'annuler, il faut ajouter de nouvelles pages au contenu riche, afin d'améliorer le score du site, et peut-être aussi améliorer les pages au contenu pauvre mais ceci n'aura qu'un effet ultérieur.
Les choses sont différentes lorsque le site a un contenu dupliqué, car cela déclenche une pénalité différente.
Précisons que "contenu riche" ou "pauvre" ne sont que des appréciations par les robots de Google. Objectivement est "pauvre" ce qui fait pandaliser un site. (voir l'article sur l' algorithme Panda).
Vitre de pauvre qualité
Google sait qu'il pénalise injustement des sites
Google conseille de: "combiner des pages superficielles pour faire un contenu plus utile". On ne combine pas du spam pour faire un contenu utile, le conseil s'adresse bien aux webmasters de bonne foi.
Panda n'a qu'un seul but: combattre les spams. Pour empêcher les spammeur de progresser par essais et erreurs, on sanctionne le site tout entier ce qui empêche de savoir quelle partie est visée et on n'annule pas la pénalité quand le contenu jugé pauvre est supprimé.
En pénalisant un site entier pour une partie du contenu on sait qu'on peut aussi pénaliser un contenu de qualité.
Un site peut être pénalisé quand son contenu est copié
Normalement l'algorithme doit pénaliser les sites qui recopient le contenu d'autres sites. Mais il arrive souvent qu'il confonde l'original et la copie et que le premier soit pris pour la seconde.
Cela est arrivé même à des sites populaires comme cultofmac.com.
Un site peut être pénalisé pour une cause antérieure
Un site peut avoir perdu une part importante de son trafic au moment de la Panda Update pour une cause qui n'a rien à voir avec la qualité du contenu, ce qu'a confirmé Matt Cutts.
Le site avait déjà reçu un signal négatif, par exemple pour avoir placé des liens vers une ferme de lien et reçu un score négatif sans effet sur son trafic. L'effet survient le 11 avril quand ce score se voit combiné avec d'autres critères défavorables.
Les forums sont rarement affectés par Panda
La raison en est que l'on contenu à une grande diversité de sources. Des textes très différents selon les auteurs.
Panda n'est pas un changement de l'algorithme mais un programme différent
C'est un programme qui est lancé à intervalles réguliers et qui considère les sites sur un plan différent en essayant surtout de déterminer l'utilité des pages, leur intérêt pour l'utilisateur.
Il acquiert une expérience, ce qui fait que les sites peuvent être de plus en plus pénalisés avec chaque passage.
Panda a réduit le spam mais pas amélioré les résultats
Panda a effectivement supprimé une partie du spam, seulement une partie, car on voit toujours les premiers résultats occupés par des pages commerciales ne correspondant pas forcément à ce que l'on recherche. Par exemple la requête "logiciel gratuit" aboutit souvent à "logiciel payant avec version d'essai gratuite".
En général, les résultats n'ont pas été améliorés et il est toujours difficile de trouver ce que l'on cherche lorsque cela ne se réduit pas à quelques mots-clés.
Les mythes
Mythe: Un site est pénalisé parce qu'il affiche trop de publicités
Le nombre de publicités sur une page n'est pas pris en compte par l'algorithme du moteur de recherche. D'ailleurs le service Adsense de Google permet d'afficher 6 unités sur une même page.
Jamais Google ne pénalisera un site parce qu'il affiche trop de publicités... sauf que cela peut indirectement élever le taux de rebond ce qui est un facteur négatif. Matt Cutts a confirmé lors du PubCon 2011 que la publicité n'était pas un critère direct pour Panda.
Une page est pénalisée parce qu'elle a trop peu de contenu (peut-être une seule phrase) à coté d'un remplissage publicitaire presque exclusif. Il y a une différence entre 3 pubs qui couvrent 90% de la surface d'une page et 3 pubs qui couvrent 10% de sa surface.
Mythe: Panda est fait contre les fermes de contenu
Plusieurs besoins ont été combinés dans ce nouvel algorithme. Peut-être la firme est elle agacée par l'arrogance des entreprises comme Demand Media que l'on voyait trop souvent sur les média (et dont on n'entend plus parler depuis Panda), et la plaisanterie au sujet du yacht nommé Adsense, mais la mise à jour a un but plus général et à long terme.
Cela a touché 14% des sites en anglais, donc des millions de sites.
Il est probable que les fermes de contenu aient servi d'échantillonage car plusieurs version de Panda on été lancées jusqu'à ce qu'elle aient toutes été coulées.
Le futur des moteurs de recherche n'est pas compatible avec les pages sans contenu original. On peut s'attendre à ce que Google réduise les sources d'information, ou ne se substitue à elles.
Mythe: Panda sélectionne les pages de qualité
Ce mythe est volontairement entretenu par Google avec ses conseils sur les pages de qualités.
Les conseils sont bons à suivre, pour les utilisateurs, mais sont très loin de déterminer le positionnement.
Cela sera contredit par la première recherche que l'on fera sur le moteur de recherche. Panda tend à favoriser les sites dont le contenu est original, et à défavoriser les sites dont le contenu manque d'originalité, mais la notion de qualité reste à définir.
Un moyen est utilisé pour détecter l'originalité, un outil d'analyse semblable à Translate qui peut extraire l'information brute d'une page indépendamment de la formulation.
Puis un score est attribué au site, ce qui fait que des pages de qualités sur un site mal noté puissent être mal positionnées.
Mythe: Un compte Gmail peut faire pénaliser un site
Si l'on publie une lettre d'information par Gmail et si un nombre important de ceux qui y ont souscrit n'ouvrent pas les messages quand ils sont reçus ou font un spam report, le site émetteur de la lettre d'information reçoit une pénalité dit le webmaster de lockergnome.com.
Il a supprimé les abonnement et fait avec succès une requête en reconsidération.
Mais cela est formellement démenti par Matt Cutts: une requête en reconsidération ne se limite pas à ce que dit le webmaster, elle peut annuler un pénalité sans rapport.
Documentation
- Panda Update. Toutes les références.
- Dommages collatéraux sur le forum Google (anglais).
Cult Of Mac pandalisé parce que son site était copié, obtient l'entrée en liste blanche
| Tweet |
|
|
