Glossaire du langage des webmasters

Et plus spécialement du langage employé dans les rapports avec les moteurs de recherche.

Backlink
Lien d'un autre site sur le vôtre. On parle aussi de lien entrant ou lien retour. Voir l'article détaillé Tout ce qu'il faut savoir sur les backlinks.
Black hat
Manoeuvres prohibées pour améliorer la position d'un site, telles que les fermes de liens, pages satellites.
Blacklist
Liste noire, un site "blacklisté" n'est plus indexé du tout.
Cloaking
Cela consiste à présenter aux moteurs de recherche une page différente de celle que voient les visiteurs.
Cela est interdit et le site peut être supprimé de l'index des moteurs de recherche. Noter que présenter du HTML aux robots tandis que les visiteurs voient du Flash ou des images est considéré comme une astuce de cloaking: le HTML doit être vu par les visiteurs.
Le contenu de la partie noscript et celui du JavaScript doivent être le même.
Codes d'états HTTP
Lorsqu'une requête en lecture est faite sur une page d'un serveur, celui-ci retourne un code d'état HTTP. Les principaux code sont les suivants:
- 200: OK page trouvée et accessible.
- 301: page redirigée de façon permanente. Cela peut être fait avec une fonction PHP ou le fichier .htaccess.
- 302: page redirigée temporairement. (Ce mode de redirection est à éviter).
- 404: page non trouvée.
Doorway
Les pages doorway, ou pages satellites, sont des pages créées uniquement pour les robots et qui généralement contiennent des quantités de lien sur un site pour émuler une popularité qu'il n'a pas, ou des liens internes pour fabriquer des ancres. Elle conduisent à la désindexation du site.
La sitemap HTML n'est pas considérée comme doorway si sa conception la rend pratique pour les visiteurs.
Duplicate content
Il y a contenu dupliqué lorsque deux pages sont identiques sur un même site, lorsqu'un site reprend les pages d'un autre site, mais aussi, pour les robots des moteurs de recherche, lorsque deux URL différentes peuvent mener sur une même page. C'est notamment le cas lorsque l'on fait pointer deux noms de domaine sur un même site sans utiliser de redirection 301.
Le duplicate content pénalise un site de nombreuses façon comme le précise un billet sur le blog de Google.
GWT, Google Webmaster Tools
Panel fourni par Google pour obtenir des statistiques et interagir avec le moteur.
Hilltop
Extension théorique du PageRank, et destiné à combattre les manipulations algorithme qui qualifie une page uniquement en fonction de liens provenant de sites faisant autorité. Ce n'est pas forcément utilisé par les moteurs de recherche.
Lemmatisation?
Progrès pour les moteurs de recherche consistant à identifier la racine de mots et à rapprocher les mots entre la recherche et la page selon cette racine. Ne semble pas réellement encore implémenté en 2007.
Meta tag
Ou "méta balise", balise de description d'une page.
Mot-clé
Les mots-clés sont la base de la SEO car ils sont la base des recherches et donc du trafic. On peut choisir des mots-clés pour augmenter le trafic, ou le revenu. Dans le second cas ils doivent être en rapport avec des activités commerciales.
La densité de mots-clés est une mesure classique pour le référencement.
Moteur de recherche
Outil en ligne pour trouver une information ou un site sur le Web. (Ou moteur local).
PageRank ou ranking
Rang dans la hiérarchie Google, plus il est élevé, plus la page tend à se trouver en tête des réponses lors d'une recherche (mais d'autres critères, nombreux, sont pris en compte).
Voir PageRank.
ROI (Return In Investissement)
Combien vous rapport chaque euro investi.
Sandbox
Un site est dit envoyé dans le "bac à sable" de Google lorsque son page rank se voit attribuer un rang de 0. Il est toujours référencé, mais en fin de liste et donc vu par quasiment personne. Cet effet peut s'appliquer à toutes les recherches auxquelles le site répond, ou à un groupe de mots-clés en particulier.
Un site nouveau est aussi placé en sandbox pendant quelques temps pour contrer les spammeurs qui créent des sites à seule fin de manipuler les résultats des moteurs.
Satellite
Une page satellite est une page faite pour les moteurs de recherche. C'est une astuce pour inclure des quantités de liens vers un site parent.
Un plan de site HTML (avec des liens sur le même site) est valide pourvu qu'il soit visible par les visiteurs. Il est préférable de la subdiviser en catégories.
Search Engine
Voir moteur de recherche.
SERP (Search Engine Results Page)
Page de résultats d'un moteur de recherche en réponse à une requête.
SEO (Search Engine Optimisation)
Technique de conception des pages Web qui aident les moteurs de recherche à les indexer et améliorent leur position dans les résultats. Cela tient à l'architecture, les mots-clés, les liens, l'autorité.
Sitemap
Carte de site, concrètement, une liste d'url des pages qu'il faut référencer, et autres informations pour les robots.
Snippet
Nom donné par Google au texte descriptif sous le titre de page dans les résultats de recherche. Il peut provenir de la meta description, de Dmoz, ou du contenu de la page.
Spamming
Procédés utilisés pour manipuler les moteurs de recherche, donc privilégier son site sans égard au contenu, mais en tentant d'utiliser le mode de fonctionnement des robots de recherche. Par exemple, accumulation de mot-clés, texte caché (texte blanc sur fond blanc), pages de liens vers son site, etc.
Taux de rebond
C'est le pourcentage de visiteurs qui quittent le site sans consulter une seconde page.
Il doit être le plus bas possible car il mesure l'intérêt pour le contenu du site. Cependant en tant que critère de qualité il est discutable car les visiteurs qui sont amenés par les moteurs de recherche et qui recherchent la réponse précise à une question, s'ils la trouvent, n'ont pas de raison de consulter d'autres pages.
Url
Uniform Resource Locator, adresse d'un site comprenant le nom de domaine et le nom du fichier, exemple: ttp://www.scriptol.fr/index.php